一种引入文本模态的语音情感识别方法及相关装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种引入文本模态的语音情感识别方法及相关装置
申请号:CN202410975728
申请日期:2024-07-19
公开号:CN119028378A
公开日期:2024-11-26
类型:发明专利
摘要
本发明公开了一种引入文本模态的语音情感识别方法及相关装置,对两个或两个以上模态的输入数据进行预处理和特征提取;然后送入引入文本模态的语音情感识别模型中,得到最终的情感预测结果;采用模态融合网络,并且利用图神经网络对文本显性情感语义信息进行特征提取,对于文本模态的利用效率更高,可以对多模态表示执行融合操作,通过引入文本辅助网络帮助主网络获取更多有效信息,减少噪声和有害信息的影响。
技术关键词
语音情感识别方法 语音情感识别模型 跨模态 注意力机制 编码模块 语音特征 语音情感识别系统 前馈神经网络 数据 文本编码器 特征提取器 音频 加权特征 划分方法 程序