一种噪声环境下基于语音和面部表情的智能情感识别方法
申请号:CN202510575373
申请日期:2025-05-06
公开号:CN120510546A
公开日期:2025-08-19
类型:发明专利
摘要
本发明属于人工智能技术领域,具体涉及一种噪声环境下基于语音和面部表情的智能情感识别方法;该方法包括:获取待识别的视频并从中分离出图像序列和音频序列;将图像序列和音频序列输入到训练好的去噪模型中,得到去噪融合特征、去噪图像特征和去噪音频特征;拼接去噪融合特征、去噪图像特征和去噪音频特征,将拼接后的特征输入到神经网络中,得到情感识别结果;本发明能够充分利用面部表情信息和语音情感信息,提供准确的情绪识别功能,同时结合特征去噪方法,有效抑制真实场景中音频噪声和图像噪声对于情感识别的影响,显著提升模型在真实场景下的情感识别效果。
技术关键词
情感识别方法
融合特征
音频特征
编码器结构
无监督
噪声图像
面部
无噪声
序列
语音
特征融合网络
解码器结构
多模态特征
去噪模型
情绪识别功能