一种噪声环境下基于语音和面部表情的智能情感识别方法

申请号：CN202510575373

申请日期：2025-05-06

公开号：CN120510546A

公开日期：2025-08-19

类型：发明专利

摘要

本发明属于人工智能技术领域，具体涉及一种噪声环境下基于语音和面部表情的智能情感识别方法；该方法包括：获取待识别的视频并从中分离出图像序列和音频序列；将图像序列和音频序列输入到训练好的去噪模型中，得到去噪融合特征、去噪图像特征和去噪音频特征；拼接去噪融合特征、去噪图像特征和去噪音频特征，将拼接后的特征输入到神经网络中，得到情感识别结果；本发明能够充分利用面部表情信息和语音情感信息，提供准确的情绪识别功能，同时结合特征去噪方法，有效抑制真实场景中音频噪声和图像噪声对于情感识别的影响，显著提升模型在真实场景下的情感识别效果。

技术关键词

情感识别方法融合特征音频特征编码器结构无监督噪声图像面部无噪声序列语音特征融合网络解码器结构多模态特征去噪模型情绪识别功能

系统为您推荐了相关专利信息

一种面向自动驾驶的多模态三维目标检测方法和装置

融合图像特征图像增强点云特征区域建议网络输出特征

膀胱癌淋巴结转移预测方法、装置、设备及存储介质

注意力模型特征提取模型训练样本数据转移预测方法分类网络

一种基于大数据的农贸零售行业统计方法及系统

可见光图像统计方法高需求大数据销售额

一种模型训练方法、对象检测方法、装置、设备及介质

对象检测模型采样点图像感知特征样本

一种基于深度学习的航班数据聚类与分类方法

门控循环单元构建卷积神经网络分类方法注意力机制深度学习模型