一种噪声环境下基于语音和面部表情的智能情感识别方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种噪声环境下基于语音和面部表情的智能情感识别方法
申请号:CN202510575373
申请日期:2025-05-06
公开号:CN120510546A
公开日期:2025-08-19
类型:发明专利
摘要
本发明属于人工智能技术领域,具体涉及一种噪声环境下基于语音和面部表情的智能情感识别方法;该方法包括:获取待识别的视频并从中分离出图像序列和音频序列;将图像序列和音频序列输入到训练好的去噪模型中,得到去噪融合特征、去噪图像特征和去噪音频特征;拼接去噪融合特征、去噪图像特征和去噪音频特征,将拼接后的特征输入到神经网络中,得到情感识别结果;本发明能够充分利用面部表情信息和语音情感信息,提供准确的情绪识别功能,同时结合特征去噪方法,有效抑制真实场景中音频噪声和图像噪声对于情感识别的影响,显著提升模型在真实场景下的情感识别效果。
技术关键词
情感识别方法 融合特征 音频特征 编码器结构 无监督 噪声图像 面部 无噪声 序列 语音 特征融合网络 解码器结构 多模态特征 去噪模型 情绪识别功能
系统为您推荐了相关专利信息
融合图像特征 图像增强 点云特征 区域建议网络 输出特征
注意力模型 特征提取模型 训练样本数据 转移预测方法 分类网络
可见光图像 统计方法 高需求 大数据 销售额
对象检测模型 采样点 图像 感知特征 样本
门控循环单元 构建卷积神经网络 分类方法 注意力机制 深度学习模型