面向语音识别噪声场景下多模态情感分析方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
面向语音识别噪声场景下多模态情感分析方法及系统
申请号:CN202411116423
申请日期:2024-08-14
公开号:CN119067123A
公开日期:2024-12-03
类型:发明专利
摘要
本发明涉及面向语音识别噪声场景下多模态情感分析方法及系统,属自然语言处理领域。本发明通过多层次聚类方法,在模态内充分利用样本情感得分信息弥补文本模态在语音识别后损失的情感语义信息,之后在模态间根据不同样本的情感得分信息辅助对比学习进行跨模态情感信息的精炼,最后得到蕴含丰富情感语义的融合模态表示。本发明在包含语音识别噪声的真实世界数据集上进行了广泛实验,结果证明了本发明在面对语音识别噪声干扰时表现出更好的鲁棒性和泛化能力。
技术关键词
情感分析方法 语音 样本 文本 噪声 跨模态 场景 情感分析系统 标签 编码器 图像 视频 情感特征 多层感知机 聚类方法 语义 锚点 注意力机制