一种基于关系子图交互的多模态对话动态情感识别方法

申请号：CN202410807272

申请日期：2024-06-21

公开号：CN118820844A

公开日期：2024-10-22

类型：发明专利

摘要

本发明属于多模态情感识别和对话系统领域，涉及一种基于关系子图交互的多模态对话动态情感识别方法，包括：获取多模态对话数据集；将多模态对话数据集的数据输入模态特征提取器提取每个模态的特征，得到文本模态特征、听觉模态特征以及视觉模态特征；将听觉模态特征和视觉模态特征分别输入视听模态编码器，得到最终的听觉模态特征和视觉模态视觉特征；将文本模态特征输入关系子图交互模块，得到最终的文本模态特征；将最终的文本模态特征、听觉模态特征以及视觉模态特征均输入情感分类器，得到情感识别结果；本发明根据情感依赖关系将对话建模为说话者间情感依赖子图和说话者自身情感依赖子图，从而更好地捕捉和理解多元对话场景中的情感动态。

技术关键词

模态特征动态情感识别方法多模态对话节点听觉文本情感分类器编码器融合特征特征提取器关系多模态情感识别视觉特征视听更新模型参数序列对话系统数据