摘要
本发明提供了一种多模态方面级情感分析方法及系统,所述方法包括:获取多模态数据集,使用文本预训练模型得到文本的特征表示,使用目标检测模型得到区域图片的特征表示,通过Transformer模型获取图片的区域级视觉特征;通过跨模态Transformer层对文本特征与区域级视觉特征之间的交互进行建模,生成视觉过滤矩阵以去除视觉噪声。通过跨模态注意力机制,将区域级视觉特征与最相关的文本信息进行对齐,利用自适应门控机制融合有效的区域单词对;基于图片文本关系对特征进行筛选与过滤,通过输出层实现情感分类。本发明充分考虑语境对情感分析的影响,通过深度过滤和融合特征,有效去除冗余,准确识别不同语境下的情感倾向。