摘要
本发明提出了基于注意力和图增强文本的多模态情感分析方法及系统,属于多模态情感分析技术领域;方法包括:获取视频数据中的文本特征、图像特征和语音特征并进行预处理;采用自适应跨模态交互模块计算文本特征与图像特征和语音特征之间的注意力权重,获取增强后的文本特征;将增强后的文本特征输入到分层多模态图融合网络中,利用自注意力机制构建邻接矩阵;将邻接矩阵和增强后的文本特征输入到跳跃连接图卷积网络中,获取最终特征矩阵;将所述特征矩阵和邻接矩阵进行结合,利用编码器和分类器获取情感分析的预测结果。解决不同模态之间的上下文对齐方面的不足问题,更加全面和准确的进行情感极性预测。