摘要
本发明涉及数据处理领域,尤其涉及一种基于多模态知识增强的长文本分类方法。内容包括:将提取的多模态数据划分为语义特征单元并进行特征提取、整合和投影,生成每种模态的统一特征表示;基于每种模态的语义特征单元的向量集合,进行模态内关联建模和模态间关联建模,得到模态内语义关联图和模态间关联矩阵,并对模态间关联矩阵进行优化;基于模态内语义关联图和优化后的模态间关联矩阵,计算模态的动态贡献度,并综合各模态的统一特征表示,生成综合特征;基于综合特征,预测长文本的类别标签。解决了传统的文本分类方法在处理多模态的长文本时,因语义理解不深、逻辑关联缺失、决策过程不透明而导致的分类准确率低、鲁棒性差的问题。