一种基于动态路由混合专家模型的多模态图文情感识别方法及系统
申请号:CN202510478044
申请日期:2025-04-16
公开号:CN120277613A
公开日期:2025-07-08
类型:发明专利
摘要
本发明公开了一种基于动态路由混合专家模型的多模态图文情感识别方法及系统,用于现有的多模态图文情感识别方法通常采用静态融合机制,导致模型识别效果不佳的技术问题。方法包括获取图像数据和文本数据,将图像数据和文本数据输入至预置多模态图文情感识别网络,预置多模态图文情感识别网络包括目标编码器、动态路由混合专家模型、情感分类器;通过目标编码器对图像数据和文本数据进行编码,输出图像全局特征和文本全局特征;对图像全局特征和文本全局特征进行多模态特征融合,生成图像文本融合特征;采用动态路由混合专家模型对图像文本融合特征进行动态专家计算,输出加权特征;将加权特征输入至情感分类器,生成目标多模态图文情感识别结果。
技术关键词
图像全局特征
情感识别方法
情感分类器
图文
加权特征
融合特征
多模态特征融合
图像嵌入
动态
训练文本数据
文本编码器
图像编码器
训练图像数据
降维特征
变换特征