一种基于动态路由混合专家模型的多模态图文情感识别方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于动态路由混合专家模型的多模态图文情感识别方法及系统
申请号:CN202510478044
申请日期:2025-04-16
公开号:CN120277613A
公开日期:2025-07-08
类型:发明专利
摘要
本发明公开了一种基于动态路由混合专家模型的多模态图文情感识别方法及系统,用于现有的多模态图文情感识别方法通常采用静态融合机制,导致模型识别效果不佳的技术问题。方法包括获取图像数据和文本数据,将图像数据和文本数据输入至预置多模态图文情感识别网络,预置多模态图文情感识别网络包括目标编码器、动态路由混合专家模型、情感分类器;通过目标编码器对图像数据和文本数据进行编码,输出图像全局特征和文本全局特征;对图像全局特征和文本全局特征进行多模态特征融合,生成图像文本融合特征;采用动态路由混合专家模型对图像文本融合特征进行动态专家计算,输出加权特征;将加权特征输入至情感分类器,生成目标多模态图文情感识别结果。
技术关键词
图像全局特征 情感识别方法 情感分类器 图文 加权特征 融合特征 多模态特征融合 图像嵌入 动态 训练文本数据 文本编码器 图像编码器 训练图像数据 降维特征 变换特征
系统为您推荐了相关专利信息
YOLO算法 人类情感识别方法 深度学习模型 表情特征提取 图像
模型训练方法 分类器 意图 无人机 智能模型
凭证 基准特征 视觉特征 图像比对模型 跨模态
语音情感识别方法 语音情感识别模型 跨模态 注意力机制 编码模块
路面附着系数 识别方法 注意力机制 图像分类模型 加权特征