基于多模态协同优化的决策方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于多模态协同优化的决策方法、装置、设备及介质
申请号:CN202510918105
申请日期:2025-07-03
公开号:CN120822176A
公开日期:2025-10-21
类型:发明专利
摘要
本发明涉及人工智能技术领域,可应用于机器人智能体决策、金融科技及医疗健康等业务场景中,公开了一种基于多模态协同优化的决策方法、装置、设备及介质,包括:获取视觉、文本、声音和触觉数据,并通过图像编码器、文本编码器、听觉编码器和触觉编码器生成相应特征。通过正负样本图像对和文本对优化视觉和文本编码特征,基于跨模态相似度分配融合权重,并应用权重加权处理各模态特征,生成协同决策特征,最终通过动作解码器生成动作决策组。本发明通过融合多模态感知信息优化决策特征生成方式,提升执行精度和可靠性。跨模态相似度优化与合理权重分配,提升了复杂环境下任务执行的精确性与高效性。
技术关键词
多模态协同 跨模态 编码特征 视觉特征 决策方法 文本编码器 图像编码器 样本 生成动作 触觉特征 文本特征向量 听觉 解码器 数据 标识符
系统为您推荐了相关专利信息
点云分类方法 噪声数据 多模态 图像增强 跨模态
文本检索方法 图像块特征 跨模态 注意力 多模态
干预方法 多模型 训练样本集 语音生成模型 对话生成模型
图像特征向量 数据融合分类方法 文本特征向量 前馈神经网络 子模块
情感分析装置 情感分析方法 文本 融合特征 融合策略