动作指令序列生成方法、装置、设备及介质

申请号：CN202511051746

申请日期：2025-07-29

公开号：CN120929132A

公开日期：2025-11-11

类型：发明专利

摘要

本发明涉及人工智能技术领域，可应用于具身智能、金融科技及医疗健康等业务场景中，公开了一种动作指令序列生成方法、装置、设备及介质，包括：获取环境状态信息与多模态传感器数据，提取视觉特征向量与触觉特征向量，基于视觉特征向量与触觉特征向量生成注意力权重，融合视觉特征向量与触觉特征向量生成融合特征向量，构建包含环境状态信息与融合特征向量的强化学习模型状态空间，基于状态空间通过响应任务目标接近事件或障碍物碰撞事件的奖励函数生成动作指令序列。本发明通过多模态信息融合与强化学习状态空间构建的结合，提升了智能体在复杂环境中的感知能力与动作决策能力，显著增强任务执行的自主性、灵活性和稳定性。

技术关键词

指令序列生成方法强化学习模型环境状态信息多模态传感器障碍物指令序列生成装置注意力生成动作生成程序视觉特征数据触觉特征多模态信息融合抓取动作决策控制模块