一种用于机器人控制的具有高效推理速度的VLA大模型构建方法
申请号:CN202511037686
申请日期:2025-07-28
公开号:CN120930484A
公开日期:2025-11-11
类型:发明专利
摘要
本发明公开了一种用于机器人控制的具有高效推理速度的VLA大模型构建方法,所述方法设计了一个名为具有高效推理速度的视觉语言动作模型ERMVLA的VLA模型,ERMVLA以几何中心数据为驱动基础,针对铰接物体操控特性进行专项设计,可基于当前场景精确规划机械臂末端运动轨迹。相较于传统方案,ERMVLA的核心突破在于实现感知层到运动控制层的全链路融合。通过ERMVLA生成的末端路径数据,机械臂可以借助样条插值指令完成真实环境中的运动,从而高效完成多样化操作任务。此外,模型特有的高效推理机制进一步提升了VLA框架的通用适配能力,使其在复杂操控场景中展现出显著优势。
技术关键词
模型构建方法
机器人控制
移动路径规划
接触点
物体
视觉特征
速度
运动
虚拟仿真环境
联合损失函数
机械臂
多层感知器
推理机制
文本
输出特征
自然语言
指令
序列
计算方法