一种用于铰接物体操纵的VLA大模型的构建方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种用于铰接物体操纵的VLA大模型的构建方法
申请号:CN202411969916
申请日期:2024-12-30
公开号:CN119785010B
公开日期:2025-10-17
类型:发明专利
摘要
一种用于铰接物体操纵的VLA大模型的构建方法,属于具身智能技术领域。方法如下:使用几何中心表示法描述铰接物体的Action Affordance;构建跟随铰接物体特征集的指令;将一个指令分解为六个不同的子任务特征集;设计训练VLA模型架构;构建几何思维规划器。本发明首几何中心表示方法来描述铰接物体,开发了几何思维规划器,促进了VLA大模型对环境的理解,增强了其对复杂任务的适应能力,使其能够处理多样化的场景和需求,使得VLA模型能够充分理解物体在不同情况下的行为和反应,从而在规划运动路径时做出更为合理的决策,提高路径规划的精度和可靠性。
技术关键词
物体 移动路径规划 旋转关节 受力 图像嵌入 顶点 答案 文本特征向量 图像特征向量 机械臂 编码负责 文本编码器 图像编码器 指令 评分算法 预训练模型