基于基座模型知识的机器人控制方法和装置

申请号：CN202510862713

申请日期：2025-06-25

公开号：CN120839773A

公开日期：2025-10-28

类型：发明专利

摘要

本发明提供一种基于基座模型知识的机器人控制方法和装置，涉及机器人控制技术领域，包括：将当前任务对应的文本提示词和视觉提示词输入多模态基座模型，得到多模态基座模型输出的虚拟视角；将多视角图像对应的三维点云投影到虚拟视角对应的图像平面，生成虚拟视角图像；将当前任务的语言指令和虚拟视角图像输入关键点预测模型，得到关键点预测模型输出的目标关键点的空间位置信息；基于目标关键点的空间位置信息，生成机器人的运动轨迹，并基于运动轨迹控制机器人执行当前任务。本发明提供的方法和装置，提高了机器人在三维操作任务中的感知效率和操作精度。

技术关键词

关键点机器人控制方法图像多模态特征融合运动轨迹控制基座多视角热力图融合特征点云文本相机非暂态计算机可读存储介质视觉机器人控制装置机器人控制技术令牌