基于自然语言对三维点云机器人引导的方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于自然语言对三维点云机器人引导的方法及系统
申请号:CN202510433791
申请日期:2025-04-08
公开号:CN119927932B
公开日期:2025-09-12
类型:发明专利
摘要
本发明公开了基于自然语言对三维点云机器人引导的方法及系统,基于Transformer架构的机器人,设置动作位置t,将所述动作位置t的视觉图像数据转换为三维点云以及标准化输入,并进行下采样,完成数据预处理;基于数据预处理,将生成的预处理数据的点云进行编码,提取点云的空间特征,生成视觉信息;并通过对自然语言指令进行向量嵌入,将自然语言指令表示成模型能够理解和处理的向量,生成文本信息;基于视觉信息和文本信息,通过注意力机制将生成的视觉信息和上下文信息融合;基于上下文信息的融合,通过预测热图和偏移量,预测动作位置步骤的三维位置,提高了机器人对复杂指令的理解和执行能力以及机器人未来动作预测的准确性。
技术关键词
自然语言 注意力机制 机器人 点云信息 文本 融合视觉 指令 采样方法 编码器 数据 工具包 动作模块 线性 物体 邻居 邻域