基于概念场景图与大模型融合的主动视觉感知方法与系统

申请号：CN202510801596

申请日期：2025-06-16

公开号：CN120932215A

公开日期：2025-11-11

类型：发明专利

摘要

本发明属于机器人感知领域，提供了一种基于概念场景图与大模型融合的主动视觉感知方法与系统。其中，方法包括基于设定场景的图像，提取其中的候选实体及其文本描述和空间关系；从用户指令中提取目标实体，计算目标实体文本描述与候选实体之间的视觉‑语言对齐匹配分数，以匹配分数最高的候选实体为主节点构建概念场景图；利用嵌入有三元提示工程的大模型对概念场景图进行处理，结合成功的历史任务策略代码，生成当前任务场景的策略代码，以使得机器人主动感知场景中的隐式信息，实现被遮挡且存在视觉混淆的目标实体的识别与抓取。

技术关键词

视觉感知方法实体场景概念文本属性匹配机器人预训练模型视觉感知系统图像策略模块关系处理器计算机设备节点可读存储介质指令存储器