面向XR设备的远程专家指导意图可视化方法、设备及装置
申请号:CN202510934248
申请日期:2025-07-08
公开号:CN120431273B
公开日期:2025-09-12
类型:发明专利
摘要
本申请公开了面向XR设备的远程专家指导意图可视化方法、设备及装置,方法包括:接收远程专家结合实时场景预览图像发出的多模态指令;将多模态指令及关联的场景预览图像输入至视觉语言模型中,生成结构化意图数据包,并基于结构化意图数据包,生成与结构化意图数据包中操作动作意图匹配的动态3D视觉指令;将3D视觉指令与现场用户的XR设备的实时画面进行空间锚定,并根据匹配结果确定3D视觉指令的渲染位置,以在XR设备的实时画面中渲染3D视觉指令。通过上述方法,使得专家能够以符合人类直觉的方式表达复杂操作意图,降低沟通歧义。
技术关键词
意图
可视化方法
视觉
指令
场景
多模态
图像
画面
局部特征描述子
文本
坐标
视频流
可视化设备
箭头
可视化装置
标记
动态
对象轮廓
核心