一种基于扩散模型的视觉伺服方法、装置、设备及介质

申请号：CN202510144471

申请日期：2025-02-10

公开号：CN120147587A

公开日期：2025-06-13

类型：发明专利

摘要

本发明涉及机器人领域和信息技术领域，公开了一种基于扩散模型的视觉伺服方法、装置、设备及介质，方法包括：将预设工具图像、预设工具图像对应的预设示教图像和预设工具图像对应的真实期望图像组成一个训练样本；基于训练样本训练扩散模型；当总损失值小于预设值时，停止训练扩散模型，得到训练后的扩散模型；将当前工具图像的特征向量、当前示教图像的特征向量进行融合，得到第二融合向量，通过训练后的扩散模型中的解码器对第二融合向量进行处理，得到当前期望图像，将当前期望图像传输至机器人的视觉伺服系统，控制视觉伺服系统根据当前期望图像调整当前工具的位置和朝向。本发明能向机器人的视觉伺服系统提供当前期望图像。

技术关键词

视觉伺服系统视觉伺服方法图像解码器机器人编码器视觉伺服装置注意力机制可读存储介质处理器计算机设备存储器控制模块参数指令误差