摘要
本发明涉及机器人领域和信息技术领域,公开了一种基于扩散模型的视觉伺服方法、装置、设备及介质,方法包括:将预设工具图像、预设工具图像对应的预设示教图像和预设工具图像对应的真实期望图像组成一个训练样本;基于训练样本训练扩散模型;当总损失值小于预设值时,停止训练扩散模型,得到训练后的扩散模型;将当前工具图像的特征向量、当前示教图像的特征向量进行融合,得到第二融合向量,通过训练后的扩散模型中的解码器对第二融合向量进行处理,得到当前期望图像,将当前期望图像传输至机器人的视觉伺服系统,控制视觉伺服系统根据当前期望图像调整当前工具的位置和朝向。本发明能向机器人的视觉伺服系统提供当前期望图像。