一种基于扩散模型的视觉伺服方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于扩散模型的视觉伺服方法、装置、设备及介质
申请号:CN202510144471
申请日期:2025-02-10
公开号:CN120147587A
公开日期:2025-06-13
类型:发明专利
摘要
本发明涉及机器人领域和信息技术领域,公开了一种基于扩散模型的视觉伺服方法、装置、设备及介质,方法包括:将预设工具图像、预设工具图像对应的预设示教图像和预设工具图像对应的真实期望图像组成一个训练样本;基于训练样本训练扩散模型;当总损失值小于预设值时,停止训练扩散模型,得到训练后的扩散模型;将当前工具图像的特征向量、当前示教图像的特征向量进行融合,得到第二融合向量,通过训练后的扩散模型中的解码器对第二融合向量进行处理,得到当前期望图像,将当前期望图像传输至机器人的视觉伺服系统,控制视觉伺服系统根据当前期望图像调整当前工具的位置和朝向。本发明能向机器人的视觉伺服系统提供当前期望图像。
技术关键词
视觉伺服系统 视觉伺服方法 图像 解码器 机器人 编码器 视觉伺服装置 注意力机制 可读存储介质 处理器 计算机设备 存储器 控制模块 参数 指令 误差