摘要
本申请提供一种基于视觉的机器人装配方法、装置和设备。本申请提供的方法包括:初始化TD3模型和行为克隆模型;在初期训练TD3模型、TD3模型通过与仿真环境交互,随机探索并生成视觉图像对应的动作时,将视觉图像、动作、该动作的奖励值存入经验回放池;利用数据对训练行为克隆模型,得到训练好的行为克隆模型;在后期训练TD3模型时对TD3模型进行优化训练;在使用时,将相机当前采集到的当前视觉图像分别输入到训练好的TD3模型和行为克隆模型中,并根据第一权重、第二权重对第一动作和行为克隆模型输出的第二动作进行加权处理,得到加权动作;将插件插入到插孔内。本申请提供的基于视觉的机器人装配方法,用以确保将插件准确地插入插孔。