摘要
本发明提供了一种月面微小机器人运动的智能决策方法及装置,涉及强化学习技术,其中方法包括:获取月面微小机器人拍摄的当前图像和满足拍摄要求的目标图像;将当前图像和目标图像输入训练好的智能决策模型中,输出得到使机器人移动到拍摄与目标图像最相似的图像的位置的动作决策;其中,智能决策模型是通过训练样本集对预设的动作决策网络训练得到的,训练样本集包括训练目标图像和训练初始图像,训练目标图像是机器人在任意第一位置对待拍摄目标拍摄得到的,训练初始图像是机器人在以第一位置为圆心的圆形区域内任意第二位置拍摄得到的。本方案能够用于计算资源严重受限的星载计算环境中,使月面微小机器人可以自动做出决策。