摘要
本发明涉及空间机器人技术领域,特别是指一种基于强化学习的空间桁架多机器人协同装配方法及装置。所述方法包括:确定待装配的桁架单元;获取多个空间机械臂的状态信息,将状态信息输入到最优空间机械臂的策略模型,得到多个空间机械臂的运动决策控制指令;根据运动决策控制指令,控制多个空间机械臂对桁架单元进行装配,完成多机器人协同的桁架装配任务。本发明根据空间机械臂子系统的实时状态选择最优操作决策,并向多个机械臂发送运动控制指令进行定位、调整位姿,实现最大操作奖励值的获取,从而完成多个机械臂协同操作,有效解决空间桁架的机器人自主协同装配问题。