摘要
本发明提供了一种基于元模仿学习的双臂机器人智能搬运方法。该方法包括以下步骤:首先,根据搬运难度进行分级,越光滑、越重的物体等级越高,搬运使用的力越大,由操作者操控双臂机器人执行搬运任务,获取示教数据集,对示教数据集进行预处理,合成专家数据集;其次,运用专家示教数据集进行最大熵逆强化学习训练奖励函数;再次,使用训练出来的奖励函数作为动作指导,采用MAML元强化学习方法,训练出一个泛化能力足够强的双臂搬运策略模型。本发明使双臂机器人可在保持一定效率的情况下,既能成功执行样本之内物块搬运,又能通过少量数据样本的适应,成功执行样本之外物体的搬运任务,相较于传统的双臂机器人搬运规划方法和一般的强化学习机器人搬运算法,提升了双臂机器人在搬运任务上的泛化能力并降低了训练成本。