摘要
本发明提供基于强化学习的机器人自主任务规划与执行控制方法,属于机器人控制领域。该方法包括:根据机器人搭载的传感器模块,采集多源数据,并对所述多源数据预处理,生成实体状态原始数据集;利用数字孪生模型,进行动态映射与损耗参数校准,生成虚拟实体状态匹配数据集;利用预设的强化学习策略预演机制,进行策略训练,生成候选策略集;利用预设的策略筛选机制,确定最优执行策略,并驱动机器人执行所述最优执行策略,以实现机器人自主任务规划与执行。本发明可降低机器人机械损耗,减少因过度磨损导致的停机维护次数,提升生产效率,虚拟预演策略的实体执行准确率提升,减少策略重新训练的样本需求量,缩短新场景下的策略适配周期。