一种基于元强化学习的多机器人动态任务规划方法

申请号：CN202410901603

申请日期：2024-07-05

公开号：CN118859952B

公开日期：2025-07-18

类型：发明专利

摘要

本发明公开了一种基于元强化学习的多机器人动态任务规划方法，涉及机器人系统任务调度领域，S1：建立多个具有代表性的任务规划场景的数学模型；S2：应用元强化学习方法，在步骤S1中建立的任务规划场景中进行预训练，得到通用的任务规划算法参数；S3：建立目标任务规划场景的数学模型；S4：应用深度强化学习方法，基于步骤S2中得到的算法参数进行微调，得到适合目标场景的最优任务规划方法。本发明设计了一种基于元强化学习的任务规划算法，在任务无法预先确定的动态任务规划场景中，能在较短时间内获得效率较高的任务规划方案，且在场景发生变化时，能在少次更新后达到与原先持平的性能水平，极大地提高了算法对动态环境的适应能力。

技术关键词

深度强化学习方法机器人深度强化学习模型训练场景规划算法场景发生变化数学模型参数动态深度Q网络深度神经网络时间段决策矩阵

系统为您推荐了相关专利信息

深度学习及拓扑分析的网络拓扑智能生成方法及系统

神经网络模型深度强化学习模型训练样本集策略网络负载信息

充电装置及充电对接系统

充电对接系统磁场传感器充电装置干扰电磁场底座

一种社交媒体机器人的检测方法及系统

深度生成模型机器人社交媒体注意力机制

一种方便调控的反应塔清灰机器人

清灰机器人反应塔悬挂机构手柄螺丝拉索

一种基于混合启发式深度强化学习的众测资源调度方法

深度强化学习模型任务调度资源分配启发式策略启发式规则