一种基于元强化学习的多机器人动态任务规划方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于元强化学习的多机器人动态任务规划方法
申请号:CN202410901603
申请日期:2024-07-05
公开号:CN118859952B
公开日期:2025-07-18
类型:发明专利
摘要
本发明公开了一种基于元强化学习的多机器人动态任务规划方法,涉及机器人系统任务调度领域,S1:建立多个具有代表性的任务规划场景的数学模型;S2:应用元强化学习方法,在步骤S1中建立的任务规划场景中进行预训练,得到通用的任务规划算法参数;S3:建立目标任务规划场景的数学模型;S4:应用深度强化学习方法,基于步骤S2中得到的算法参数进行微调,得到适合目标场景的最优任务规划方法。本发明设计了一种基于元强化学习的任务规划算法,在任务无法预先确定的动态任务规划场景中,能在较短时间内获得效率较高的任务规划方案,且在场景发生变化时,能在少次更新后达到与原先持平的性能水平,极大地提高了算法对动态环境的适应能力。
技术关键词
深度强化学习方法 机器人 深度强化学习模型 训练场景 规划算法 场景发生变化 数学模型 参数 动态 深度Q网络 深度神经网络 时间段 决策 矩阵
系统为您推荐了相关专利信息
神经网络模型 深度强化学习模型 训练样本集 策略 网络负载信息
充电对接系统 磁场传感器 充电装置 干扰电磁场 底座
深度生成模型 机器人 社交 媒体 注意力机制
清灰机器人 反应塔 悬挂机构 手柄螺丝 拉索
深度强化学习模型 任务调度 资源分配 启发式策略 启发式规则