基于深度强化学习的货到人系统多AGV路径规划方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于深度强化学习的货到人系统多AGV路径规划方法
申请号:CN202510139194
申请日期:2025-02-08
公开号:CN120010487B
公开日期:2025-10-10
类型:发明专利
摘要
本发明涉及计算机领域的一种基于深度强化学习的货到人系统多AGV路径规划方法,融合改进A*全局引导与局部强化学习的双层规划架构,全局层采用非均匀惩罚启发式策略,通过Dijkstra算法计算的固定惩罚项和基于历史路径的实时动态惩罚项协同优化路径分散性;局部层设计异步近端策略优化(APPO)算法,结合LSTM网络处理连续5个时间步的多通道观测状态(静态障碍物、AGV位置、全局路径编码),输出5自由度动作策略。针对仓储可移动货架(Pod)区域设置固定惩罚豁免机制,避免无效避让,提高任务成功率和吞吐量,降低计算负载,为解决货到人系统多AGV路径规划问题提供了一种高效且可扩展的解决方案。
技术关键词
路径规划方法 深度强化学习 局部路径规划 Dijkstra算法 静态障碍物 栅格 AGV路径规划 动作策略 动态环境变化 集构造方法 可移动货架 强化学习框架 启发式策略 活动货架 编码器 网络 路径地图 启发式算法