摘要
本发明公开了一种用于机器人在栅格地图中自动路径规划方法,涉及基于深度强化学习的路径导航方法。该方法包括创建抽象栅格地图,设计奖励函数以及用于导航的智能体;之后智能体感知栅格地图的状态,作为状态信息输入初始决策网络,得到初始的决策数据,然后经由一个复杂系统计算输出平均磁矩作为补充数据,按照特定方式结合初始决策数据以及补充数据得到最终的决策数据;智能体按照赢者通吃策略利用最终决策数据进行动作选择以及执行;智能体获得奖励以及最新状态信息,利用经验回放池优化决策网络,最终得到当前栅格地图中的最优行动策略。该方法能够提高智能体在栅格地图中探索和利用的平衡,从而提高智能体路径寻优的效率。