摘要
本发明公开的属于路径规划技术领域,具体为基于强化学习的动态路径规划优化方法,包括具体步骤如下:S1,环境感知:实时获取环境信息,包括智能体自身的位置、速度、方向,以及周围环境中的障碍物位置、动态物体的运动状态、目标位置信息;S2,环境预感知与动态预测:在环境感知收集到原始环境信息后,先对环境的未来变化趋势进行分析和预测,再将处理后的信息进行传递。本发明能够使智能体实时感知环境状态变化,智能体通过与环境不断交互,依据奖励信号调整策略,及时适应交通流量变化、道路临时管制等动态情况,如在城市交通中,能实时避开突发拥堵路段,重新规划最优路径,极大提升通行效率。