摘要
本发明涉及一种无人智能车路径规划方法和无人智能车,属于路径规划技术领域,其中,该方法包括:获取无人智能车在各个时间步的状态信息;状态信息包括位置信息以及无人智能车所处区域的交通拥塞信息;根据状态信息确定移动动作,以及确定无人智能车执行移动动作后的即时奖励;即时奖励包括交通拥塞负奖励;通过Q‑Learning算法根据即时奖励计算Q值;根据Q值学习路径规划策略;根据学习到的目标路径规划策略对待进行路径规划的目标无人智能车进行路径规划。通过本发明的目标路径规划策略进行路径规划时,能够结合实时的交通拥塞信息进行路径规划,避开交通拥塞热点区域,实现路网负载的均衡分布,提升路网整体的利用效率。