摘要
本发明涉及一种面向匝道汇入场景的自动驾驶分层决策控制方法,属于自动驾驶汽车技术领域,包括以下步骤:S1:构建具有交互性的高速公路平行式匝道汇入场景,使用二自由度运动学模型描述训练场景中车辆的运动,并利用基于规则的智能决策控制模型控制其他车辆,使环境具有交互性;S2:构建基于最大熵深度强化学习的决策模型;S3:构建基于多项式曲线的轨迹规划算法;S4:构建基于匝道场景的动作映射函数及路径跟踪控制模型,将车辆轨迹和动作转换为笛卡尔坐标系,通过PID算法跟踪轨迹以控制车辆运动;S5:训练所述基于最大熵深度强化学习的决策模型。本发明降低了强化学习整体训练难度,提高了自动驾驶汽车匝道汇入的稳定性和安全性。