摘要
本发明公开了一种基于改进深度强化学习的车辆路径跟踪控制方法。方法包括:建立4WIS‑4WID车辆的路径跟踪控制优化模型,然后将4WIS‑4WID车辆的四个车轮的当前动作输入中处理,并使用基于群智能协作经验回放机制的改进深度强化学习DRL控制器对模型进行训练,模型输出优化后的动作;将优化后的动作传递给车辆后进行四个车轮的动作控制,进而更新车辆的下一动作,重复步骤以实现车辆路径的实时跟踪控制。本发明方法能够自适应地调整样本的优先级,平衡探索与利用,提高样本利用效率,提高了深度强化学习算法的收敛速度和泛化能力。方法引入重要性采样校正,有效降低了优先级采样引入的偏差,提高了对4WIS‑4WID车辆路径跟踪控制的稳定性。