摘要
本发明属于自动驾驶汽车技术领域,具体的说是一种基于强化学习的车辆轨迹跟踪控制器参数整定方法。包括以下步骤:步骤一、通过汽车和目标轨迹之间的运动学关系,结合泰勒级数展开线性化方法建立了汽车轨迹跟踪模型;步骤二、采用模型预测控制理论建立了考虑系统跟随精度、转向平顺性、执行器特性约束的汽车轨迹跟踪控制器;步骤三、将汽车轨迹跟踪控制器中的待标定参数建模为强化学习的智能体动作输出,应用双延迟深度确定性策略梯度技术进行最优虚拟标定。本发明实现了轨迹跟踪控制器的关键参数整定,有效地提升了轨迹跟踪控制器的跟踪精度,为车辆轨迹跟踪的参数标定工作提供一种有效的解决方案。