摘要
本发明属于无人履带车辆轨迹跟踪控制技术领域,具体涉及一种基于深度强化学习的履带车辆轨迹跟踪精度优化方法,包括:步骤一:根据履带车辆建立基于瞬时转向中心的运动学模型;步骤二:根据经验设置预测时域控制时域,对未来轨迹进行预测;步骤三:设计深度强化学习状态量和动作量;步骤四:设计深度强化学习Critic网络和Actor网络的结构;步骤五:对智能体进行训练;进行多轮迭代优化,直至达到理想的训练效果;步骤六:导出训练好的智能体进行在线运算,实时解算出需要的补偿输出值,与步骤二输出的控制量相加,作为底层执行系统的输入;至此,完成控制量的补偿,实现对轨迹跟踪控制的实时优化。该方法提升了履带车辆轨迹跟踪的精度。