摘要
一种基于自动人工引导的自动驾驶强化学习方法,涉及自动驾驶技术的强化学习方法领域。通过构建一个高效的人工指导框架和开发相应的自动人工引导算法来解决现有强化学习方法中的效率低下和模型准确性的问题,本发明的步骤是:建立复杂道路场景,以及大规模交通训练环境和密集交通测试环境;设置启动自动人工引导算法条件和自动人工引导动作;构建深度强化学习网络,建立自动人工引导A2C算法模型;循环仿真并训练动作概率模型,结束训练后在密集交通流测试环境中测试模型训练效果。本发明能够缩短强化学习的训练时间,减轻人类驾驶员在监控和操作自动驾驶车辆时的工作负担,训练具备人类驾驶风格特点的模型。