摘要
本发明涉及一种智能汽车测试场景生成方法,特别涉及一种基于强化学习的智能汽车雨雾测试场景生成方法,步骤包括:测试场景建模、引入价值函数、设置奖励函数、扩散正余弦Q学习。本发明引入连续风险势场奖励重塑方法描述智能汽车在雨雾环境中的连续奖励过程;设计衰减贪心策略提高场景生成方向的随机性;并通过使用正余弦算法对Q‑learning进行初始化,同时增加扩张正余弦算法过程作为逆向课程生成,扩散正余弦Q学习算法在不增加SCA迭代总次数的条件下,通过调整各SCA模块参数使其关注范围逐步扩张并更新Q值作为强化学习的逆向课程,进一步加速测试场景生成算法整体的迭代收敛速度。