摘要
本发明属于智能汽车技术领域,公开了一种考虑动作异步性的智能网联汽车高速公路合流决策方法,包括:S1.对智能网联汽车ICV和人类驾驶汽车HDV进行功能定义;S2.把混合交通下智能网联汽车高速公路合流决策表征为一个基于Stackelberg博弈的多智能体强化学习问题,设计考虑车辆动作异步性的时空序列马尔可夫决策过程;S3.构建Stackelberg博弈模型;S4.采用Actor‑Critic多智能体强化学习框架进行训练与评估。针对高速公路合流区车辆动作协同的异步性,本发明能有效提升智能网联汽车在混合交通下高速公路合流区的合流决策能力。