一种在混合交通流环境下基于混合深度强化学习的端到端车群协同决策方法

申请号：CN202411813468

申请日期：2024-12-11

公开号：CN119294437B

公开日期：2025-03-14

类型：发明专利

摘要

本发明涉及智能交通技术领域，且公开了一种在混合交通流环境下基于混合深度强化学习的端到端车群协同决策方法。该方法通过设计了一种针对复杂交通场景的图结构建模方法，从底层实现了交通参与者之间的通信机制，其次，本发明基于图卷积方法的时空编码器实现了对环境观测中时空信息的有效嵌入，为系统理解环境中的时空耦合信息实现了前提条件，最后，将actor‑critic架构与Q学习架构深度耦合，构建了一种新型的适用于混合动作空间的强化学习方法，基于该方法完成模型训练后，可通过保存与加载模型参数实现模型的部署，部署完成的模型可通过输入环境观测数据从而输出被控车群的协同决策。

技术关键词

连续型混合交通流深度强化学习模型决策方法策略网络图结构结构建模方法参数表达式广义强化学习方法智能交通技术笛卡尔坐标系编码器概率密度函数卷积方法掩码矩阵噪声