一种在混合交通流环境下基于混合深度强化学习的端到端车群协同决策方法
申请号:CN202411813468
申请日期:2024-12-11
公开号:CN119294437B
公开日期:2025-03-14
类型:发明专利
摘要
本发明涉及智能交通技术领域,且公开了一种在混合交通流环境下基于混合深度强化学习的端到端车群协同决策方法。该方法通过设计了一种针对复杂交通场景的图结构建模方法,从底层实现了交通参与者之间的通信机制,其次,本发明基于图卷积方法的时空编码器实现了对环境观测中时空信息的有效嵌入,为系统理解环境中的时空耦合信息实现了前提条件,最后,将actor‑critic架构与Q学习架构深度耦合,构建了一种新型的适用于混合动作空间的强化学习方法,基于该方法完成模型训练后,可通过保存与加载模型参数实现模型的部署,部署完成的模型可通过输入环境观测数据从而输出被控车群的协同决策。
技术关键词
连续型
混合交通流
深度强化学习模型
决策方法
策略
网络图结构
结构建模方法
参数
表达式
广义
强化学习方法
智能交通技术
笛卡尔坐标系
编码器
概率密度函数
卷积方法
掩码矩阵
噪声