一种基于策略复用的多智能体强化学习交通信号控制方法

申请号：CN202411129211

申请日期：2024-08-16

公开号：CN119107801A

公开日期：2024-12-10

类型：发明专利

摘要

本发明提供一种基于策略复用的多智能体强化学习交通信号控制方法，属于交通信号控制技术领域。通过步骤：构建智能体通用EDLight模型；基于现有TOD场景对通用路网模型进行训练,并存储已学习环境模型；计算未知TOD目标环境和预训练任务环境的相似度；基于所述相似度，选择相似环境的预训练模型来指导目标智能体模型进行决策，并基于概率采样更新目标域模型，实现自主决策。实现了为未知目标网络模型选择最优策略，从而实现了智能体强化学习模型能够在路网中和跨路网迁移。解决了现有模型对交通信号控制迁移能力不足的问题。

技术关键词

交通信号控制方法策略智能体模型编码器交通信号控制技术决策动态变化模型邻居特征信息融合解码器强化学习模型路口特征预训练模型交通信号灯预测特征周期场景注意力机制网络架构

系统为您推荐了相关专利信息

基于多模态信息的高精度分子性质预测方法及装置

分子信息传递机制性质预测方法序列多模态信息

一种基于大数据的企业数据服务平台

数据服务平台通信控制单元分布式网关大数据业务链

三维数字化车间管理系统及电子设备

模具数据处理单元展示单元数据获取单元三维模型

基于多因素动态定价机制的虚拟电厂低碳联合调度方法

联合调度方法动态定价策略热电联产机组燃气锅炉机组动态定价机制

铜片键合强度的声发射在线评估方法及其系统

在线评估方法铜片迁移学习神经网络声发射声波