摘要
本发明公开了一种城市轨道交通供电控制系统及方法,包括如下步骤:S1、采集轨道交通供电系统的运行数据,并进行预处理;S2、构建改进的MuZero强化学习模型,通过蒙特卡洛树搜索优化轨道交通供电控制策略;S3、采用博弈论建模轨道交通供电资源分配过程,通过求解纳什均衡计算最优供电资源分配;S4、基于轨道交通供电控制策略和最优供电资源分配,调整轨道交通供电系统的供电控制调度;S5、利用改进的MuZero强化学习模型进行轨道交通供电控制策略的更新,并优化供电资源分配。本发明采用改进的MuZero强化学习与博弈论方法,优化轨道交通供电控制调度,实现供电分配均衡、能量回收高效和系统智能自适应调整的优点。