一种多智能体强化学习驱动的梯级水电随机智能调度方法
申请号:CN202511449195
申请日期:2025-10-11
公开号:CN120931430A
公开日期:2025-11-11
类型:发明专利
摘要
本发明属于水电调度运行领域,涉及一种多智能体强化学习驱动的梯级水电随机智能调度方法。步骤包括:步骤一:采用蒙特卡洛前向模拟生成多组径流随机场景;步骤二:基于场景法构建以发电效益最大化为目标的两阶段随机优化模型;步骤三:梯级水电空间维度单智能体强化学习建模;步骤四:梯级水电单智能体求解在时间维度上分解出的两时段子问题;步骤五:提出梯级水电多智能体强化学习逐步优化算法MARL‑POA,部署具有不同策略的强化学习智能体协同优化调度;步骤六:随着可用信息的更新,获得滚动时域梯级水电调度方案。本发明进行了梯级水电优化的时空降维,有效降低计算规模,能够在径流预报不确定下快速动态制定可靠的梯级水电运行计划。
技术关键词
多智能体强化学习
智能调度方法
径流
场景
梯级水电调度
发电量
序列
梯级水电站
蒙特卡洛
Q学习算法
两阶段随机优化
策略
梯级水库调度
净水
强化学习模型
系数方法