基于增强探索回退裁剪强化学习的综合能源系统调度方法

申请号：CN202410949429

申请日期：2024-07-16

公开号：CN118485286B

公开日期：2024-10-11

类型：发明专利

摘要

本发明公开了基于增强探索回退裁剪强化学习的综合能源系统调度方法。该方法在深度强化学习算法的理论基础上，设计了新的动作选择策略，将Actor网络输出的高斯分布的概率最大值作为动作。在记忆库中的训练样本数量溢出时根据方差剔除偏离的样本。改进了传统PPO算法训练过程中使用的损失函数，包括裁剪函数、优势函数以及策略熵部分，有效提高抽样效率与策略更新稳定性，增强了探索能力，且加快了训练期间模型的收敛速度。将训练后的模型应用在综合能源系统优化调度上，指导综合能源系统中不同子系统的出力，能有效应对可再生能源出力和负荷的波动，并通过实验证明该方法显著提高了综合能源系统优化调度的经济性和低碳性。

技术关键词

综合能源系统深度强化学习算法网络代表光伏发电机组热电联产机组信息熵理论储能机组梯度下降法策略更新子系统记忆可再生能源燃气锅炉天然气电储能参数