摘要
本发明属于电力系统优化调度技术领域,提供了一种源网荷储智能协同优化方法,在源网荷储四端分别部署传感器,利用云端数据中心实时收集,通过PTP协议将四端数据时序一致,根据参数和数据构建拓扑图,在数字孪生环境中选取模型进行仿真;划分源网荷储四端独立智能体,设置观测数据、执行空间、激励反馈,由经济性、稳定性、环保性构成激励项,交互循环实际数据和预测指令与激励值,记录成序列输入策略网络,计算输出对数概率梯度更新策略网络参数;智能体按策略网络完成交互循环,生成本地调度指令,聚合指令进行加权计算,生成全局调度方案下发至执行设备,利用偏差向量计算的平均偏差更新参数,重新求解全局调度方案并下发,形成闭环机制。