一种面向源网荷储协同多场景优化的强化学习方法及系统

申请号：CN202510613150

申请日期：2025-05-13

公开号：CN120494035A

公开日期：2025-08-15

类型：发明专利

摘要

本发明公开了一种面向源网荷储协同多场景优化的强化学习方法及系统，构建成本最小化的配电网优化模型，并将混合整数非线性问题转化为可求解的混合整数二阶锥优化问题；将混合整数二阶锥优化问题转化为强化学习决策模型，利用不同运行场景数据对边界条件参数进行多轮赋值，形成多场景训练任务集合；设计强化学习决策模型多场景训练损失函数，结合强化学习决策模型构建策略神经网络、评价网络神经网络以及场景表示嵌入神经网络，完成适应多场景优化的强化学习决策；基于多场景训练任务集合、多场景训练强化学习损失函数和神经网络结构，训练配电网多场景优化决策模型，并部署到实际系统，完成面向源网荷储协同多场景优化的强化学习决策模型应用。

技术关键词

多场景混合整数二阶锥优化强化学习方法强化学习系统时序特征决策储能荷电状态节点新能源机组强化学习策略推理网络定义充放电功率代表