摘要
本申请公开了基于强化学习的配电网电压控制方法、装置及设备,方法包括:依据马尔科夫决策理论构建基于配电网电压控制的序列决策数学模型,序列决策数学模型包括状态空间、动作空间和奖励函数;根据配电网的电压运行约束条件配置满足预置条件的控制屏障函数;基于预设神经网络对历史屏障函数补偿器进行叠加估计操作,得到控制屏障函数补偿器;通过控制屏障函数和控制屏障函数补偿器对序列决策数学模型进行基于真实配电网环境的在线训练,得到目标电压控制器;依据目标电压控制器生成的电压调控指令控制目标调压设备。能解决现有强化学习模型易违反系统安全约束、计算参数复杂且泛化能力较弱,导致电压控制缺乏准确性、可靠性和实时性的技术问题。