摘要
本发明公开了基于深度强化学习的安全电力调度方法,属于电力调度领域,包括以下步骤:S1、采用马尔可夫决策过程根据对抗学习训练调度模型;S2、基于专家规则库交互式调优的方式训练主专家模型;S3、根据主专家模型优化调度模型输出最终的电力调度方案。基于 Rainbow DQN 算法,提出了两种新颖的训练方式,分别是以基于对抗学习的方式训练对抗模型和调度模型来进行安全约束保障学习,以基于专家规则库交互式调优的方式训练得到主专家模型。通过在虚拟仿真电网环境上进行的大量实验,本发明验证了提出的基于深度强化学习的安全电力调度算法的有效性,能够抵御一定程度的扰动和攻击,提高电力系统的高效和鲁棒的电力调度能力。