摘要
本发明涉及配电网调度方法技术领域,具体提供了基于历史数据的安全强化学习配电网优化调度方法,包括:采集配电网中的多个智能体在当前一段时间的运行时序数据,并进行预处理;计算每个智能体的松弛度指标,根据不同智能体的松弛度指标之间的相似度对智能体进行分类;选择松弛度指标与配电网系统当前的状态模式对应的一个智能体组作为策略智能体组;将策略智能体组中的智能体的运行时序数据输入基于历史数据的强化学习优化模型,输出各个智能体对应的调度策略;将多个调度策略对配电网设备进行协调调度。本发明提供的基于历史数据的安全强化学习配电网优化调度方法,能够降低配电网的强度学习方法复杂性,提高计算效率和学习效率。