摘要
本发明公开了一种配电网多时间尺度自适应控制方法及系统,包括:获取配电网初始状态信息,将配电网控制问题分解为日前规划层、小时级调度层和实时控制层;建立分层强化学习框架,分别对应日前规划层、小时级调度层和实时控制层;采用Actor‑Critic架构,根据当前状态生成动作并评估状态值;基于Actor‑Critic架构,引入经验回放和优先级采样机制,对经验样本进行存储和采样;采用参数迁移技术,进行预训练和微调操作,得到多层次控制策略。本发明实现多时间尺度的协调优化,各层次之间通过信息传递和目标分解实现协调,保证了整体控制策略的一致性和有效性。