摘要
本发明公开了一种基于搜索排序的电网拓扑优化方法,属于电网智能调度技术领域,该方法首先获取电网拓扑结构,采集影响电网拓扑结构的动作,构建原始动作空间,并对原始动作空间进行降维,得到降维后的动作空间;构建并使用双塔召回模型从降维后的动作空间中召回若干优质动作,作为候选动作,获得候选动作集合;构建并优化基于强化学习的排序模型,对候选动作进行打分排序,生成候选动作排序列表;选择候选动作排序列表中前K个候选动作依序进行模拟与评估,筛选并输出最优动作予以执行。本发明通过对动作空间的降维处理和智能筛选,能够集中资源于最有效、最关键的调控措施上,避免了无效或低效操作,实现了更高效的调度模拟和策略优化。