摘要
本发明公开一种基于元强化学习的家庭微电网能量优化控制方法,在无建筑热动力模型和保证用户舒适度需求的情况下,研究含可再生能源资源消纳的需求响应与交流最优潮流的联合协调问题,包括:首先,将家庭微电网运行成本最小化问题建模为马尔可夫决策过程;其次,构建集成Normalizing Flow的Soft Actor Critic算法;再次,在所构建的算法训练中加入元学习的方法。本发明的优点是可以在保证用户的舒适度需求的前提下具有更大的运行成本节省潜力,而且可以快速适应不同的家庭微电网拓扑结构,快速适应新任务。