摘要
本发明公开了一种微电网群能量管理方法及系统,属于微电网能量管理技术领域,构建以成本最小化为目标的微电网群储能系统能量管理模型;构建用于低估偏差的演员评论家双Q学习模型,通过获得具有优先级排序的小批量样本集合对该学习模型进行训练,通过引入三重批判机制对演员评论家双Q学习模型中的双Q学习存在的低估偏差进行修正,获取更新后的策略网络的目标值,确定最优的动作、状态和奖励值,通过确定微电网群的行动函数、状态函数和奖励函数对成本进行优化,获取成本最小时对应的微电网群储能系统的最优能量调度决策。该方法能够减少估计偏差,提高了算法的收敛精度。