摘要
本发明公开了一种可再生能源电力系统的调度决策获取方法和装置,属于电力系统控制技术领域,所述方法包括:通过将所述约束马尔可夫过程嵌套进拉格朗日‑深度确定性策略梯度算法框架内;进一步地,将初始决策网络在所述拉格朗日‑深度确定性策略梯度算法框架下进行强化学习训练;利用神经网络强大的拟合能力学习含有不确定性信息的系统状态与实际决策之间的隐式联系,最后将所述可再生能源电力系统对应的约束马尔可夫过程中当前系统状态输入所述目标决策网络得到实际调度决策。本申请考虑了电力系统调度状态转移过程中的约束,实现了智能体在决策时同时保证动作经济性和安全性的目的以及调度计划的高效求解。