摘要
本发明公开了一种基于DDPG的阵列式高空风力发电量最大化调度方法,包括步骤:模拟高空风力发电系统的运行环境,建立系统环境模型,定义状态空间和动作空间,设计奖励函数;构建双重网络架构和改进的深度确定性策略梯度算法对模型进行训练,得到最终的系统环境模型以应用于高空风电场进行风力发电量的智能调度;对模型进行训练的具体过程为:构建主网络和目标网络;主网络用于生成当前的策略和价值评估;目标网络用于通过软更新策略从主网络参数中复制;通过经验回放机制存储和利用历史数据,优化目标策略网络和目标价值网络;使用监控系统监测系统的工作状态和环境变化,持续优化模型参数。本发明显著提高了发电效率和系统稳定性。