摘要
本申请公开了一种基于光伏发电的能源管控方法及装置,涉及能源管理和智能控制领域,该方法包括获取待管控系统的当前的环境状态和历史的环境状态;构建PPO算法模型;PPO算法模型包括决策网络和评价网络;所述决策网络基于环境状态输出下一时刻的控制动作;所述评价网络基于奖励函数对下一时刻的控制动作进行评价;所述奖励函数基于环境舒适度、能源消耗以及光照强度进行构建;根据历史的环境状态,不断迭代优化PPO算法模型,得到训练好的PPO算法模型;根据当前的环境状态,采用训练好的PPO算法模型进行待管控系统的能源管控。本申请能够在光伏发电资源有限的情况下,实现高效的能源调度和环境舒适度保障。