摘要
本发明公开了一种基于DQN的供暖控制方法及系统,该方法包括:S1、通过传感器实时监测室外温度、供水温度和室内温度的状态信息;S2、构建供暖控制系统的MDP模型,MDP模型包括:状态空间、动作空间和奖励函数;状态空间包括:室外温度、供水温度和室内温度;动作空间选取供水温度的设定值作为控制动作;奖励函数用于供暖控制系统策略性能的定量评价;S3、根据构建的供暖控制系统的MDP模型,基于DQN算法神经网络获取供暖控制系统最优的控制策略;DQN算法神经网络包括:主网络和目标网络,本发明能够在最短的回合内通过调整供水温度使室内温度达到预设的目标温度,控制供暖系统以最佳的方式运行。