摘要
本发明公开一种基于概念瓶颈与可解释强化学习的建筑群能源管理方法。首先,获取建筑群的环境状态向量,在线概念生成模块采用随机铰链森林将环境状态向量转换为多个原子概念,计算原子概念的概念激活值,所有原子概念的概念激活值组成概念激活向量;然后,根据概念激活向量,可解释动作决策模块采用软决策树回归模型生成设备控制动作,代表储能电池充/放电功率、储冷罐蓄冷功率、热水储罐蓄热功率的调控指令;最后,将在线概念生成模块与可解释动作决策模块串联形成决策模型,将决策模型作为策略网络嵌入到软演员‑评论家强化学习框架中,对决策模型进行训练。该方法显著提升了模型决策过程的透明度与可解释性,提高了建筑群能源管理的控制水平。