摘要
本发明实施例提供了一种空调控制方法、装置、电子设备和存储介质,包括:获取用户状态数据、环境数据和空调输出参数;基于所述用户状态数据和所述环境数据进行特征提取,确定用户隐性偏好特征;融合所述用户状态数据和所述用户隐性偏好特征,确定状态空间特征;基于所述空调输出参数,确定行为空间特征;对所述用户状态数据、所述行为空间特征和所述状态空间特征进行逆强化学习,确定奖励函数;结合所述行为空间特征、所述状态空间特征和所述奖励函数,确定空调控制参数;基于所述空调控制参数控制空调。通过本发明实施例可以实现用户个性化、精准舒适的温度控制。