摘要
本申请公开了一种控制策略的确定方法和装置、存储介质及电子装置,涉及智慧家庭技术领域,包括:根据目标区域的每个家电设备的状态数据、目标对象对每个家电设备的操作数据和目标区域的环境数据构建目标区域的多个家电设备的状态空间;构建多个家电设备对应的动作空间;根据目标算法确定每个家电设备在状态空间中的第一状态执行动作空间中的每个动作的第一动作价值,并根据多个第一动作价值更新策略模型的模型参数;根据更新模型参数后的策略模型确定对每个家电设备对应的初步控制策略,并将每个初步控制策略发送至每个家电设备,以使每个家电设备根据初步控制策略和每个家电设备的实时状态数据确定每个家电设备对应的目标控制策略。