摘要
本发明公开了基于智能化控制的设备电池消耗优化管理方法,涉及电池消耗优化技术领域,包括:以模块化电源域为基底,基于多智能体建立强化学习模型;划分时间步长,在每一时间步下,分别获取模块化电源域的状态数据,进行动作决策;设计奖励函数;通过模块化电源域的状态数据、动作决策和奖励函数获得对应的动作决策价值,重复迭代若干个时间步后,构建全局价值网络与全局策略网络;对所述智能体进行实时更新,并通过全局策略网络动态调整不同模块化电源域的状态。本发明通过将不同模块化电源域建模为多个智能体,引入多智能体强化学习框架,解决了传统方法中模块间缺乏协调、优化目标分散的问题,提升整体能效。