摘要
本发明涉及一种深度强化学习引导的强适应性锂离子电池状态估计方法,属于电池状态估计技术领域,包括以下步骤:S1:选择二阶RC等效电路模型作为电池模型,考虑增广模型偏差,搭建PID控制器,实时估计电池荷电状态SOC;S2:构建双延迟深度确定性策略梯度深度强化学习算法和具有自适应约束的动态复合奖励函数;S3:将PID控制器与双延迟深度确定性策略梯度深度强化学习算法相结合,并进行模型训练,然后根据学习确定的最优策略自动调整PID控制器以匹配实时工况。该状态估计方法提高了估计精度、鲁棒性及自适应性。