摘要
本发明属于垃圾渗滤液处理控制应用技术领域,尤其涉及一种基于协同控制的垃圾渗滤液处理控制方法。通过改进PID联合滤波器和强化学习中的Actor‑Critic结构组建协同控制,提高算法的策略学习效率和控制系统的稳定性,各协同控制的输出分别作为耦合对象和灰色预测辅助控制器的输入,进而构建四个反馈控制,得到满足非线性、时变的高效率的垃圾渗滤液处理控制。改进PID引入非线性变化函数,控制器的增益参数随控制误差而变化,提高了算法的适应能力。强化学习值函数考虑优势学习,减小非最优动作对应的Q值估计来拉开最优动作状态值和非最优状态值的差距。