摘要
本发明涉及流体输配与过程控制技术,旨在提供一种基于强化学习的流体输配管网泵阀联调控制方法。该方法包括:构建基于马尔可夫决策过程的泵阀控制模型,通过引入奖励函数实现三级时间尺度的安全保证;基于Actor‑Critic框架进行深度强化学习,在无需先验模型的条件下通过与流体输配管网的运行环境进行持续交互,使模型在线学习并持续训练至策略收敛;实时采集管网的状态变量并同时作为数字孪生系统和泵阀控制模型的输入,实现泵阀联调和协同控制。本发明能实现泵‑阀系统协同优化控制,避免单独控制带来耦合失调;支持在线学习与策略更新,具备适应动态负载变化能力;节能降耗效果显著,对模型不确定、扰动及延迟具有较强适应性。