摘要
本申请公开了一种基于深度学习与强化学习的自适应控制优化方法,涉及工业智能控制技术领域,本申请通过根据采集到的数据构建掩码矩阵,再通过将多尺度时序卷积层和图卷积网络与数据的掩码矩阵相结合,生成未来步数的预测值,据此构建时空融合深度学习模型,进而根据时空融合深度学习模型的预测值,构建状态向量,从而根据状态向量生成最佳控制策略,本申请通过将时空融合深度学习与强化学习的嵌入式协同,构建预测‑决策‑执行的全闭环工业控制架构,针对传感器数据部分缺失及多变量非线性耦合的复杂工业场景,在边缘控制器内实现推理‑控制一体化,实现了高精度、强鲁棒性的自适应控制优化。