摘要
本发明公开了一种基于强化学习的工厂设备预测性维护方案优化方法,涉及设备维护方案预测技术领域,包括,基于设备健康指数、设备运行时长和当前负载水平采用时空注意力机制进行融合,生成设备状态向量,构建强化学习框架,并在强化学习框架中嵌入多目标奖励函数,同时采用PPO算法进行优化,生成强化学习模型,使用设备状态向量训练强化学习模型,获取训练后的强化学习模型,将训练后的强化学习模型部署至实际工业控制单元中,实时接收最新设备状态向量,获取最佳维护策略。将最佳维护策略转化为具体的维护指令并执行。本发明通过工厂设备预测性维护方法,有助于快速响应突发情况,避免更大的损失,达到优化资源配置,增强企业竞争力。