一种基于多智能体近端策略优化算法和高效动作解码的可重构车间动态调度方法及系统

申请号：CN202410767734

申请日期：2024-06-14

公开号：CN118780416A

公开日期：2024-10-15

类型：发明专利

摘要

本发明属于生产调度相关技术领域，并公开了一种基于多智能体近端策略优化算法和高效动作解码的可重构车间动态调度方法及系统。离线训练阶段：构建高层工件排序智能体、制造单元分配智能体和底层工件排序智能体，通过智能体与车间交互获得历史调度数据，基于历史调度数据和多智能体近端策略优化算法对各个智能体进行训练，将训练好的各个智能体用于在线应用；在线应用阶段：对于待加工的订单，利用离线阶段训练获得的三个智能体与车间进行多次交互，直至完成订单中所有任务的加工。相较于常用的基于生产经验的调度规则，本发明通过深度强化学习模型提供合理决策，同时能够快速响应多种扰动事件，保障了车间的高效生产和运行稳定性。

技术关键词

动态调度方法高效动作车间工件订单决策重构解码策略基准算法深度强化学习模型离线动态调度系统阶段代表执行器在线数据资源