基于多智能体强化学习的多资源柔性作业车间调度方法

申请号：CN202410735681

申请日期：2024-06-07

公开号：CN118761572A

公开日期：2024-10-11

类型：发明专利

摘要

本发明提出了基于多智能体强化学习的多资源柔性作业车间调度方法。本发明实现方法为：针对柔性作业车间中工件、AGV和机器的联合调度问题，以完工时间最小化为优化目标，建立多资源柔性作业车间调度模型；创建工件分配智能体解决工件分配问题；创建AGV调度智能体解决AGV选择问题；创建工序选择智能体解决机器工序选择问题；定义各类智能体的状态空间、动作空间以及奖励函数，使用DDQN方法分别对各智能体进行训练；在不同车间规模下验证所提方法的优越性。本发明旨在通过多智能体强化学习，实现多资源柔性作业车间调度策略的优化。

技术关键词

多智能体强化学习柔性作业车间调度工件资源启发式算法网络规模调度算法决策机器设备范畴参数策略因子定义车辆