摘要
本发明提出了基于多智能体强化学习的多资源柔性作业车间调度方法。本发明实现方法为:针对柔性作业车间中工件、AGV和机器的联合调度问题,以完工时间最小化为优化目标,建立多资源柔性作业车间调度模型;创建工件分配智能体解决工件分配问题;创建AGV调度智能体解决AGV选择问题;创建工序选择智能体解决机器工序选择问题;定义各类智能体的状态空间、动作空间以及奖励函数,使用DDQN方法分别对各智能体进行训练;在不同车间规模下验证所提方法的优越性。本发明旨在通过多智能体强化学习,实现多资源柔性作业车间调度策略的优化。