摘要
本申请提供了一种基于深度强化学习的动态柔性作业车间多目标调度方法,包括以下步骤:将确定性调度问题转化为马尔科夫决策模型;基于马尔科夫决策模型,构建基于MOHDQN的确定性调度算法并设计训练过程,对算法进行训练,在随机算例上进行测试,形成确定性调度模型智能体;构建马尔科夫跳跃决策过程,并将事件驱动型预反应式调度问题转换为马尔科夫跳跃决策过程;基于HDRQN算法,构建训练过程,并与仿真环境交互训练事件驱动型预反应式调度智能体;将交互训练结果在随机算例上进行测试,形成事件驱动型预反应式调度智能体。本申请方法在求解精度和求解速度中实现最佳权衡,所提出的方法能够处理存在多种不确定性事件的复杂多目标调度问题。