基于深度强化学习的动态柔性作业车间多目标调度方法

申请号：CN202411904902

申请日期：2024-12-23

公开号：CN119721631A

公开日期：2025-03-28

类型：发明专利

摘要

本申请提供了一种基于深度强化学习的动态柔性作业车间多目标调度方法，包括以下步骤：将确定性调度问题转化为马尔科夫决策模型；基于马尔科夫决策模型，构建基于MOHDQN的确定性调度算法并设计训练过程，对算法进行训练，在随机算例上进行测试，形成确定性调度模型智能体；构建马尔科夫跳跃决策过程，并将事件驱动型预反应式调度问题转换为马尔科夫跳跃决策过程；基于HDRQN算法，构建训练过程，并与仿真环境交互训练事件驱动型预反应式调度智能体；将交互训练结果在随机算例上进行测试，形成事件驱动型预反应式调度智能体。本申请方法在求解精度和求解速度中实现最佳权衡，所提出的方法能够处理存在多种不确定性事件的复杂多目标调度问题。

技术关键词

柔性作业车间深度强化学习决策工件深度Q网络调度算法动态仿真环境计划门控循环单元负荷模块申请方法定义表达式参数比率变量

系统为您推荐了相关专利信息

一种基于边权特征的学习型物流车队路线优化方法及系统

路线优化方法物流顶点决策算法强化学习算法

一种基于强化学习的钢箱梁三维模型成本预测方法

三维模型强化学习模型深度强化学习算法深度Q学习可视化工具

深部矿井灾害大数据分析与防控决策系统

矿井系统深部矿井决策系统控制单元指数

基于动态感知与自适应调控的分布式实时目标检测追踪方法及系统

检测追踪方法分布式计算节点混合调度策略节点资源状态多模态特征融合

一种五轴数控机床的热误差补偿方法

五轴数控机床误差补偿方法热误差补偿刀具磨损监测误差补偿模型