一种有效的求解柔性车间调度的强化学习和图神经融合方法
申请号:CN202411516527
申请日期:2024-10-29
公开号:CN119476798B
公开日期:2025-12-02
类型:发明专利
摘要
本发明公开了一种有效的求解柔性车间调度的强化学习和图神经融合方法,包括以下步骤:将FJSP通过设置状态、动作、状态转换和奖励形式化为MDP,同时将调度过程描述为将就绪操作动态分配给兼容且空闲的机器;在调度过程中,将调度状态首先转化为异构图结构;采用异构图注意力网络进行两阶段嵌入,从异构图中提取作业和机器的特征嵌入;决策网络利用特征嵌入来生成动作概率分布,从中采样调度动作;使用近端策略优化算法进行深度强化学习模型的训练。与传统PDR和SOTA DRL方法相比,算法在两个具有不同分布的合成数据集上显著实现了高质量的解决方案,提高了性能和泛化能力。还表现出良好的泛化能力,因为模型在小规模实例上训练大规模或分布外的实例。
技术关键词
柔性车间调度
融合算法
深度强化学习模型
异构
节点特征
生成动作
多层感知器
网络
注意力
决策
策略
训练智能体
两阶段
投影特征
梯度方法
邻居
估计误差
矩阵