摘要
本发明公开了一种基于多智能体深度强化学习的柔性排产方法,包括:S1、获取工厂生产相关数据进行预处理,构建多智能体车间状态矩阵,并归一化处理;S2、构建多智能体排产模型,初始化多智能体排产模型中的工件选择智能体和设备选择多智能体;初识化每个智能体的网络、动作空间、车间状态和算法参数,每个智能体的网络设置为卷积神经网络,并引入坐标注意力机制;初识化价值分解网络,价值分解网络被设置于每个智能体之后,将车间状态作为多智能排产模型的输入进行训练;S3、将车间状态输入柔性排产模型,获取排产结果指导生产计划的制定,并将排产结果以甘特图展示。其算法性能和应对能力强,具有很好的泛化能力,能够大大提升排产效率。