摘要
本申请涉及逆向供应链库存管理领域,公开了一种基于进化辅助多智能体强化学习的库存优化方法及系统,方法包括应用一经训练的进化辅助多智能体强化学习模型对供应链的实时运行数据进行处理,所述方法包括:获取供应链的实时运行数据,将所述供应链的实时运行数据输入至所述进化辅助多智能体强化学习模型进行处理,而后输出供应链库存最优策略。本申请通过进化辅助多智能体强化学习算法EAMARL结合多智能体强化学习算法MARL的在线适应能力和进化算法EA的全局搜索能力,使策略对逆向供应链中回收产品数量波动、定制订单需求不确定性及处理延迟等复杂动态具有更强的鲁棒性,显著提升库存管理效率。