基于需求预测和深度强化学习的多级库存控制方法及系统

申请号：CN202510831383

申请日期：2025-06-20

公开号：CN120893938A

公开日期：2025-11-04

类型：发明专利

摘要

本发明公开了基于需求预测和深度强化学习的多级库存控制方法及系统，首先，利用需求预测模型得到需求预测数据，并将其适应性转变为多产品、多仓库环境下的数据；基于马尔可夫决策过程建模，其中状态向量包含各仓库的库存水平、在途订单数量及过去需求值，动作向量为生产量和补货量，奖励函数以系统总成本的负值激励智能体降低成本；通过深度强化学习DRL算法求解库存控制决策，并与需求预测数据对比决策，考虑季节性波动因素调整安全库存量。本发明结合需求预测模型和DRL的优势，弥补了传统DRL在多产品、多仓库复杂条件下的决策不足，有效控制季节波动性大的产品库存，在两级库存控制系统中实现成本优化与市场波动应对的平衡。

技术关键词

库存控制方法深度强化学习需求预测模型连续动作空间库存控制系统决策仓库环境更新网络参数最小化系统数据生成轨迹订单策略周期定义时间段基线偏差