摘要
本申请公开了一种物流场景资源调度方法、系统、电子设备及存储介质,方法包括:获取预设作业信息;根据所述预设作业信息通过列约束生成算法预测得到期望作业位分配结果;根据所述期望作业位分配结果和预设装卸信息通过预设深度强化学习模型预测得到期望载具调度结果;其中,所述预设深度强化学习模型由深度Q网络算法和概率策略优化算法构建得到;当确定所述期望载具调度结果和所述期望作业位分配结果满足预设成本条件,根据所述期望载具调度结果和所述期望作业位分配结果确定目标调度分配结果。本申请实施例能够有效提高物流场景资源调度在复杂扰动场景下的系统稳定性与运行效率。本申请可以广泛应用于物流自动化与资源调度技术领域。