摘要
本发明实施例公开了一种批处理程序调度优化方法、装置、设备和存储介质。该方法包括:从批处理程序代码中提取任务间依赖关系和每个任务的资源需求信息,并生成用于表征任务依赖关系和资源需求的有向无环图;根据目标智能体,对有向无环图进行调度优化,获得目标调度策略,其中,目标智能体是通过强化学习算法在资源约束条件下最小化总运行时间所获得的;对目标调度策略进行资源约束、任务间依赖关系和运行性能的校验,以获得满足要求的目标调度策略。通过本发明实施例的技术方案,在资源限制下提供高效且可靠的调度策略,实现任务间依赖关系和资源约束的满足,并最小化总运行时间。