摘要
本申请涉及一种任务调度方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。所述方法包括:获取待处理工作流,所述待处理工作流包括多个待处理任务;获取各所述待处理任务的第一状态数据;通过基于深度强化学习的预设任务调度模型,根据各所述第一状态数据,从各所述待处理任务中依次选取目标待处理任务,并为选中的所述目标待处理任务分配对应的目标服务器,其中,所述基于深度强化学习的预设任务调度模型,预先根据历史工作流的历史状态数据、历史调度动作数据和历史即时奖励值训练得到。采用本方法能够提高工作流任务调度效果。