摘要
本发明实施例提供了一种任务调度方法、装置、中心服务器及存储介质,涉及大语言模型技术领域。方法包括:获取待预填充文本单元的第一数目;计算目标处理结果的文本单元的预测数目与已生成文本单元的数目的差值,得到第二数目;从各执行服务器中确定备选执行服务器;针对每一备选执行服务器,基于第一数目和第二数目,预测该备选执行服务器所需的时长;基于各备选执行服务器所需的时长,从各备选执行服务器中确定目标执行服务器,并向目标执行服务器发送待处理文本,以使目标执行服务器基于大语言模型,使用目标执行服务器当前可用的目标资源对待处理文本进行处理,可以均衡使用服务器的计算资源和存读资源。