一种任务调度方法、装置、中心服务器及存储介质

申请号：CN202510682708

申请日期：2025-05-26

公开号：CN120704859A

公开日期：2025-09-26

类型：发明专利

摘要

本发明实施例提供了一种任务调度方法、装置、中心服务器及存储介质，涉及大语言模型技术领域。方法包括：获取待预填充文本单元的第一数目；计算目标处理结果的文本单元的预测数目与已生成文本单元的数目的差值，得到第二数目；从各执行服务器中确定备选执行服务器；针对每一备选执行服务器，基于第一数目和第二数目，预测该备选执行服务器所需的时长；基于各备选执行服务器所需的时长，从各备选执行服务器中确定目标执行服务器，并向目标执行服务器发送待处理文本，以使目标执行服务器基于大语言模型，使用目标执行服务器当前可用的目标资源对待处理文本进行处理，可以均衡使用服务器的计算资源和存读资源。

技术关键词

文本大语言模型任务调度方法阶段中心服务器资源解码任务调度装置通信接口可读存储介质存储器处理器数据迁移样本模块字符计算机编码