一种大语言模型的任务调度方法、装置、设备及存储介质
申请号:CN202510253891
申请日期:2025-03-05
公开号:CN120407146A
公开日期:2025-08-01
类型:发明专利
摘要
本申请公开了一种大语言模型的任务调度方法、装置、设备及存储介质,所述方法包括对大语言模型中的待切分张量进行张量切分,以得到CC张量、CG张量和GG张量;调度CC张量、CG张量和GG张量各自对应的硬件资源协同工作,以控制大语言模型执行任务。本申请通过将张量切分为运用不同硬件资源的CC张量、CG张量和GG张量,然后通过各硬件资源协同工作,以充分利用可用计算、内存和通信资源,这样可以在保证大语言模型的推理准确性的情况下,提高小型计算系统的推理效率。
技术关键词
任务调度方法
大语言模型
硬件配置信息
分片
计算机可读程序
任务调度装置
内核
内存管理器
任务调度器
阶段
可读存储介质
处理器
终端设备
存储器
显卡
代表
资源