一种面向异构GPU集群的多维需求偏差感知资源分配与任务调度优化方法及系统
申请号:CN202510609519
申请日期:2025-05-13
公开号:CN120492120A
公开日期:2025-08-15
类型:发明专利
摘要
本申请提供了一种面向异构GPU集群的多维需求偏差感知资源分配与任务调度优化方法及系统。该方法依据系统当前排队任务数量、运行任务数量以及任务到达率,基于Little定理估算系统的平均响应时间。当系统响应时间超过该用户设置的最晚服务时延时,系统将自动触发最低资源需求感知与平衡多维需求偏差的调度分配流程,基于优先适配和有序偏差的调度原则,通过启发式算法求解最优的异构资源配置方案。根据这一配置方案,实现资源分配与任务调度优化。该方法的核心优势在于考虑不同任务在异构GPU上的性能差异,实现任务需求与硬件资源之间的最佳匹配。该方法在资源受限的情况下有效提高了任务的成功执行率。
技术关键词
任务调度优化方法
资源分配
优先级调度算法
共享GPU资源
时延
偏差
计算机执行指令
矩阵
计算机程序指令
异构
系统响应时间
集群
队列
多任务
启发式算法
可读存储介质
估算系统
指标