一种基于在线预测的DFPT多层次负载均衡方法及装置
申请号:CN202510603384
申请日期:2025-05-12
公开号:CN120540839A
公开日期:2025-08-26
类型:发明专利
摘要
一种基于在线预测的DFPT多层次负载均衡方法,应用于GPU集群,GPU集群用于DFPT模拟任务,方法包括:将DFPT模拟任务划分为多个逻辑批次,对每个逻辑批次的任务进行在线计算开销预测;基于预测得到的每个逻辑批次任务的开销,采用加权递归二分算法在GPU集群间分配各个逻辑批次任务,以使各GPU的总负载均衡;在每个GPU内部,基于最小堆动态调度线程块级任务分配,以确保GPU内部负载均衡,线程块用于执行分配到的逻辑批次任务。本方法能够实现更精细有效的负载均衡,大幅降低了最繁忙GPU与最空闲GPU之间的负载差异,从而缩短了并行计算的整体完工时间。
技术关键词
轻量级神经网络
逻辑
二分算法
负载均衡方法
集群
多层次
多层感知机
在线
负载均衡装置
矩阵
动态
模块
数据