一种基于一云多芯异构算力平台的GPU算力调度方法

申请号：CN202510373465

申请日期：2025-03-27

公开号：CN120295785B

公开日期：2025-10-31

类型：发明专利

摘要

本发明提出了一种基于一种基于一云多芯异构算力平台的GPU算力调度方法，所述方法包括如下步骤：步骤S1：异构资源注册与建模，通过资源注册模块接入包含多类型GPU的硬件设备，采集设备型号、显存容量及性能指标数据，构建包含拓扑关系的资源特征数据库，支持芯片的混合接入；步骤S2：虚拟化资源重构，采用硬件抽象层技术将物理GPU池化为虚拟GPU资源，通过容器化技术实现显存隔离与计算单元划分，每个虚拟GPU实例配备独立的驱动栈和安全沙箱；步骤S3：多模态任务提交，接收用户提交的CUDA/OpenCL计算任务，解析任务需求参数，包括计算核心数、显存占用量及数据吞吐量阈值，生成包含优先级标签的任务描述符。

技术关键词

性能指标数据多芯异构容器化技术硬件抽象层数据吞吐量节点资源特征 IOV技术故障预测模型负载均衡策略采集设备硬件设备强化学习模型平台深度强化学习掩码技术配额管理匈牙利算法