摘要
本发明提出了一种基于一种基于一云多芯异构算力平台的GPU算力调度方法,所述方法包括如下步骤:步骤S1:异构资源注册与建模,通过资源注册模块接入包含多类型GPU的硬件设备,采集设备型号、显存容量及性能指标数据,构建包含拓扑关系的资源特征数据库,支持芯片的混合接入;步骤S2:虚拟化资源重构,采用硬件抽象层技术将物理GPU池化为虚拟GPU资源,通过容器化技术实现显存隔离与计算单元划分,每个虚拟GPU实例配备独立的驱动栈和安全沙箱;步骤S3:多模态任务提交,接收用户提交的CUDA/OpenCL计算任务,解析任务需求参数,包括计算核心数、显存占用量及数据吞吐量阈值,生成包含优先级标签的任务描述符。