一种基于一云多芯异构算力平台的GPU算力调度方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于一云多芯异构算力平台的GPU算力调度方法
申请号:CN202510373465
申请日期:2025-03-27
公开号:CN120295785B
公开日期:2025-10-31
类型:发明专利
摘要
本发明提出了一种基于一种基于一云多芯异构算力平台的GPU算力调度方法,所述方法包括如下步骤:步骤S1:异构资源注册与建模,通过资源注册模块接入包含多类型GPU的硬件设备,采集设备型号、显存容量及性能指标数据,构建包含拓扑关系的资源特征数据库,支持芯片的混合接入;步骤S2:虚拟化资源重构,采用硬件抽象层技术将物理GPU池化为虚拟GPU资源,通过容器化技术实现显存隔离与计算单元划分,每个虚拟GPU实例配备独立的驱动栈和安全沙箱;步骤S3:多模态任务提交,接收用户提交的CUDA/OpenCL计算任务,解析任务需求参数,包括计算核心数、显存占用量及数据吞吐量阈值,生成包含优先级标签的任务描述符。
技术关键词
性能指标数据 多芯 异构 容器化技术 硬件抽象层 数据吞吐量 节点 资源特征 IOV技术 故障预测模型 负载均衡策略 采集设备 硬件设备 强化学习模型 平台 深度强化学习 掩码技术 配额管理 匈牙利算法