一种基于Kubernetes的GPU任务执行方法、装置、设备及介质
申请号:CN202510875243
申请日期:2025-06-27
公开号:CN120723458A
公开日期:2025-09-30
类型:发明专利
摘要
本申请公开了一种基于Kubernetes的GPU任务执行方法、装置、设备及介质,涉及GPU虚拟化技术领域,包括:基于Kubernetes集群中的预设调度扩展器确定目标GPU任务的GPU资源需求信息,并评估Kubernetes集群中各GPU节点的资源负载;利用目标负载预测模型预测目标GPU任务的任务负载曲线,基于任务负载曲线生成目标GPU任务的目标时间片策略指令;基于任务负载曲线、GPU资源需求信息和各GPU节点的资源负载确定目标GPU节点;确定目标GPU节点中的目标虚拟GPU单元,并利用目标虚拟GPU单元,基于目标时间片策略指令执行目标GPU任务。本申请可以实现GPU资源高效共享与精细化分配。
技术关键词
时间片
长短期记忆模型
节点
扩展器
曲线
策略
GPU虚拟化技术
指令
资源管理机制
进程
集群
存储计算机程序
执行装置
电子设备
核心
处理器
插件
队列