模型资源部署方法、装置、设备、存储介质及程序产品
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
模型资源部署方法、装置、设备、存储介质及程序产品
申请号:
CN202411457993
申请日期:
2024-10-18
公开号:
CN119440812A
公开日期:
2025-02-14
类型:
发明专利
摘要
本申请公开了一种模型资源部署方法、装置、设备、存储介质及程序产品,涉及通信技术领域,以有效利用GPU资源。该方法包括:获取推理业务需求;根据所述推理业务需求,预估待部署的大模型所需的GPU资源;部署所需的GPU资源;在接收到推理任务的情况下,根据所述推理任务对部署的GPU资源进行调整。本申请实施例可以有效利用GPU资源。
技术关键词
资源部署方法
业务时延需求
GPU显卡
图形处理单元
令牌
处理器
收发器
计算机程序产品
组网方式
存储器
集群
通信设备
可读存储介质
批量
规模
模块
消息