一种模型内存占用优化方法、设备、介质、产品及系统
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种模型内存占用优化方法、设备、介质、产品及系统
申请号:
CN202410874870
申请日期:
2024-07-02
公开号:
CN118409873B
公开日期:
2024-08-30
类型:
发明专利
摘要
本申请公开了计算机技术领域内的一种模型内存占用优化方法、设备、介质、产品及系统。本申请针对特定推理请求预测其推理结果的内存占用范围,约束了推理结果的内存占用量,且该过程综合考虑了预训练模型所在的目标异构算力设备的当前内存剩余空间,由此结合设备的实际内存使用情况进行内存优化设计,不仅能够节约异构算力的内存,避免算力闲置与资源浪费,还能实现用户无感知,为提升推理请求处理效率和并发数提供了可能。
技术关键词
内存占用优化方法
预训练模型
异构
算力系统
字符
策略
设备运行信息
控制设备
非易失性存储介质
内存占用量
存储计算机程序
计算机程序产品
客户端
处理器
列表
参数
电子设备
指令