模型推理方法、计算机程序产品及芯片
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
模型推理方法、计算机程序产品及芯片
申请号:
CN202510323473
申请日期:
2025-03-18
公开号:
CN120197702A
公开日期:
2025-06-24
类型:
发明专利
摘要
本申请实施例提供一种模型推理方法、计算机程序产品及芯片。在模型推理过程中,可以存储每个词元在每一层的隐藏状态,在需要用到这些词元的键值缓存时,可以基于该隐藏状态和键值投影权重矩阵恢复每个词元在模型每一层的键值缓存。本申请实施例提供的键值缓存恢复方案,可以同时以较低的开销利用芯片的计算资源和数据传输带宽资源,而不是单一的使用一种资源实现键值缓存的恢复,可以大大提高键值缓存的恢复效率,进而,提高模型的推理效率。
技术关键词
键值
存储单元
策略
计算机程序产品
位置编码信息
推理方法
芯片
内存访问技术
文本
索引表
序列
矩阵恢复
数据
可读存储介质
处理器
存储器
标识