大模型投机采样加速架构、数据配置方法及电子芯片
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
大模型投机采样加速架构、数据配置方法及电子芯片
申请号:
CN202510533130
申请日期:
2025-04-25
公开号:
CN120407506A
公开日期:
2025-08-01
类型:
发明专利
摘要
本发明公开一种大模型投机采样加速架构、数据配置方法及电子芯片,其中,大模型投机采样加速架构,包括:存储器和用于执行投机采样算法的计算模块,存储器和计算模块采用近存计算配置方式;存储器包括多个存储阵列,大模型参数以矩阵切块方式分布式存储在存储阵列中;计算模块包括多个计算子模块,每个计算子模块可直接独立访问对应的存储阵列,计算子模块之间通过片上网络进行通信。本发明可以有效缓解模型参数搬运问题,不仅提升了计算时的带宽,还有效降低了数据传输功耗。
技术关键词
存储阵列
数据配置方法
子模块
电子芯片
令牌
切块
存储计算结果
执行矩阵乘法
共享存储空间
处理单元
访问存储器
参数
序列
网络
算法
非线性