面向大语言模型的多芯粒存算一体计算装置

申请号：CN202411446822

申请日期：2024-10-16

公开号：CN119558364A

公开日期：2025-03-04

类型：发明专利

摘要

本发明提供了一种面向大语言模型的多芯粒存算一体计算装置，具有这样的特征，包括一个IO芯粒和多个PIM芯粒，其中，IO芯粒包括：嵌入模块用于生成嵌入向量并添加位置编码；IO侧数据通信模块对待计算向量进行裁切并分配至各个PIM芯粒，并接收各个PIM芯粒发送的局部计算反馈向量；同步模块，用于将各个局部计算反馈向量进行同步以及执行残差相加和层归一化计算；token存储器，PIM芯粒包括：PIM侧数据通信模块；全局存储器；多个PIM‑bank模块存储有大语言模型的网络权重，用于根据局部计算向量执行向量‑矩阵乘法生成对应的局部计算反馈向量；softmax模块。总之，本方法能够提高大语言模型的推理速度。

技术关键词

数据通信模块大语言模型全局存储器多芯注意力矩阵网络查找表同步单元编码流水线阶段解码坐标速度

系统为您推荐了相关专利信息

一种玉米籽粒图像分割方法

图像分割方法特征提取模型玉米注意力通道

一种多因素融合的电动汽车充电站可调容量预测方法

天气情况数据可调容量历史负荷数据负荷特征矩阵

一种非标设备的建模方法及装置

非标设备历史设备模板元素建模方法

一种语言模型的协同训练方法、系统及介质

协同训练方法预训练语言模型文本注意力机制动态

多视角目标检测或模型训练方法、装置、电子设备及介质

感兴趣视觉特征注意力矩阵特征提取网络