面向大语言模型的多芯粒存算一体计算装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
面向大语言模型的多芯粒存算一体计算装置
申请号:CN202411446822
申请日期:2024-10-16
公开号:CN119558364A
公开日期:2025-03-04
类型:发明专利
摘要
本发明提供了一种面向大语言模型的多芯粒存算一体计算装置,具有这样的特征,包括一个IO芯粒和多个PIM芯粒,其中,IO芯粒包括:嵌入模块用于生成嵌入向量并添加位置编码;IO侧数据通信模块对待计算向量进行裁切并分配至各个PIM芯粒,并接收各个PIM芯粒发送的局部计算反馈向量;同步模块,用于将各个局部计算反馈向量进行同步以及执行残差相加和层归一化计算;token存储器,PIM芯粒包括:PIM侧数据通信模块;全局存储器;多个PIM‑bank模块存储有大语言模型的网络权重,用于根据局部计算向量执行向量‑矩阵乘法生成对应的局部计算反馈向量;softmax模块。总之,本方法能够提高大语言模型的推理速度。
技术关键词
数据通信模块 大语言模型 全局存储器 多芯 注意力 矩阵 网络 查找表 同步单元 编码 流水线 阶段 解码 坐标 速度
系统为您推荐了相关专利信息
图像分割方法 特征提取模型 玉米 注意力 通道
天气情况数据 可调容量 历史负荷数据 负荷特征 矩阵
非标设备 历史设备 模板 元素 建模方法
协同训练方法 预训练语言模型 文本 注意力机制 动态
感兴趣 视觉特征 注意力 矩阵 特征提取网络