一种大语言模型模块化推理计算系统、方法、装置及介质
申请号:CN202411496525
申请日期:2024-10-25
公开号:CN119005275B
公开日期:2025-05-02
类型:发明专利
摘要
本发明公开了一种大语言模型模块化推理计算系统、方法、装置及介质。通过对大语言模型模块化推理计算系统中的文本嵌入模块、多簇注意力模块、多层感知机模块和线性映射模块分别进行不同单元的配置,来实现对输入文本令牌序列的生成词令牌的计算,另外的,对注意力机制计算数据流方法和线性层计算数据流方法进行了改进。解决了现有技术中受限于外部存储带宽,将难以充分发挥芯片的计算效率、性能差和对专业人员要求高的问题,实现了构建更加完善的大语言模型,设计了高吞吐的计算数据流,能够充分发挥芯片的算力。
技术关键词
令牌
文本
数据流方法
序列
大语言模型
注意力机制
线性
矩阵
查询特征
多层感知机
查找表
模块
字典
计算方法
因子
可读存储介质
计算机
处理器
键特征