大语言模型的量化方法、推理方法及电子设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
大语言模型的量化方法、推理方法及电子设备
申请号:CN202510118310
申请日期:2025-01-24
公开号:CN120354895A
公开日期:2025-07-22
类型:发明专利
摘要
本申请公开了一种大语言模型的量化方法、推理方法及电子设备,属于大语言模型技术领域,本申请实施例的大语言模型的量化方法包括:针对大语言模型中待量化的每个线性层,将所述线性层在隐层维度上的通道划分为正常通道和离群通道;对所述正常通道对应的第一激活矩阵在分词token维度进行INT8量化得到第二激活矩阵,以及对所述正常通道对应的第一权重矩阵按输出通道进行INT4量化得到第二权重矩阵;根据所述第二激活矩阵、所述第二权重矩阵、所述离群通道对应的第三激活矩阵和所述离群通道对应的第三权重矩阵确定所述线性层的输出结果。
技术关键词
大语言模型 矩阵 预定数据格式 通道 浮点型数据 线性 推理方法 参数 电子设备 可读存储介质 处理器 分词 索引 存储器 计算机