一种大语言模型低比特权重和激活值的动态量化方法、系统及应用

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种大语言模型低比特权重和激活值的动态量化方法、系统及应用
申请号:CN202410807170
申请日期:2024-06-21
公开号:CN119993134A
公开日期:2025-05-13
类型:发明专利
摘要
本发明公开了一种大语言模型低比特权重和激活值的动态量化方法,所述动态量化方法包括如下步骤:步骤一、根据权重和激活值的不同分布特性选择量化数据类型,权重采用4比特正态浮点量化,激活值采用8比特动态树量化;步骤二、对4比特权重和8比特激活值生成量化目标编码,通过计算分位点和/或指数位长度,得到量化目标编码。在量化过程中还可以通过对待量化数据进行分块,并进行量化和/或反量化处理,对量化精度进行提升。本发明还公开了实现上述动态量化方法的动态量化系统,以及所述动态量化方法或系统的应用,具有广泛应用价值。
技术关键词
动态量化方法 大语言模型 量化系统 半轴 数量化方法 分块 硬件系统 数据编码 指数 位点 输入模块 处理器 可读存储介质 索引 存储器 精度