基于大模型量化的文本生成方法、装置、设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于大模型量化的文本生成方法、装置、设备及存储介质
申请号:CN202510058078
申请日期:2025-01-13
公开号:CN120087360B
公开日期:2025-12-09
类型:发明专利
摘要
本申请实施例提供了基于大模型量化的文本生成方法、装置、设备及存储介质,应用于昇腾计算架构。通过将原始文本输入至目标大语言模型,目标大语言模型包括多个依次级联的特征提取层,每个特征提取层包括全连接层,通过目标大语言模型中的多个依次级联的特征提取层,基于原始文本对应的文本特征进行逐层级递增的特征提取,并配合昇腾计算架构的量化方法对每个特征提取层中全连接神经元的权重参数和激活值进行量化处理,输出目标文本特征,以简化全连接阶段的计算,从而实现大语言模型下的轻量级计算。基于目标文本特征生成目标文本,通过利用轻量级的大语言模型进行文本生成任务,减少了大模型在文本推理过程中的复杂计算,提高了文本生成的效率。
技术关键词
大语言模型 文本生成方法 参数 注意力 层级 级联 文本生成装置 可读存储介质 特征提取模块 电子设备 处理器 输入模块 存储器 计算机 基础 数据 阶段