摘要
本申请适用于计算机技术领域,提供了一种基于共享指数的softmax算法的文本生成方法,包括:获取输入LLM模型的文本数据和模型参数,将文本数据和模型参数确定为输入值,输入值包括指数部分和尾数部分,再根据双查表对输入值进行查询,获取输入值的尾数近似值,根据共享指数公式对输入值的尾数近似值进行缩放处理,获取输入值的第一近似值,再根据Softmax函数对第一近似值进行归一化处理,再将第一近似值输入至自注意力机制层,输出注意力加权表示,将注意力加权表示输入至前馈神经网络,输出高级特征表示,将高级特征表示输入至解码器中,输出文本数据对应的文本。本申请在维持高计算精度的同时,可大幅降低计算功耗,降低模型的推理延迟,提高文本生成效率。