训练语言模型的方法及装置

申请号：CN202411123942

申请日期：2024-08-15

公开号：CN119004108A

公开日期：2024-11-22

类型：发明专利

摘要

本说明书实施例涉及训练语言模型的方法及装置，方法包括：首先，将目标输入文本分别输入目标语言模型以及预训练的参考语言模型，得到两个模型各自关于第一输出文本的概率值，以及各自关于第二输出文本的概率值，其中，第一输出文本相对于第二输出文本被标记为关于所述目标输入文本的偏好输出文本；然后，确定训练损失，其与第一损失项负相关，且与第二损失项正相关；其中，第一损失项包括所述两个模型关于第一输出文本的概率值之间的差异；第二损失项包括所述两个模型关于第二输出文本的概率值之间的差异与0之间的较大值；接下来，以减小所述训练损失为目标，调整所述目标语言模型中的参数。

技术关键词

文本训练语言模型打标平台参数计算机标记可读存储介质存储器处理器数值