一种语言模型的协同训练方法、系统及介质

申请号：CN202510769434

申请日期：2025-06-10

公开号：CN120653985A

公开日期：2025-09-16

类型：发明专利

摘要

本发明属于模型训练技术领域，公开了一种语言模型的协同训练方法、系统及介质，所述方法包括：获取电力系统的样本数据集；将样本数据集输入至预训练语言模型中进行预测，得到预测结果，所述预测结果包括：基于请求分类任务得到的检索请求的可执行检索概率以及基于检索抽取任务得到的检索结果的预测概率；基于检索请求的可执行检索概率构建请求分类任务的第一损失函数；基于检索结果的预测概率构建检索抽取任务的第二损失函数；将第一损失函数与第二损失函数进行动态结合，得到总损失函数；基于总损失函数对预训练语言模型的参数进行迭代更新，得到训练好的预训练语言模型。本发明提高了预训练语言模型收敛速度、预测精度以及泛化能力。

技术关键词

协同训练方法预训练语言模型文本注意力机制动态样本残差结构语义向量模型训练技术电力系统表达式数据获取模块训练系统编码标签