大语言模型生成文本持续溯源模型训练方法及设备

申请号：CN202510646849

申请日期：2025-05-20

公开号：CN120179812B

公开日期：2025-10-10

类型：发明专利

摘要

本申请提供大语言模型生成文本持续溯源模型训练方法及设备，涉及基于特定计算模型的计算机系统领域，方法包括：提取当前训练阶段的各个训练样本中的文本数据各自的特征向量，训练样本中还包含大语言模型所属类型的标签，当前训练阶段的大语言模型发布时间晚于历史训练阶段的模型发布时间，获取各个大语言模型的初始原型及文本特征相关性数据，对各个历史和当前训练阶段获取的初始原型进行全局及局部去相关处理，得到各个大语言模型各自的去相关原型以生成大语言模型生成文本持续溯源模型。本申请能够解决传统溯源方法因固定标签集导致的频繁重新训练的问题，能够有效提高模型训练效率并降低资源消耗，并能够提高溯源结果的可靠性及有效性。

技术关键词

大语言模型文本原型模型训练方法特征提取单元阶段数据溯源方法预训练语言模型处理器标签组计算机系统可读存储介质存储器矩阵有效性电子设备参数