大语言模型生成文本持续溯源模型训练方法及设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
大语言模型生成文本持续溯源模型训练方法及设备
申请号:CN202510646849
申请日期:2025-05-20
公开号:CN120179812B
公开日期:2025-10-10
类型:发明专利
摘要
本申请提供大语言模型生成文本持续溯源模型训练方法及设备,涉及基于特定计算模型的计算机系统领域,方法包括:提取当前训练阶段的各个训练样本中的文本数据各自的特征向量,训练样本中还包含大语言模型所属类型的标签,当前训练阶段的大语言模型发布时间晚于历史训练阶段的模型发布时间,获取各个大语言模型的初始原型及文本特征相关性数据,对各个历史和当前训练阶段获取的初始原型进行全局及局部去相关处理,得到各个大语言模型各自的去相关原型以生成大语言模型生成文本持续溯源模型。本申请能够解决传统溯源方法因固定标签集导致的频繁重新训练的问题,能够有效提高模型训练效率并降低资源消耗,并能够提高溯源结果的可靠性及有效性。
技术关键词
大语言模型 文本 原型 模型训练方法 特征提取单元 阶段 数据 溯源方法 预训练语言模型 处理器 标签组 计算机系统 可读存储介质 存储器 矩阵 有效性 电子设备 参数