协同标签自进化和相似性正则化的大语言模型学习方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
协同标签自进化和相似性正则化的大语言模型学习方法
申请号:CN202510804886
申请日期:2025-06-17
公开号:CN120764625A
公开日期:2025-10-10
类型:发明专利
摘要
本发明公开了一种协同标签自进化和相似性正则化的大语言模型持续学习方法及系统。对于需微调以持续学习新任务的大模型,首先判断是否为初始训练阶段,若是,则使用LoRA进行微调得到掌握新任务知识的新模型;否则,利用当前任务少量真实样本,通过掩码引导生成伪输入,结合标签自进化生成伪标签。将历史伪样本、当前伪样本与新任务样本合并构建训练集,依据任务间相似性在LoRA微调中引入正则化,在训练集上微调大语言模型以兼顾新知识学习与旧知识保持。并使用KMeans算法从新任务样本中采样M%用于后续伪样本生成,循环上述步骤直至全部任务完成。本发明融合伪样本重放和正则化策略,有效缓解灾难性遗忘,提升知识迁移效率与数据利用率。
技术关键词
样本 大语言模型 模型学习方法 Kmeans算法 学习系统 生成标签 持续学习方法 模块 正则化策略 构建训练集 阶段 参数 编码 聚类 数据 曲线 动态