基于模型合并和参数高效微调的大语言模型遗忘方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于模型合并和参数高效微调的大语言模型遗忘方法
申请号:CN202511234166
申请日期:2025-09-01
公开号:CN120725165B
公开日期:2025-11-18
类型:发明专利
摘要
本发明公开了一种基于模型合并和参数高效微调的大语言模型遗忘方法,大语言模型为经包含医疗数据的训练数据集训练的医疗大模型,其训练数据集划分为包含互补的目标遗忘集及保留集,该方法包括:关闭医疗大模型中包含目标遗忘患者个人身份信息的原始适配器模块,在相同位置注入相同架构的遗忘器模块并进行相同的初始化,并基于目标遗忘集,采用参数高效微调方法对遗忘器模块进行微调;通过线性合并或费舍尔信息矩阵合并的方式,将原始适配器模块的参数减去遗忘器模块的参数,实现遗忘合并,得到新适配器模块;将新适配器模块注入至原始适配器模块的位置,利用保留集对新适配器模块进行一轮微调训练,得到遗忘患者个人身份信息的医疗大模型。
技术关键词
适配器 模块 超参数 微调方法 大语言模型 处理器 矩阵 数据 识别患者 问答方法 电子病历 计算机程序产品 指令 可读存储介质 线性 电子设备
系统为您推荐了相关专利信息
自动化管理系统 智慧社区 智能门禁设备 智能合约验证 智能合约执行
信标检测方法 校正特征 信标检测装置 高压 二值化图像
智能问答方法 大语言模型 训练智能 问答模型 金融
信用评估模型 大语言模型 数据 样本 训练装置
减震系统 线圈绕组 阻尼档位 储能单元 电磁