基于差分隐私机制的大模型训练方法、介质及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于差分隐私机制的大模型训练方法、介质及系统
申请号:CN202510066183
申请日期:2025-01-16
公开号:CN119494408B
公开日期:2025-07-18
类型:发明专利
摘要
本发明公开了一种基于差分隐私机制的大模型训练方法、介质和系统,其中方法包括:S101,获取历史数据,并进行预处理,以及对预处理后的历史数据进行分组和标注,以形成训练数据集;S102,初始化大语言模型参数;S103,基于训练数据集进行训练,并计算梯度;S104,进行梯度加噪,以得到加噪梯度,并基于加噪梯度计算对应的综合不公平性指标值;S105,判断综合不公平性指标值是否处于预设取值范围内;S106,如果综合不公平指标值处于预设取值范围内,则判断当前大语言模型是否满足训练要求;如果是,则将当前大语言模型作为最终模型;如果否,则返回步骤S103。能够实现对用户隐私进行有效保护,同时,避免因使用差分隐私机制而导致的不公平现象的产生。
技术关键词
差分隐私机制 模型训练方法 大语言模型 文本 数据 噪声强度 模型训练系统 模块 参数 指标 可读存储介质 符号 标签 因子 样本 误差 程序