基于拆分学习的私有化大模型微调训练方法和装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于拆分学习的私有化大模型微调训练方法和装置
申请号:CN202411650255
申请日期:2024-11-19
公开号:CN119598509B
公开日期:2025-09-30
类型:发明专利
摘要
本申请涉及一种基于拆分学习的私有化大模型微调训练方法和装置,其中,该方法包括:将预训练的大模型拆分成头部模型段、中间模型段以及尾部模型段;将原始数据拆分成隐私数据和非隐私数据;根据隐私数据和非隐私数据,协同训练客户端中的头部模型段和尾部模型段,及服务器中的第一中间模型段和第二中间模型段,得到目标大模型;其中,在协同训练过程中,同态加密客户端和服务器之间传输的与隐私数据相关的隐私中间激活量;目标大模型输出关于特定主题的文档答复。通过本申请,解决了相关技术中需要向服务器传输中间激活量,存在通过模型反演攻击推测或恢复原始数据的风险的问题;实现对隐私数据的保护,降低隐私数据泄露的风险。
技术关键词
头部模型 客户端 服务器 数据 模型块 参数 加密 主题 训练装置 模块 处理器 计算机设备 可读存储介质 多项式 存储器 非线性 风险 解密