一种基于联邦学习的多方大模型联合训练方法和装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于联邦学习的多方大模型联合训练方法和装置
申请号:CN202510484026
申请日期:2025-04-17
公开号:CN120415786A
公开日期:2025-08-01
类型:发明专利
摘要
本发明公开了一种基于联邦学习的多方大模型联合训练方法和装置,包括将待训练的大模型按照参数大小均匀划分到每个计算节点,所有节点设置s为随机种子,初始化模型参数;每个客户端使用自身持有的私域数据训练大模型,完成一轮训练后,将每个计算节点的梯度参数合成完整梯度Gi;生成与Gi相同形状的随机数矩阵Ri作为子秘密之一;计算Ti=Gi‑Ri作为另一个子秘密;将两个子秘密分别发送给两个中央服务器求和,得到最终更新梯度W;每个客户端将W划分为节点更新梯度并发送到对应节点,完成模型更新;重复上述过程直至大模型收敛或达到预设的迭代次数。本发明中客户端只需与中央服务器通信,秘密分享方案简洁,通信成本低,支持规模参数庞大的大模型训练。
技术关键词
模型联合训练方法 客户端 节点更新 服务器 模型更新 主节点 参数 模型训练模块 处理器 矩阵 种子 计算机程序产品 训练装置 存储器 数据 可读存储介质 电子设备 规模
系统为您推荐了相关专利信息
综合地质 图像处理系统 植被 图像分析模块 图像采集模块
标志位 流水线 计算方法 计算机程序指令 参数
动态对称可搜索加密 客户端 关键词 列表 标识符
多模态特征融合 模型误差 模型训练模块 融合特征 自检机制
报警设备 多用途 通信模块 芯片 电池供电模块