一种联邦大语言模型的训练方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种联邦大语言模型的训练方法、装置、设备及介质
申请号:CN202510064621
申请日期:2025-01-15
公开号:CN119990367A
公开日期:2025-05-13
类型:发明专利
摘要
本说明书实施例公开了一种联邦大语言模型的训练方法、装置、设备及介质,方法包括:对预置大语言模型蒸馏获得对应的小型语言模型,并将其下发至各个客户端;根据各客户端的本地私有数据对小型语言模型进行训练获得对应的模型权重参数矩阵,上传到服务器端;基于奇异值分解对各模型权重参数矩阵进行分解,以筛选关键奇异值与对应奇异向量并基于此更新模型权重参数;对更新后的模型权重参数进行加权,获得客户端汇总模型,以基于客户端汇总模型与小型语言模型进行加权,获得服务器端的当前小型语言模型;将当前小型语言模型基于预置大语言模型与当前小型语言模型的公共数据集进行知识迁移,实现对于预置大语言模型的训练更新。
技术关键词
大语言模型 客户端 参数 矩阵 计算机可执行指令 蒸馏 非易失性存储介质 场景 标签 规模 关键词 训练设备 传播算法 训练装置 处理器通信 数据 存储器 脚本