一种用于无线边缘网络的大模型分布式微调联邦分割学习方法、系统及介质
申请号:CN202410787393
申请日期:2024-06-18
公开号:CN118780348A
公开日期:2024-10-15
类型:发明专利
摘要
本发明实施例提供了一种用于无线边缘网络的大模型分布式微调联邦分割学习方法、系统及介质,涉及计算机技术领域。方法包括:多个本地设备中的每个本地设备将本地训练数据输入本地的设备侧模型,得到中间输出结果并传输给服务器;服务器利用服务器侧模型对多个中间输出结果进行处理,得到设备侧模型梯度和服务器侧模型梯度;服务器使用服务器侧模型梯度更新服务器侧模型的参数,每个本地设备利用设备侧模型梯度更新本地的设备侧模型的参数;至少依据神经元重要性评分,对服务器侧模型和设备侧模型进行剪枝,基于剪枝后的服务器侧模型和设备侧模型继续协同训练,得到训练完毕的大模型,以实现无线网络环境中高效地进行大模型微调。
技术关键词
服务器
学习方法
多模态
无线网络环境
参数更新模块
投影器
文本
音频
编码器
数据传输模块
可读存储介质
学习系统
数据处理模块
视频
图像
标签
基座