一种针对终端资源受限的联邦大模型个性化训练方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种针对终端资源受限的联邦大模型个性化训练方法
申请号:CN202411084067
申请日期:2024-08-08
公开号:CN119047543A
公开日期:2024-11-29
类型:发明专利
摘要
本发明涉及信息安全技术领域,特别涉及一种针对终端资源受限的联邦大模型个性化训练方法。包括:参数服务器端:位于参数服务器端的大模型包含多个层级,且每个大模型的层级设有一个权重矩阵;本地终端:对应大模型中的每个权重矩阵,在本地终端的每个工作节点部署一个对应的LoRA模块,并在本地终端增设一个Local Layer层;本地终端通过参数服务器端进行联邦大模型训练过程包括:S1.前向传播;S2.计算Loss;S3.反向传播。本发明利用参数服务器的计算、存储资源来帮助资源受限的多个终端实现对大模型的联邦训练。
技术关键词
终端 受限 资源 矩阵 参数 层级 信息安全技术 数据 节点 标签 模块 模型更新 数值 服务器 关系 误差