一种多矩阵聚合多维特征的大模型优化方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种多矩阵聚合多维特征的大模型优化方法
申请号:CN202411708388
申请日期:2024-11-27
公开号:CN119203793A
公开日期:2024-12-27
类型:发明专利
摘要
本发明属于电数字数据处理的技术领域,更具体地,涉及一种多矩阵聚合多维特征的大模型优化方法。所述方法包括:首先设计一种基础优化算子FoRA:Fusion of Rank;然后,将第一步中设计的基础优化算子适配到基于联邦学习的Transformer大模型的整个TransformerLayer层;最后,对上一步中完成优化算子适配的Transformer大模型进行量化,以降低训练大模型对资源的需求,然后基于联邦学习,客户端本地进行微调量化后的大模型,并将微调后的可训练的低秩参数汇聚到全局模型。以解决现有大语言模型需要大量高质数据与计算资源训练,且不能很好地处理下游任务的局限性的问题。
技术关键词
模型优化方法 矩阵 低秩特征 客户端 电数字数据处理 代表 基础 适配器 大语言模型 服务端 阶段 键值 资源 线性 超参数 格式 注意力