基于低秩张量适应的模型微调训练方法、模型应用方法及相关装置
申请号:CN202411015559
申请日期:2024-07-26
公开号:CN119204142A
公开日期:2024-12-27
类型:发明专利
摘要
本申请涉及计算机技术领域,特别是涉及一种基于低秩张量适应的模型微调训练方法、模型应用方法及相关装置。一个实施例的基于低秩张量适应的模型微调训练方法包括:获取预训练模型;为所述预训练模型的模型参数添加微调参数,获得多个微调参数矩阵,并将所述多个微调参矩阵合并为一个微调参数张量并分解为一个核心张量与两个低秩因子矩阵;冻结两个所述低秩因子矩阵以及所述模型参数,获得待训练模型;通过样本数据对所述待训练模型进行微调训练,在训练过程中对所述核心张量进行调整,获得训练后的目标模型。采用本申请实施例能够减少了在针对预训练模型进行模型微调时需要调整的参数的数量,减少了参数微调的成本。
技术关键词
预训练模型
矩阵
参数
因子
核心
样本
数据获取模块
训练装置
处理器
计算机设备
可读存储介质
存储器
标签