非对称低秩微调模型训练方法、装置、设备、介质及产品
申请号:CN202510624548
申请日期:2025-05-15
公开号:CN120671765A
公开日期:2025-09-19
类型:发明专利
摘要
本申请涉及人工智能技术领域,提供一种非对称低秩微调模型训练方法、装置、设备、介质及产品。方法包括:构建多任务数据集;多任务数据集包括多个任务分类数据集,每一任务分类数据集包括多个连续模态的样本数据;基于多任务数据集,对初始模型进行预训练,获得非对称低秩微调模型;非对称低秩微调模型包括非对称低秩适配器,非对称低秩适配器是基于一个第一矩阵和多个第二矩阵进行微调的,第二矩阵的数量是基于每一样本数据的统计向量确定的。通过上述方式,解决了模型所需使用的第二矩阵的数量难以确定的问题,并将采用非对称低秩适配器架构的模型应用到连续模态的多任务分类场景中,扩大了非对称低秩适配器架构的应用场景。
技术关键词
模型训练方法
数据
样本
适配器架构
矩阵
学生
非暂态计算机可读存储介质
教师
多任务分类
模型训练装置
处理器
指数
人工智能技术
计算机程序产品
蒸馏
存储器
策略
场景