模型处理方法、装置、计算机设备、存储介质和程序产品
申请号:CN202410996728
申请日期:2024-07-24
公开号:CN118536557B
公开日期:2024-10-15
类型:发明专利
摘要
本申请涉及一种模型处理方法、装置、计算机设备、存储介质和程序产品。所述方法包括:将预训练深度学习模型和原始数据处理模型分别划分为多个层组,针对原始数据处理模型的每个层组,根据第一训练数据集和预训练深度学习模型中和所针对层组对应的目标层组,对所针对层组进行分层训练,得到中间数据处理模型。对预训练深度学习模型和中间数据处理模型进行交叉分层处理,得到多个交叉层组,针对多个交叉层组中的每个交叉层组,根据第二训练数据集和所针对交叉层组中的至少两个第一相邻层组,对所针对交叉层组中的至少两个第二相邻层组进行蒸馏训练,得到目标数据处理模型。采用本方法能够减少模型训练时的资源消耗,提升模型训练处理效率。
技术关键词
数据处理模型
训练深度学习模型
蒸馏
分层
矩阵
参数
计算机设备
层级
模块
计算机程序产品
处理器
线性
可读存储介质
存储器
数值
关系
资源