针对持续学习的数据蒸馏模型训练方法、装置及设备

申请号：CN202510512638

申请日期：2025-04-23

公开号：CN120451638A

公开日期：2025-08-08

类型：发明专利

摘要

本申请公开了一种针对持续学习的数据蒸馏模型训练方法、装置及设备，涉及人工智能领域。具体实现方案包括：获取第一图像分类模型；将第一待蒸馏样本对应的预测概率分布向量输入目标蒸馏网络，得到包含有丰富类别信息量的第一分类软标签；基于第二任务样本集、第一待蒸馏样本、第一分类软标签，对第一图像分类模型进行迭代训练，得到在旧任务上性能更好的第二图像分类模型。本公开能够解决现有技术在持续学习场景下通过数据蒸馏方式仍会忽略新旧任务之间的关系，导致图像分类模型在旧任务上图像分类性能较差的问题，提高图像分类模型在旧任务上的性能。

技术关键词

图像分类模型蒸馏样本模型训练方法标签内存网络图像类别数据模型训练装置参数处理器关系指标模块指令精度存储器场景