基于及时学习和高置信度知识过滤的知识蒸馏方法和系统
申请号:CN202410981992
申请日期:2024-07-22
公开号:CN118761463A
公开日期:2024-10-11
类型:发明专利
摘要
本发明涉及一种基于及时学习和高置信度知识过滤的知识蒸馏方法和系统。该方法包括:S1、搭建知识蒸馏框架,对所述知识蒸馏框架进行自蒸馏训练;所述知识蒸馏框架采用自蒸馏的形式,教师模型和学生模型采用同一轻量化的卷积神经网络,知识在相邻批次之间进行传递,同时过滤教师模型高置信度知识;S2、训练后期,停止教师模型知识迁移,单独训练学生模型,直至学生模型收敛。本发明注重知识的及时学习、选择学习和集成学习,提高了知识蒸馏的效率,从而提高了模型的性能,实现了深度学习模型的压缩与加速。
技术关键词
知识蒸馏方法
教师
学生
框架
随机搜索方法
存储结构
深度学习模型
代表
蒸馏系统
数据采集器
数据标签
样本
超参数
网络
模块
表达式