基于多维层次语义蒸馏的深度学习模型压缩方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于多维层次语义蒸馏的深度学习模型压缩方法
申请号:CN202510268117
申请日期:2025-03-07
公开号:CN120181167A
公开日期:2025-06-20
类型:发明专利
摘要
本发明涉及一种基于多维层次语义蒸馏的深度学习模型压缩方法,属于深度学习模型压缩领域。所述方法,首先从教师模型的深层次特征中提取潜在的高阶语义表征信息;然后,通过引入中间模型以桥接教师模型与学生模型之间的能力差距,逐步传递知识以缓解直接迁移引发的不匹配问题;最后设计一种更为细化的监督机制,不仅关注最终标准化后的类别预测,还强调类间级和类内级关系的知识信息捕获,以减小输出尺度差异带来的影响,同时增强模型对语义结构的感知能力。
技术关键词
教师 学生 蒸馏 皮尔逊相关系数 深度学习模型压缩 标签 语义结构 分类器 样本 定义 模型预训练 标准化方法 多层次 参数 批量 线性 度量