一种基于轻量化模型的交互式知识蒸馏算法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种基于轻量化模型的交互式知识蒸馏算法
申请号:
CN202411449746
申请日期:
2024-10-17
公开号:
CN119398096A
公开日期:
2025-02-07
类型:
发明专利
摘要
本发明公开的是一种基于轻量化模型的交互式知识蒸馏算法,算法的具体步骤如下:输入初始数据集作为主要监督任务、初始化在线蒸馏网络,将初始数据集数据进行数据增强操作、依据网络结构特点,对在线蒸馏网络进行模块划分、数据增强后的数据集输入到在线蒸馏网络的各个网络块中、利用损失函数的梯度信息,通过链式求导法则进行反向传播、重复执行步骤4至步骤5,直至损失函数值收敛或达到预设的训练周期,通过持续的迭代优化。本发明解决神经网络性能不足的问题,使得模型能够在不改变自身大小的情况下,尽可能提升网络性能。
技术关键词
蒸馏
线性分类器
逻辑
在线
算法
Softmax函数
数据
分支
标签
模块
网络结构
神经网络模型
度量
样本
输出特征
参数
图像
机制
平滑度