面向城市轨道交通工程安全隐患识别模型压缩方法和系统
申请号:CN202510791279
申请日期:2025-06-13
公开号:CN120893496A
公开日期:2025-11-04
类型:发明专利
摘要
本发明公开了一种面向城市轨道交通工程安全隐患识别模型压缩方法及系统,方法包括选用预训练Swin Transformer作教师模型,经城轨隐患图像调参。在W‑MSA/SW‑MSA注意力头、MLP线性层嵌入门控向量,动态缩放通道输出,通过L1惩罚强化稀疏性,根据验证集性能选定阈值完成自适应剪枝。剪枝后基于权重L1范数和概率分布调量化位宽。再让剪枝量化后的学生模型与教师模型知识蒸馏,构建含特征、概率分布一致性损失的注意力对比损失函数,引入温度系数动态调整确定最终损失。实现了模型轻量化与性能保持的协同优化。
技术关键词
面向城市轨道交通
模型压缩方法
输出特征
注意力
教师
通道
动态
Softmax函数
轨道交通场景
学生
工程建设现场
焦点损失函数
蒸馏
矩阵
图像
精度
线性
网络
模块