基于多模态学习与知识蒸馏的弱监督异常检测方法及系统
申请号:CN202511070127
申请日期:2025-07-31
公开号:CN121033750A
公开日期:2025-11-28
类型:发明专利
摘要
本公开提供了基于多模态学习与知识蒸馏的弱监督异常检测方法及系统,涉及计算机视觉技术领域,包括提取每帧图像的视觉特征以及文本描述的文本特征,基于每个事件片段的视觉特征提取场景嵌入因子;将视觉特征、文本特征以及场景嵌入因子输入至教师网络,得到帧级异常得分;将视觉特征以及场景嵌入因子输入至学生网络,得到帧级得分;构建蒸馏损失函数,基于蒸馏损失函数对教师网络中TCN模块的输出特征与学生网络中TCN模块的输出特征进行特征蒸馏,以教师网络的帧级异常得分作为软标签,对学生网络的帧级得分进行对齐,引导学生网络的输出逼近教师网络的决策边界,由学生网络输出最终的异常检测结果。本公开提升在复杂监控环境下的检测精度。
技术关键词
异常检测方法
蒸馏
网络
学生
多模态
教师
输出特征
因子
交叉注意力机制
文本
视觉特征提取
非暂态计算机可读存储介质
融合视觉特征
融合特征
场景上下文
图像
联合嵌入模型
视频流