摘要
本发明公开了一种视频异常事件检测方法,涉及计算机视觉技术领域,包括预训练目标检测器针对已知异常事件原始视频大数据帧中目标进行定位与置信度标记,建立已知异常事件原始视频中的各个目标时空立方体;预训练构建教师‑学生网络架构针对已知异常事件原始视频中的各个目标时空立方体中目标进行异常感知蒸馏,建立已知异常事件原始视频中的各个目标异常事件样本集合;基于多模态时序Transformer架构,将教师‑学生网络架构针作为视觉特征编码器,将目标检测器作为运动特征编码器,确定已知异常事件原始视频大数据中各个目标是否处于异常状态。本发明的优点在于:解决了传统方法在复杂场景下误报率高、依赖人工标注、难以捕捉时序异常问题。