一种基于注意力的多模态井场视频安全分析方法

申请号：CN202510323882

申请日期：2025-03-19

公开号：CN119851185B

公开日期：2025-05-20

类型：发明专利

摘要

本发明公开了一种基于注意力的多模态井场视频安全分析方法，涉及智能视频监控分析领域，包括：获取待分析的井场作业视频对应的低级融合特征；获取低级融合特征对应的视频模态全局时空特征；获取单帧图像模态的像素级细粒度局部特征；将视频模态的全局时空特征和单帧图像模态的像素级细粒度局部特征输入多模态特征渐进融合模块，得到多模态融合特征；将多模态融合特征输入基于多模态特征的多任务解码器模块，得到井场作业视频的安全分析结果。本发明能够精准有效地实现井场视频的安全分析，提升了安全监控的准确性和实时性。

技术关键词

交叉注意力机制多模态特征井场作业融合特征时空注意力机制视频全局特征提取分析方法图像编码器特征提取模块关键帧图像提取多任务解码器像素表达式