一种基于注意力的多模态井场视频安全分析方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于注意力的多模态井场视频安全分析方法
申请号:CN202510323882
申请日期:2025-03-19
公开号:CN119851185B
公开日期:2025-05-20
类型:发明专利
摘要
本发明公开了一种基于注意力的多模态井场视频安全分析方法,涉及智能视频监控分析领域,包括:获取待分析的井场作业视频对应的低级融合特征;获取低级融合特征对应的视频模态全局时空特征;获取单帧图像模态的像素级细粒度局部特征;将视频模态的全局时空特征和单帧图像模态的像素级细粒度局部特征输入多模态特征渐进融合模块,得到多模态融合特征;将多模态融合特征输入基于多模态特征的多任务解码器模块,得到井场作业视频的安全分析结果。本发明能够精准有效地实现井场视频的安全分析,提升了安全监控的准确性和实时性。
技术关键词
交叉注意力机制 多模态特征 井场作业 融合特征 时空注意力机制 视频 全局特征提取 分析方法 图像编码器 特征提取模块 关键帧图像提取 多任务 解码器 像素 表达式