摘要
本申请涉及计算机视觉领域,提供了一种车载矿用视频监测的动态图谱模态语义分割方法及系统。本发明通过车载摄像头捕获矿区视频,利用预训练的第一卷积神经网络深度提取视频帧特征并融合多层特征以增强表示能力,而后构建时间维度动态图谱和空间维度动态图谱,融合后形成动态图谱模态,并引入注意力机制,依据特征向量相似度分配权重,聚焦关键区域间的相关性。利用全局平均池化层提取上下文信息,与加权后的原始特征图结合融合全局与动态图谱信息。此外,还结合局部上下文信息以增强特征理解。基于全面融合的特征图输出精确的语义分割结果,为每个像素分配代表其所属物体或背景类别的标签,实现了对矿区视频信息的深度理解与高效解析。