摘要
本发明涉及计算机视觉技术领域,公开了一种基于注意力机制的实时视频目标检测方法及系统,其中,一种基于注意力机制的实时视频目标检测方法包括:多模态数据获取与预处理,获取包括至少两种不同传感器的数据,并进行时空对齐、噪声过滤和格式标准化处理;模态效用评估,对预处理后的各模态数据的效用值进行评估;自适应模态激活控制,生成满足资源约束和性能要求的模态激活方案;可迁移模态配置优化,构建迁移学习模块将先前场景的优化经验迁移到新场景;跨模态注意力融合与目标检测,动态评估激活模态的可靠性,计算注意力权重,执行特征融合和目标检测;本发明通过自适应模态选择和注意力机制融合,实现了全天候环境下的高效目标检测。