摘要
一种基于视觉大模型的火焰检测方法,包括:通过特征提取器结合上下文聚合模块提取多尺度上下文语义增强特征图;利用双向特征交互模块经跨层特征双向卷积传递融合多尺度信息提升火源定位准确性;通过动态自适应点表示模块感知火源几何特征,结合密度聚类与空间约束筛选样本抑制干扰;构建含分类、回归(广义 IoU 与中心距离 IoU 损失)、多尺度监督及空间约束的多任务损失函数,结合 AdamW 优化器与动态衰减学习率策略训练模型。该方法可有效捕捉小尺度火源特征,减少复杂背景误检,在多数据集上检测精度优于传统方法,适用于水电厂等场景实时监控与火灾预警。