摘要
一种基于图像文本引导的机场跑道地下病害自动检测方法。其包括构建机场跑道地下数据集;由专业人员根据经验对每类地下病害做出文本描述;构建原始文本‑引导的多模态检测模型并训练后;将实时采集的机场跑道的B‑scan GPR图像输入文本‑引导的多模态检测模型,最终输出对应的边界框与类别预测结果等步骤。本发明在模型中引入文本模态,利用文本模态在表达病害形态关键特征时的高度概括性,增强模型对类内特征多样性的识别能力。采用可学习的文本嵌入机制,使模型能根据数据动态优化文本嵌入,从而更高效地提升模型对各类特征的适应性和检测性能。引入了层位分布先验信息,通过利用地下目标的空间分布特征,能有效区分形态相似的不同类别目标。