摘要
本发明属于轨道交通技术领域,公开了基于视觉模型的轨道交通环境异物侵入检测方法及系统。该方法首先通过预处理提取原始图像中的可疑区域子图,分别利用图像编码器提取粗粒度全局特征向量及细粒度局部特征向量;同时生成与图像内容匹配的文本提示信息,提取对应的文本特征向量;通过计算图像特征向量与文本特征向量的多层次相似度,结合各自的权重融合得到综合异常分数;最后基于混合高斯模型动态建模异常分数分布,实现异物侵入判定。本发明融合图像与文本多模态信息,通过多尺度特征关联提升复杂场景下异物的检测精度,采用自适应阈值策略增强动态环境适应性,有效解决了传统方法在铁路复杂背景中误检率高、泛化能力不足的问题。