摘要
本发明公开一种开放环境零样本目标检测方法,结合ViT与GANs构建双分支架构。传统方法因依赖人工标注或弱泛化模型,在动态场景中检测精度不足。该方法通过ResNet分流图像:上分支集成区域建议网络(ARPN)和辅助定位网(ARPN)定位并计算回归损失;下分支ViT的倒数第二注意力头分类,另一路聚类后输入基于GANs的师生网络优化参数。该方法通过联合回归损失与分类损失完成端到端训练,显著提升检测效率。创新性提出开放环境专用数据集构建方法及多尺度数据增强策略,强化模型对复杂背景的适应性。相较于传统技术,本方案突破零样本场景检测精度瓶颈,为开放环境目标检测提供新范式。