摘要
本发明公开了一种基于知识增强的光学图像零样本目标检测方法,包括:构造数据集并拆分为可见类和不可见类图像;将可见类图像输入ResNet‑50网络,提取图像特征并使用RPN网络处理,得到待测区域特征和对应待测边界框坐标,使用RoI Align操作处理待测区域特征得到视觉特征;使用回归器结构计算边界框坐标和待测边界框坐标的损失,得到适合待测目标的边界框;改进分类器,并对可见类图像进行目标分类,计算预测目标分类与真实目标分类的损失函数,对分类器进行训练;使用以上结构对不可见类图像进行目标检测得到识别的目标;本方案减轻了语义鸿沟问题对于检测的不利影响;进行知识增强增加对不可见类图像的检测能力,提高预测的精度。