摘要
本发明公开了一种基于文本引导的机械工具图像目标检测方法。方法包括使用相机拍摄采集机械工具图片,并针对每张机械工具图片建立文本信息,每张机械工具图片与对应的文本信息形成图像文本对,所有的图像文本对形成机械工具数据集,然后构建文本目标检测模型,将机械工具数据集输入到文本目标检测模型中进行训练,得到训练好的文本目标检测模型,最后分别获取待测机械工具图片和对应的文本信息,将待测机械工具图片和对应的文本信息输入到训练好的文本目标检测模型中进行检测,得到机械工具检测结果。本发明通过设计更高效的文本视觉融合策略与特征提取网络,有效提升了目标检测精度,在场景改变时依然具有良好的目标识别泛化能力。