一种基于文本引导的机械工具图像目标检测方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于文本引导的机械工具图像目标检测方法
申请号:CN202510193626
申请日期:2025-02-21
公开号:CN120125804A
公开日期:2025-06-10
类型:发明专利
摘要
本发明公开了一种基于文本引导的机械工具图像目标检测方法。方法包括使用相机拍摄采集机械工具图片,并针对每张机械工具图片建立文本信息,每张机械工具图片与对应的文本信息形成图像文本对,所有的图像文本对形成机械工具数据集,然后构建文本目标检测模型,将机械工具数据集输入到文本目标检测模型中进行训练,得到训练好的文本目标检测模型,最后分别获取待测机械工具图片和对应的文本信息,将待测机械工具图片和对应的文本信息输入到训练好的文本目标检测模型中进行检测,得到机械工具检测结果。本发明通过设计更高效的文本视觉融合策略与特征提取网络,有效提升了目标检测精度,在场景改变时依然具有良好的目标识别泛化能力。
技术关键词
空间特征提取 机械工具 文本 嵌入特征 注意力机制 视觉检测模块 图像 图片 输入端 瓶颈 特征提取网络 预训练模型 融合策略 数据 输出端 相机 场景