目标检测方法、模型训练方法、装置、电子设备及介质

申请号：CN202510798332

申请日期：2025-06-13

公开号：CN120852736A

公开日期：2025-10-28

类型：发明专利

摘要

本公开涉及数据处理技术领域，提供了一种目标检测方法、模型训练方法、装置、电子设备及介质。目标检测方法包括：获取待识别图像和查询文本，其中，查询文本用于查询待识别图像中与查询文本对应的目标对象；对待识别图像进行图像识别，得到图像描述特征和区域检测视觉特征；对图像描述特征和区域检测视觉特征进行区域多模态融合处理，得到区域多模态融合特征；对基于查询文本得到的文本特征和区域多模态融合特征进行特征融合处理，得到查询文本对应的文本区域融合特征；基于文本特征和文本区域融合特征得到目标检测结果，以此提升了文本语义与图像区域特征的融合度，提升了复杂场景下目标检测的准确性和鲁棒性。

技术关键词

融合特征文本视觉特征多模态细粒度特征图像注意力样本序列化特征模型训练方法对象强化特征权重特征标签电子设备可读存储介质数据处理技术处理器模块解码