摘要
本发明公开了一种文本检索行人重识别的数据增强方法,步骤包括:在大模型驱动下进行图文语义分区,再通过文本编码器和视觉编码器提取全局文本和图像与局部文本和图像的特征,然后进行全局特征和局部特征的提取,再进行全局特征Mixup和局部特征Mixup,最后训练模型。本发明采用Mixup数据增强方法,通过更精细的图像分区和更丰富的文本语义,实现在图文特征区域之间的一一对应,既进行整体对齐,也进行局部对齐,从而增强图像与文本之间的全局和局部特征的空间关系紧密性,从而提高了模型的鲁棒性与泛用性,增强了图文检索的精度,提高文本检索行人重识别模型的跨域泛化能力,缓解了图文数据的区域不对称问题。