一种文本检索行人重识别的数据增强方法

申请号：CN202411804740

申请日期：2024-12-10

公开号：CN120431621A

公开日期：2025-08-05

类型：发明专利

摘要

本发明公开了一种文本检索行人重识别的数据增强方法，步骤包括：在大模型驱动下进行图文语义分区，再通过文本编码器和视觉编码器提取全局文本和图像与局部文本和图像的特征，然后进行全局特征和局部特征的提取，再进行全局特征Mixup和局部特征Mixup，最后训练模型。本发明采用Mixup数据增强方法，通过更精细的图像分区和更丰富的文本语义，实现在图文特征区域之间的一一对应，既进行整体对齐，也进行局部对齐，从而增强图像与文本之间的全局和局部特征的空间关系紧密性，从而提高了模型的鲁棒性与泛用性，增强了图文检索的精度，提高文本检索行人重识别模型的跨域泛化能力，缓解了图文数据的区域不对称问题。

技术关键词

图像嵌入文本编码器局部图像特征排序损失注意力语句行人重识别模型 sigmoid函数数据图文矩阵语义图像编码器分区词特征代表分支

系统为您推荐了相关专利信息

故障诊断系统的控制方法、设备及存储介质

故障分类模型故障诊断系统时序特征分析设备传感器

一种面向函数调用关系的代码预训练及生成的方法与系统

代码仓库函数调用关系函数调用信息数据编辑

一种基于多模态扩散模型从大脑活动重建图像的方法

分辨率脑电特征提取图像嵌入脑电图数据多模态

一种基于人工智能的能耗模型智能构建系统及方法

智能决策引擎构建系统能耗云端模型预测控制算法

一种基于注意力掩膜的红外图像彩色化方法

红外图像彩色化注意力彩色图像掩膜数量编码器