一种文本检索行人重识别的数据增强方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种文本检索行人重识别的数据增强方法
申请号:CN202411804740
申请日期:2024-12-10
公开号:CN120431621A
公开日期:2025-08-05
类型:发明专利
摘要
本发明公开了一种文本检索行人重识别的数据增强方法,步骤包括:在大模型驱动下进行图文语义分区,再通过文本编码器和视觉编码器提取全局文本和图像与局部文本和图像的特征,然后进行全局特征和局部特征的提取,再进行全局特征Mixup和局部特征Mixup,最后训练模型。本发明采用Mixup数据增强方法,通过更精细的图像分区和更丰富的文本语义,实现在图文特征区域之间的一一对应,既进行整体对齐,也进行局部对齐,从而增强图像与文本之间的全局和局部特征的空间关系紧密性,从而提高了模型的鲁棒性与泛用性,增强了图文检索的精度,提高文本检索行人重识别模型的跨域泛化能力,缓解了图文数据的区域不对称问题。
技术关键词
图像嵌入 文本编码器 局部图像特征 排序损失 注意力 语句 行人重识别模型 sigmoid函数 数据 图文 矩阵 语义 图像编码器 分区 词特征 代表 分支
系统为您推荐了相关专利信息
故障分类模型 故障诊断系统 时序特征 分析设备 传感器
代码仓库 函数调用关系 函数调用信息 数据 编辑
分辨率 脑电特征提取 图像嵌入 脑电图数据 多模态
智能决策引擎 构建系统 能耗 云端 模型预测控制算法
红外图像彩色化 注意力 彩色图像 掩膜数量 编码器