一种基于文本描述的行人检索任务数据集构建方法

申请号：CN202510294112

申请日期：2025-03-13

公开号：CN119807466B

公开日期：2025-05-16

类型：发明专利

摘要

本发明涉及数据生成技术领域，公开了一种基于文本描述的行人检索任务数据集构建方法，包括直接以行人的人物特征，以及行人所处场景的场景特征为占位符，构建基础模板，并对基础模板进行填充后，生成对应的提示词；利用扩散模型，基于提示词，生成图像数据，完全不依赖原始数据，大大降低了隐私风险和规避了合格性问题。同时本发明利用局部编辑模型、全局编辑模型与非刚性编辑模型，直接基于生成的初始图像数据，有选择地对图像数据中对应属性的特征进行编辑，获取编辑图像数据，获取的编辑图像数据分辨率高，且图像生成的泛化性好、自由度高，大大提高了生成的图像数据的多样性，能够更全面的训练行人检索模型，提高模型识别精度。

技术关键词

数据集构建方法编辑图像数据文本人物特征场景特征模板大语言模型人体关键点读取图像数据注意力机制多层感知器多模态人体姿势识别数据生成技术生成图像数据基础

系统为您推荐了相关专利信息

基于图谱和大模型协同反馈的事实性偏好对齐方法及系统

对齐方法文本知识图谱构建对齐系统数据

虚拟资源的关联方法、装置、设备和存储介质

信息提取模型资源语句文本实体

基于POI数据与用水特征异常识别的供水稽查方法及系统

稽查方法时段分布图行业分类标签文本特征向量水表

基于语义与拓扑一致性的超声图像质量评价方法

超声图像数据空间变换网络注意力机制深度卷积神经网络跨模态

基于领域信息和自定义门控网络的网络谣言实时检测方法

实时检测方法谣言 BERT模型通道编码