一种基于文本描述的行人检索任务数据集构建方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于文本描述的行人检索任务数据集构建方法
申请号:CN202510294112
申请日期:2025-03-13
公开号:CN119807466B
公开日期:2025-05-16
类型:发明专利
摘要
本发明涉及数据生成技术领域,公开了一种基于文本描述的行人检索任务数据集构建方法,包括直接以行人的人物特征,以及行人所处场景的场景特征为占位符,构建基础模板,并对基础模板进行填充后,生成对应的提示词;利用扩散模型,基于提示词,生成图像数据,完全不依赖原始数据,大大降低了隐私风险和规避了合格性问题。同时本发明利用局部编辑模型、全局编辑模型与非刚性编辑模型,直接基于生成的初始图像数据,有选择地对图像数据中对应属性的特征进行编辑,获取编辑图像数据,获取的编辑图像数据分辨率高,且图像生成的泛化性好、自由度高,大大提高了生成的图像数据的多样性,能够更全面的训练行人检索模型,提高模型识别精度。
技术关键词
数据集构建方法 编辑图像数据 文本 人物特征 场景特征 模板 大语言模型 人体关键点 读取图像数据 注意力机制 多层感知器 多模态 人体姿势识别 数据生成技术 生成图像数据 基础
系统为您推荐了相关专利信息
对齐方法 文本 知识图谱构建 对齐系统 数据
信息提取模型 资源 语句 文本 实体
稽查方法 时段分布图 行业分类标签 文本特征向量 水表
超声图像数据 空间变换网络 注意力机制 深度卷积神经网络 跨模态
实时检测方法 谣言 BERT模型 通道 编码