一种基于视觉语言提示学习的跨视角行人再识别方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于视觉语言提示学习的跨视角行人再识别方法
申请号:CN202511046002
申请日期:2025-07-29
公开号:CN120976969A
公开日期:2025-11-18
类型:发明专利
摘要
本发明涉及计算机视觉与跨视角行人识别技术领域,特别是涉及一种基于视觉语言提示学习的跨视角行人再识别方法,包括:获取目标图像;将所述目标图像输入预设的行人识别模型中,输出行人再识别结果,其中,所述行人识别模型通过采用提示学习机制和双阶段训练策略训练视觉语言预训练模型CLIP得到,其中,所述提示学习机制用于建模视角偏差,所述双阶段训练策略用于实现跨模态语义对齐。本发明能够显著提升跨视角识别的准确性与鲁棒性。
技术关键词
行人再识别方法 文本 样本 视觉 阶段 地面视角图像 预训练模型 行人识别技术 跨模态 身份 代表性图像 语义 三元组 图像编码器