一种基于视觉语言提示学习的跨视角行人再识别方法

申请号：CN202511046002

申请日期：2025-07-29

公开号：CN120976969A

公开日期：2025-11-18

类型：发明专利

摘要

本发明涉及计算机视觉与跨视角行人识别技术领域，特别是涉及一种基于视觉语言提示学习的跨视角行人再识别方法，包括：获取目标图像；将所述目标图像输入预设的行人识别模型中，输出行人再识别结果，其中，所述行人识别模型通过采用提示学习机制和双阶段训练策略训练视觉语言预训练模型CLIP得到，其中，所述提示学习机制用于建模视角偏差，所述双阶段训练策略用于实现跨模态语义对齐。本发明能够显著提升跨视角识别的准确性与鲁棒性。

技术关键词

行人再识别方法文本样本视觉阶段地面视角图像预训练模型行人识别技术跨模态身份代表性图像语义三元组图像编码器