一种基于视觉语言提示学习的跨视角行人再识别方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种基于视觉语言提示学习的跨视角行人再识别方法
申请号:
CN202511046002
申请日期:
2025-07-29
公开号:
CN120976969A
公开日期:
2025-11-18
类型:
发明专利
摘要
本发明涉及计算机视觉与跨视角行人识别技术领域,特别是涉及一种基于视觉语言提示学习的跨视角行人再识别方法,包括:获取目标图像;将所述目标图像输入预设的行人识别模型中,输出行人再识别结果,其中,所述行人识别模型通过采用提示学习机制和双阶段训练策略训练视觉语言预训练模型CLIP得到,其中,所述提示学习机制用于建模视角偏差,所述双阶段训练策略用于实现跨模态语义对齐。本发明能够显著提升跨视角识别的准确性与鲁棒性。
技术关键词
行人再识别方法
文本
样本
视觉
阶段
地面视角图像
预训练模型
行人识别技术
跨模态
身份
代表性图像
语义
三元组
图像编码器