复杂场景下基于多模态信息辅助的人员重识别方法、装置和电子设备
申请号:CN202411062100
申请日期:2024-08-05
公开号:CN118570846B
公开日期:2024-10-29
类型:发明专利
摘要
本申请涉及人员重识别技术领域,其具体地公开了一种复杂场景下基于多模态信息辅助的人员重识别方法、装置和电子设备,其首先对不同摄像头视角下的两张行人图像分别进行人体属性分析,通过大语言模型分别生成对应的人体属性全方位描述文本,随后将文本的语义编码特征与行人图像通过传统reid模型提取出的行人图像特征进行融合,以构建行人的多模态信息交互融合特征表示,进而以这种多模态信息交互融合特征表示作为相似度计算的依据,来识别两张图像中的行人对象是否为同一人。这样,通过引入人体属性描述的文本信息作为辅助特征,避免了由于单一行人视觉特征不明显导致的误识别,从而提高了在复杂环境下人员重识别的准确性。
技术关键词
多模态信息辅助
图像特征向量
对象
重识别方法
图像特征提取
大语言模型
文本
场景
图像获取模块
Softmax函数
重识别技术
人体
融合特征
电子设备
视觉特征
存储器
识别装置