复杂场景下基于多模态信息辅助的人员重识别方法、装置和电子设备

申请号：CN202411062100

申请日期：2024-08-05

公开号：CN118570846B

公开日期：2024-10-29

类型：发明专利

摘要

本申请涉及人员重识别技术领域，其具体地公开了一种复杂场景下基于多模态信息辅助的人员重识别方法、装置和电子设备，其首先对不同摄像头视角下的两张行人图像分别进行人体属性分析，通过大语言模型分别生成对应的人体属性全方位描述文本，随后将文本的语义编码特征与行人图像通过传统reid模型提取出的行人图像特征进行融合，以构建行人的多模态信息交互融合特征表示，进而以这种多模态信息交互融合特征表示作为相似度计算的依据，来识别两张图像中的行人对象是否为同一人。这样，通过引入人体属性描述的文本信息作为辅助特征，避免了由于单一行人视觉特征不明显导致的误识别，从而提高了在复杂环境下人员重识别的准确性。

技术关键词

多模态信息辅助图像特征向量对象重识别方法图像特征提取大语言模型文本场景图像获取模块 Softmax函数重识别技术人体融合特征电子设备视觉特征存储器识别装置