摘要
本发明公开了一种基于意识判断的盲人眼镜目标识别方法,包括如下步骤:步骤一,通过双目或单目深度摄像头采集每秒F帧的图像序列,对其进行初步处理,用于后续目标分割与特征提取;步骤二,基于通用目标检测模型对每一帧图像进行目标检测,提取关键目标集合;步骤三,基于步骤提取的关键目标集合进行跨帧目标追踪;步骤四,识别出兴趣目标,并对兴趣目标进行排序;步骤五,将该目标的图像信息及其对应的完整轨迹特征Queue(ID)一并输入视觉语言模型。本发明的基于意识判断的盲人眼镜目标识别方法,能够通过实时图像分析与目标追踪,自动识别用户关注的兴趣目标,并基于语音/文本指令完成个性化反馈。