一种基于多模态图像的拥挤检测方法及装置

申请号：CN202510534093

申请日期：2025-04-27

公开号：CN120279491A

公开日期：2025-07-08

类型：发明专利

摘要

本发明公开一种基于多模态图像的拥挤检测方法及装置，涉及目标检测技术领域，本方法通过采集真实地铁场景内摄像头录制的视频，获得初始视频数据，并通过处理构建图像库；通过对设定拥挤程度的图像进行文本描述，并输入文本库，完成文本信息初始化；通过设定卷积神经网络对所述图像库中的图像进行特征提取，获得图像特征向量；通过设定文本编码器对所述文本库中的所述文本信息进行特征提取，获得文本特征向量；通过CLIP多模态模型生成多模态特征表示；设置基础判断参数；基于所述基础判断参数，通过多模态拥挤检测模型对所述多模态特征表示进行检测处理，输出检测结果。本发明能够分区域，快速、准确的对拥挤度识别和检测。

技术关键词

图像特征向量多模态特征文本编码器文本特征向量地铁场景图像库样本图像嵌入视频参数表达式基础模块数据切片关系标签

系统为您推荐了相关专利信息

基于生成对抗网络的配电网故障预测与重构优化方法

重构优化方法故障预测模型配电网故障故障传播路径配电网运行数据

一种基于混合专家理论的跨模态单目深度估计方法及系统

单目深度估计方法图像编码器深度编码器图像视觉特征语义

双目图像编码方法及装置、存储介质、计算机程序产品

图像纹理特征双目摄像头图像编码方法非易失性存储介质编码预测技术

目标识别方法、装置、系统、电子设备及存储介质

图像特征提取多模态特征特征提取模块适配器输出模块

一种基于大数据的区域动物防疫体系评估方法及系统

体系评估方法兽医可视化人机交互随机森林动物疫病监测