用于人群计数的多维动态感知和渐进式聚焦网络模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
用于人群计数的多维动态感知和渐进式聚焦网络模型
申请号:CN202511035742
申请日期:2025-07-25
公开号:CN120976848A
公开日期:2025-11-18
类型:发明专利
摘要
本申请提出了一种用于人群计数的多维动态感知和渐进式聚焦网络模型,涉及计算机视觉技术领域,包括:前端子网络,用于对预处理后的输入图像进行浅层图像特征提取,获得图像浅层特征;主体子网络,用于基于图像浅层特征实现多分支特征交互,生成深层特征和跨层特征,对深层特征和跨层特征进行交叉注意力处理和多尺度特征融合,对融合后的特征进行跨维度的注意力建模,并经层归一化输出深度特征;后端子网络,用于对深度特征进行高维特征构建与空间分辨率调整获得中间特征,对中间特征进行特征优化,并进行注意力融合与密度解码,输出密度图和目标注意力图。通过上述网络模型可以实现广域场景的人群计数。
技术关键词
注意力 网络模型训练方法 融合特征 子模块 结构组 动态 跨层特征 多分支 特征提取模块 通道 输出特征 密度 图像特征提取 解码模块 压缩特征 Sigmoid函数 空间权重矩阵