基于语言引导网络的密集人群计数方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于语言引导网络的密集人群计数方法
申请号:CN202411374172
申请日期:2024-09-29
公开号:CN119339323A
公开日期:2025-01-21
类型:发明专利
摘要
本发明涉及一种基于语言引导网络的密集人群计数方法,包括以下步骤:步骤S1:针对人群标签的点阵图进行转换,制作用于凸显前景与背景区域的真值密度图标签;步骤S2:迁移CLIP视觉语言模型至计数任务之中,并为其构建用于增强样本边界清晰程度的损失函数;步骤S3:通过多层次数量提示算法,在不损失计数精度的状况下节省模型训练开销,实现细粒度的计数;步骤S4:将预测密度图进行映射,获取该图片的预测人数。该方法有利于更高效、准确地区分图像的前景与背景,从而准确获取人群的具体人数。
技术关键词
计数方法 图像编码器 样本 文本编码器 密度 图像块 掩膜 网络 多层次 参数 标签 语义 像素点 视觉特征 定义 图片 解码器