基于语言引导网络的密集人群计数方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
基于语言引导网络的密集人群计数方法
申请号:
CN202411374172
申请日期:
2024-09-29
公开号:
CN119339323A
公开日期:
2025-01-21
类型:
发明专利
摘要
本发明涉及一种基于语言引导网络的密集人群计数方法,包括以下步骤:步骤S1:针对人群标签的点阵图进行转换,制作用于凸显前景与背景区域的真值密度图标签;步骤S2:迁移CLIP视觉语言模型至计数任务之中,并为其构建用于增强样本边界清晰程度的损失函数;步骤S3:通过多层次数量提示算法,在不损失计数精度的状况下节省模型训练开销,实现细粒度的计数;步骤S4:将预测密度图进行映射,获取该图片的预测人数。该方法有利于更高效、准确地区分图像的前景与背景,从而准确获取人群的具体人数。
技术关键词
计数方法
图像编码器
样本
文本编码器
密度
图像块
掩膜
网络
多层次
参数
标签
语义
像素点
视觉特征
定义
图片
解码器