一种基于文本引导的遥感图像细粒度目标识别方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于文本引导的遥感图像细粒度目标识别方法
申请号:CN202510223380
申请日期:2025-02-27
公开号:CN120182573A
公开日期:2025-06-20
类型:发明专利
摘要
一种基于文本引导的遥感图像细粒度目标识别方法,提出一种自动化生成类别描述文本的方法,使用大语言模型和提示词获取类别描述文本;一种提示词模板的构造方法,结合数据集类别标签生成面向细粒度类别的提示词;一个图文交互模块,通过多种特征提取方法将图像特征映射至同一特征空间,与类别文本特征进行交互,通过余弦相似度和加权融合的方式突出细粒度类别特征。本发明使用大语言模型和提示词获取类别描述文本,使用类别描述文本引导检测器,提升遥感图像细粒度目标识别精度。
技术关键词
大语言模型 文本编码器 图像 检测器组件 识别方法 特征提取方法 全局平均池化 注意力 图文 标签 模板 优化器 网络 分支 模块 数据