视觉语言模型的遥感影像KNN检索方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
视觉语言模型的遥感影像KNN检索方法
申请号:CN202510058337
申请日期:2025-01-14
公开号:CN119942343B
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开了一种遥感影像在视觉语言模型中的KNN检索方法,包括五个步骤:S1数据预处理:将视觉语言测试数据集中的遥感影像数据集进行base64处理,文本数据集进行jsonl处理,处理后上传至数据库;S2影像文本序列化:对预处理后的数据集进行序列化以方便训练时随机读取;S3CLIP模型训练:将数据序列化后的数据送入视觉语言模型进行训练,得出训练模型;S4图文特征提取:将测试数据通过训练模型进行特征提取;S5KNN检索评估:将特征提取出来的文件进行KNN检索评估。本发明可以通过视觉语言测试数据集对KNN检索进行训练,并进行检索评估,以帮助快速、准确地从海量数据中检索出相关的或相似的内容。
技术关键词
检索方法 Sigmoid函数 视觉 注意力机制 监督学习方法 遥感影像数据 前馈神经网络 图文 文本 图像 切块 输出特征 编码 文件夹 索引 参数 内存 变量