数据空间中语义与向量融合的跨模态检索方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
数据空间中语义与向量融合的跨模态检索方法
申请号:CN202510401702
申请日期:2025-04-01
公开号:CN120386902A
公开日期:2025-07-29
类型:发明专利
摘要
本发明提出了数据空间中语义与向量融合的跨模态检索方法,属于跨模态信息检索领域,首先收集并预处理多模态数据;利用预训练模型生成模态嵌入并存储;构建共享语义空间,通过对比学习优化跨模态向量对齐,设计模态映射网络增强嵌入投射效果;使用Milvus数据库存储对齐后的嵌入,构建HNSW索引;处理用户文本或图像查询,文本查询解析限定条件生成增强嵌入,图像查询通过OCR提取文字并与图像特征融合生成嵌入;在数据库中通过条件筛选与语义相似度计算,检索Top‑K候选项;对候选结果进行多模态相关性排序并返回结果;本发明构建共享语义空间,优化不同模态嵌入的对齐效果,进行多模态嵌入的高效存储与索引管理,实现大规模跨模态数据的实时检索。
技术关键词
模态检索方法 文本 预训练模型 图像 BERT模型 跨模态信息检索 音频 索引机制 融合多模态特征 自然语言 视频 检索系统 语义向量 跨模态数据 网络