一种多模态检索方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种多模态检索方法及装置
申请号:CN202411615349
申请日期:2024-11-13
公开号:CN119150236B
公开日期:2025-02-21
类型:发明专利
摘要
本发明提供一种多模态检索方法及装置,涉及人工智能技术领域。所述方法包括:获取查询信息以及预设数据集;在文本空间中,基于查询信息与每个预设数据的匹配度,从预设数据集中确定多个第一候选数据;在多模态空间中,基于查询信息与每个预设数据在编码单元上的相似度,从预设数据集中确定多个第二候选数据;融合多个第一候选数据和多个第二候选数据,得到查询信息对应的查询结果。本发明将多模态数据映射至文本空间,利用文本进行检索,可提升多模态检索中文本处理能力,在多模态空间中利用数据在编码单元上的相似度进行搜索,可更好地理解不同模态的数据,进而可有效提升多模态检索的准确度。
技术关键词
数据 多模态检索方法 文本 编码向量 图像内物体 大语言模型 生成方式 序列 人工智能技术 检索装置 模板 编码器 语义 模块
系统为您推荐了相关专利信息
生成方法 大语言模型 自然语言生成技术 逻辑 策略
刀具磨损监测 刀具磨损状态 故障诊断模型 切削刀具 修复方法
订单撮合方法 智能匹配算法 动态 规模 智能匹配模块
光谱图像分类方法 矩阵 节点 图像分类技术 字典
智能生成方法 训练语料库 企业研发管理系统 企业画像 关系抽取模型