一种多模态检索增强生成方法、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种多模态检索增强生成方法、设备及介质
申请号:CN202510064620
申请日期:2025-01-15
公开号:CN119961382A
公开日期:2025-05-09
类型:发明专利
摘要
本申请公开了一种多模态检索增强生成方法、设备及介质,属于数据处理的技术领域。方法包括连接多个文档数据库,并基于多个所述文档数据库构建特征向量知识库;获取用户提问;其中,所述用户提问包括输入问题和输入图像;基于预设的图像特征向量编码模型处理所述输入图像和特征向量知识库,以确定相关文档集;基于预设的语义模型处理所述用户输入问题和所述相关文档集,以确定目标文档;基于预设的多模态大模型处理所述用户提问、相关文档集和目标文档,以生成文档答案。本申请通过上述方法提高了视觉问答模态理解、泛化和跨模态融合能力。
技术关键词
图像特征向量 多模态 生成文档 生成方法 文本特征向量 语义 计算机可执行指令 图像块 编码 注意力机制 字词 视觉 计算机存储介质 生成答案 生成设备 处理器通信 习惯
系统为您推荐了相关专利信息
多模态传感器 sigmoid函数 策略 频谱特征 长短期记忆网络
影像特征提取方法 多模态 特征数据库 图像块特征 深度学习算法
影像融合技术 多模态 Softmax函数 分支 深度神经网络
图像生成方法 AR设备 显示模组 边缘检测 Laplace算子
理解系统 多模态特征融合 人机 动态更新 识别模块