一种多模态检索增强生成方法、设备及介质

申请号：CN202510064620

申请日期：2025-01-15

公开号：CN119961382A

公开日期：2025-05-09

类型：发明专利

摘要

本申请公开了一种多模态检索增强生成方法、设备及介质，属于数据处理的技术领域。方法包括连接多个文档数据库，并基于多个所述文档数据库构建特征向量知识库；获取用户提问；其中，所述用户提问包括输入问题和输入图像；基于预设的图像特征向量编码模型处理所述输入图像和特征向量知识库，以确定相关文档集；基于预设的语义模型处理所述用户输入问题和所述相关文档集，以确定目标文档；基于预设的多模态大模型处理所述用户提问、相关文档集和目标文档，以生成文档答案。本申请通过上述方法提高了视觉问答模态理解、泛化和跨模态融合能力。

技术关键词

图像特征向量多模态生成文档生成方法文本特征向量语义计算机可执行指令图像块编码注意力机制字词视觉计算机存储介质生成答案生成设备处理器通信习惯

系统为您推荐了相关专利信息

基于多模态大模型的机器人控制法

多模态传感器 sigmoid函数策略频谱特征长短期记忆网络

一种心脏多模态影像特征提取方法、装置、设备、介质及产品

影像特征提取方法多模态特征数据库图像块特征深度学习算法

一种基于多模态影像融合技术的人脑血管全自动重建方法

影像融合技术多模态 Softmax函数分支深度神经网络

近视干预训练图像生成方法、装置和AR设备

图像生成方法 AR设备显示模组边缘检测 Laplace算子

一种基于认知共情增强的人机双向理解系统及其实现方法

理解系统多模态特征融合人机动态更新识别模块