基于先验图谱的大模型检索方法、装置、设备及存储介质
申请号:CN202411930729
申请日期:2024-12-26
公开号:CN119357366B
公开日期:2025-05-16
类型:发明专利
摘要
本发明提供了一种基于先验图谱的大模型检索方法、装置、设备及存储介质,通过获取用户输入的问句,对问句进行重构以生成问题集合,并提取问题集合中每一子问题的核心关键词;接着,基于核心关键词生成检索语句,并根据检索语句从先验图谱数据库中提取相关节点;接着,根据相关节点的节点ID生成元数据筛选条件,并根据元数据筛选条件和相似度从预先构建的向量数据库中选取预设数量的向量库文档,最后,基于问题集合中每一子问题相对应的多个向量库文档进行排序,并通过截断算法对排序后的多个向量库文档进行截断,将处理后的文档按节点ID进行分组,并将同一节点的信息合成为完整文档。解决了RAG技术在检索过程中可能出现遗漏或不相关的内容。
技术关键词
模型检索方法
生成文档内容
节点
图谱
生成关系
关键词
语句
模型检索装置
核心
数据
标识
检索设备
可读存储介质
算法
重构
表达式
处理器
基础