一种用于RAG的多级知识库构造方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种用于RAG的多级知识库构造方法
申请号:CN202510955436
申请日期:2025-07-11
公开号:CN120874989A
公开日期:2025-10-31
类型:发明专利
摘要
本发明特别涉及一种用于RAG的多级知识库构造方法。该用于RAG的多级知识库构造方法,文档分片后将一级分片存入一级知识库;一级分片合并得到二级分片,存入二级知识库;依此类推,直到不能再合并或者存完所有级别的知识库;逐级进行检索和计算,直到检索到x级知识库中的分片向量与查询向量的距离超出自定义阈值,则停止检索和计算,确定在x‑1级知识库中找到的分片为语义最相关的最大片段;当有新文档添加时,对各级知识库增量更新;在对文档进行修改或删除操作后,同步更新各级知识库。该用于RAG的多级知识库构造方法,提高了检索效率,增强了系统适应性、稳定性和可靠性,使大模型能够生成更准确、完整且相关的回答。
技术关键词
分片 向量检索技术 知识库构造 增量更新 数据更新 可读存储介质 存储计算机程序 语义 信息检索 数据同步 处理器 分割器 字符 动态 模块 存储器 文本 场景