摘要
本发明特别涉及一种用于RAG的多级知识库构造方法。该用于RAG的多级知识库构造方法,文档分片后将一级分片存入一级知识库;一级分片合并得到二级分片,存入二级知识库;依此类推,直到不能再合并或者存完所有级别的知识库;逐级进行检索和计算,直到检索到x级知识库中的分片向量与查询向量的距离超出自定义阈值,则停止检索和计算,确定在x‑1级知识库中找到的分片为语义最相关的最大片段;当有新文档添加时,对各级知识库增量更新;在对文档进行修改或删除操作后,同步更新各级知识库。该用于RAG的多级知识库构造方法,提高了检索效率,增强了系统适应性、稳定性和可靠性,使大模型能够生成更准确、完整且相关的回答。