摘要
本申请公开了一种层级语义驱动的检索增强生成方法及系统,通过构建以文档章节标题为基础的树状层级结构,有效保留了文档的天然层级关系和语义边界,采用递归语义边界拆分策略,细化过长文本节点,既保证了语义的完整性,又满足了模型输入长度限制,避免了语义信息的丢失。同时,通过大语言模型实现节点知识点提取与摘要生成,结合自上而下的多级标题路径传递和自下而上的内容聚合,增强了节点的结构感知和语义表达能力,在检索阶段,基于查询与节点语义表示的相似度分布,动态计算自适应检索阈值,替代固定top‑k检索策略,实现对不同查询和层级节点的智能筛选,平衡了信息覆盖和冗余抑制,显著提升检索效率和准确率。