一种提升大语言模型长程深度搜索推理能力的方法和装置

申请号：CN202511033714

申请日期：2025-07-25

公开号：CN120973831A

公开日期：2025-11-18

类型：发明专利

摘要

本发明提出一种提升大语言模型长程深度搜索推理能力的方法和装置。本发明实施例的提升大语言模型长程深度搜索推理能力的方法，显著提升大语言模型在跨领域复杂问题中的长程检索推理能力，通过知识图谱驱动的高难度数据自动生成与三层难度筛选机制，结合监督微调与GRPO强化学习的两阶段训练策略，有效增强模型的多跳推理深度与外部工具调用的协同性。

技术关键词

大语言模型两阶段实体强化学习算法正确率策略答案轨迹语义知识图谱驱动节点教师样本动态模块复杂度数据学生