一种提升大语言模型长程深度搜索推理能力的方法和装置
申请号:CN202511033714
申请日期:2025-07-25
公开号:CN120973831A
公开日期:2025-11-18
类型:发明专利
摘要
本发明提出一种提升大语言模型长程深度搜索推理能力的方法和装置。本发明实施例的提升大语言模型长程深度搜索推理能力的方法,显著提升大语言模型在跨领域复杂问题中的长程检索推理能力,通过知识图谱驱动的高难度数据自动生成与三层难度筛选机制,结合监督微调与GRPO强化学习的两阶段训练策略,有效增强模型的多跳推理深度与外部工具调用的协同性。
技术关键词
大语言模型
两阶段
实体
强化学习算法
正确率
策略
答案
轨迹
语义
知识图谱驱动
节点
教师
样本
动态
模块
复杂度
数据
学生