基于大模型的数学问题推理轨迹的生成方法和系统、设备
申请号:CN202510827622
申请日期:2025-06-20
公开号:CN120354952A
公开日期:2025-07-22
类型:发明专利
摘要
本申请提供了一种基于大模型的数学问题推理轨迹的生成方法和系统、设备,涉及人工智能技术领域。该方法将目标数学问题作为根节点,构建多层级推理树,利用蒙特卡洛树搜索算法进行路径搜索,搜索目标数学问题的推理轨迹,在搜索的过程中,针对每一层级上的多个候选解答步骤,采用概率路线图预测该层级上的各个候选解答步骤的探索概率;基于预测的各个候选解答步骤的探索概率,选取目标解答步骤作为采样节点进入到下一层级的搜索,最后生成目标数学问题的推理轨迹提供给用户。本实施例通过概率路线图的指导和蒙特卡洛树搜索算法的搜索策略,能够在第一轮迭代中快速找到高质量的目标数学问题的推理轨迹,显著提高推理轨迹的生成效率和质量。
技术关键词
概率路线图
数学
蒙特卡洛树
搜索算法
轨迹
节点
生成方法
层级
训练样本集
损失函数优化
微调方法
策略
基础
人工智能技术
计算机程序产品
生成系统
定义
解析单元
指令
参数