基于误差外推与推理链分析的训练数据合成方法、设备、介质及程序产品
申请号:CN202511122425
申请日期:2025-08-12
公开号:CN120611192B
公开日期:2025-10-17
类型:发明专利
摘要
本申请提供一种基于误差外推与推理链分析的训练数据合成方法、设备、介质及程序产品,包括:获取初始样本集合;利用小语言模型对每个任务样本的问题进行多次采样推理,生成多个推理链;基于预设误差评估规则计算每个推理链的整体误差评分,确定待修正推理链;将待修正推理链与对应问题一并输入至大语言模型中,生成经修正的回答;将问题与经修正的回答构成新任务样本,对小语言模型进行部分参数微调;重复执行上述流程,直至模型在任务测评集上的性能指标变化率低于预设阈值,输出最终任务样本;将多个最终任务样本构成训练样本集,对小语言模型进行全参数微调。本申请以模型误差为导向构建训练数据自我优化路径,提升了语义一致性与数据有效性。
技术关键词
节点
有向无环图
计算机程序指令
大语言模型
训练样本集
数据
动态
语义
置信度阈值
模型误差
逻辑
计算机程序产品
处理器
电子设备
答案
自然语言
参数