基于智能体模拟教学场景的数学推理数据合成方法及系统
申请号:CN202510302608
申请日期:2025-03-14
公开号:CN120297407B
公开日期:2025-12-16
类型:发明专利
摘要
本发明提供了一种基于智能体模拟教学场景的数学推理数据合成方法及系统,涉及大语言模型技术领域,方法包括:获取公开的思维链数据集,将待提升数学推理能力的大语言模型在思维链数据集上进行推理,得到大语言模型在每个问题上的错误率;创建多角色智能体,利用教师智能体分析大语言模型解析错误的问题;基于错误率和预设的数据集规模得到每个问题的预期推理数据量;利用多角色智能体模拟多类教学场景,并将多类教学场景中的对话数据转换成与所述思维链数据集格式相同的数据,合成得到预期推理数据量的数学推理数据集。本发明有效解决了目前类比人类学习的推理数据合成方法存在高建设成本、低质量密度及严重的数据同质化问题。
技术关键词
教学场景
大语言模型
数学
数据
错误率
规模
教师
格式
存储器
处理器
思路
人类
密度
参数