摘要
本发明属于数据生成技术领域,公开了一种面向分类任务的基于大小模型协同的数据生成方法,包括步骤1、收集原始数据集;步骤2、确定生成数据规模;步骤3、利用大语言模型生成新的生成数据;步骤4、校验生成新的生成数据的逻辑一致性;步骤5、对新的生成数据质量评分,形成仅针对新的生成数据的综合评分;步骤6、基于原始训练数据集和新的生成数据进行小模型训练。本申请实现数据生成的精准化与自适应调整,从源头上杜绝低质量数据流入训练环节,实现对生成数据的精准量化评分,通过阶段适配的规则调整实现合成数据的精准应用。