面向分类任务的基于大小模型协同的数据生成方法

申请号：CN202511317553

申请日期：2025-09-16

公开号：CN120822037B

公开日期：2025-11-11

类型：发明专利

摘要

本发明属于数据生成技术领域，公开了一种面向分类任务的基于大小模型协同的数据生成方法，包括步骤1、收集原始数据集；步骤2、确定生成数据规模；步骤3、利用大语言模型生成新的生成数据；步骤4、校验生成新的生成数据的逻辑一致性；步骤5、对新的生成数据质量评分，形成仅针对新的生成数据的综合评分；步骤6、基于原始训练数据集和新的生成数据进行小模型训练。本申请实现数据生成的精准化与自适应调整，从源头上杜绝低质量数据流入训练环节，实现对生成数据的精准量化评分，通过阶段适配的规则调整实现合成数据的精准应用。

技术关键词

数据生成方法大语言模型标签周期样本阶段数据一致性校验数据生成技术策略逻辑基础权重模型生成参数有效性验证方法因子指标序列决策