一种基于大语言模型对抗训练的数据生成与模型优化方法及装置
申请号:CN202511184692
申请日期:2025-08-22
公开号:CN121009953A
公开日期:2025-11-25
类型:发明专利
摘要
本发明公开了一种基于大语言模型对抗训练的数据生成与模型优化方法及装置,涉及人工智能技术领域。所述方法包括:获取特定领域的真实训练数据集;分别微调第一和第二大语言模型以得到生成器与判别器;通过交替对抗训练优化生成器与判别器,生成器旨在生成以假乱真的合成数据,判别器旨在精准区分数据真伪;利用训练后的生成器产生高质量合成数据;融合真实与合成数据构建混合训练集;使用混合集微调目标模型,并评估其性能。所述装置包括数据获取、生成器、判别器、对抗训练控制、数据合成、目标模型训练及性能评估模块。本发明有效解决了特定领域标注数据稀缺问题,能生成高质量合成数据,显著提升目标模型在专业任务中的性能与泛化能力。
技术关键词
大语言模型
模型优化方法
模型训练模块
数据获取模块
机器学习模型
人工智能技术
优化装置
指令
处理器
存储器
训练集
标签
控制模块
有效性
语义
参数
专业
样本