基于大模型的微调数据集生成方法、系统、计算机及介质
申请号:CN202411927487
申请日期:2024-12-25
公开号:CN119849611A
公开日期:2025-04-18
类型:发明专利
摘要
本发明公开了基于大模型的微调数据集生成方法、系统、计算机及介质,所述方法包括以下步骤:S1:根据预训练的大语言模型,利用交叉变异算法构建若干提示词生成器;S2:向提示词生成器输入条件指令,输出第一提示集;S3:利用随机性增强器对所述第一提示集中的每一个提示进行随机增强,得到增强提示集;S4:在大语言模型中运行增强提示集,得到微调数据集。本发明通过提示词生成器,能够自动生成提示词;通过向提示词生成器输入条件指令,从而能够按照需求输出对应的提示集;通过随机增强器,能够对提示集中的提示词进行增强,防止提示词生成器在同一个领域崩塌成单一模式,提高提示词在大语言模型中输出结果的多样性。
技术关键词
生成方法
子模块
指令
大语言模型
数据
分词
生成系统
算法
生成提示词
格式模板
计算机装置
处理器
文本
可读存储介质
存储器
主题
校正