基于大模型的微调数据集生成方法、系统、计算机及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于大模型的微调数据集生成方法、系统、计算机及介质
申请号:CN202411927487
申请日期:2024-12-25
公开号:CN119849611A
公开日期:2025-04-18
类型:发明专利
摘要
本发明公开了基于大模型的微调数据集生成方法、系统、计算机及介质,所述方法包括以下步骤:S1:根据预训练的大语言模型,利用交叉变异算法构建若干提示词生成器;S2:向提示词生成器输入条件指令,输出第一提示集;S3:利用随机性增强器对所述第一提示集中的每一个提示进行随机增强,得到增强提示集;S4:在大语言模型中运行增强提示集,得到微调数据集。本发明通过提示词生成器,能够自动生成提示词;通过向提示词生成器输入条件指令,从而能够按照需求输出对应的提示集;通过随机增强器,能够对提示集中的提示词进行增强,防止提示词生成器在同一个领域崩塌成单一模式,提高提示词在大语言模型中输出结果的多样性。
技术关键词
生成方法 子模块 指令 大语言模型 数据 分词 生成系统 算法 生成提示词 格式模板 计算机装置 处理器 文本 可读存储介质 存储器 主题 校正