基于大语言模型的自动化长文本微调指令集构建方法

申请号：CN202510119646

申请日期：2025-01-24

公开号：CN120181045A

公开日期：2025-06-20

类型：发明专利

摘要

本发明提供一种基于大语言模型的自动化长文本微调指令集构建方法，包括：获取输入文本，采用递归字符分割法对输入文本进行分割，生成段落集合；针对生成的段落集合，大语言模型根据任务类型通过预设的问题类型集合和提示模板，采用自我指导学习方法生成问题集合和答案集合；基于生成的问题集合和答案集合生成指令集，多维度评估指令集的质量，根据评估结果对指令集进行优化得到优化后的指令集。本发明能够自动生成高质量的长文本微调指令集，以提高大语言模型的性能，同时解决长上下文处理的挑战。通过自动化构建长文本微调指令集，减少了人工标注的需求，降低了成本，同时提高了微调过程的效率和模型的长文本处理能力。

技术关键词

大语言模型文本段落学习方法模板生成答案种子非暂态计算机可读存储介质字符处理器切割模块计算机程序产品分段存储器定义电子设备指令