训练数据构建方法及装置、大语言模型及电子设备

申请号：CN202510222735

申请日期：2025-02-26

公开号：CN120069083A

公开日期：2025-05-30

类型：发明专利

摘要

本说明书提供训练数据构建方法及装置、大语言模型及电子设备，所述训练数据构建方法包括：基于所述待微调模型的预训练数据生成包含错误信息的样本问题；为所述样本问题生成对应的样本答案，并将所述样本问题和对应的样本答案作为一个训练样本添加至训练数据。该方法所构建的训练数据中的训练样本内的样本问题包含错误信息，故据此对待微调模型进行微调后能够提高待微调模型的真实性，避免待微调模型出现幻觉问题；而且该方法所构建的训练数据中的训练样本内样本问题基于待微调模型的预训练数据构建，故据此对待微调模型进行微调不会涉及预训练阶段之外的知识，故微调后能够避免引入新的幻觉问题，从而进一步提高微调后的待微调模型的真实性。

技术关键词

数据构建方法答案样本生成提示信息大语言模型微调方法电子设备处理器指令计算机程序产品微调装置模块可读存储介质校正存储器阶段