模型训练、数据处理方法、装置、设备、介质及程序产品

申请号：CN202410854789

申请日期：2024-06-27

公开号：CN119128511A

公开日期：2024-12-13

类型：发明专利

摘要

本申请实施例提供了一种模型训练、数据处理方法、装置、设备、介质及程序产品，用于提高模型的准确性并实现模型在多轮自对齐的过程中不崩塌。可应用于人工智能领域。包括：获取N个训练问答数据集、问题示例集、验证集和初始模型；利用第一训练问答数据集和问题示例集对初始模型进行训练得到第一模型，第一训练问答数据集包含于N个训练问答数据集；利用验证集对第一模型进行验证处理得到崩塌概率值；在崩塌概率值小于阈值时，利用不同于第一训练问答数据集的第二训练问答数据集和问题示例集对第一模型进行训练得到第二模型；利用验证集对第二模型进行验证处理以更新崩塌概率值；重复上述操作直至崩塌概率值大于或者等于阈值，输出目标模型。

技术关键词

数据处理方法总线系统时效性模型训练装置处理器模型训练方法存储器数据处理装置计算机程序产品计算机设备输出模块可读存储介质参数指令