模型训练方法、装置、电子设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
模型训练方法、装置、电子设备及存储介质
申请号:CN202510916094
申请日期:2025-07-03
公开号:CN120409744B
公开日期:2025-09-26
类型:发明专利
摘要
本申请公开了一种模型训练方法、装置、电子设备及计算机存储介质。其中,该模型训练方法包括:基于预设训练样本集中的第一训练样本集对初始基线模型进行监督微调,得到监督微调模型以及偏好数据样本;基于偏好数据样本对初始奖励模型进行优化训练,得到目标奖励模型,以及基于偏好数据样本对监督微调模型进行优化训练,得到偏好优化模型;基于偏好优化模型和第一训练样本集生成第一奖励信号,以及基于偏好优化模型、目标奖励模型和预设训练样本集中的第二训练样本集生成第二奖励信号;基于第一奖励信号、第二奖励信号以及第二训练样本集对偏好优化模型进行优化训练,得到目标对象生成式预训练模型。采用该方法能够提升模型的泛化能力。
技术关键词
预训练模型 训练样本数据 训练样本集 对象 模型训练方法 信号 计算机存储介质 基线 模型训练装置 无监督 度量 电子设备 指标 模块 交互方法 电商 参数 处理器