翻译模型的训练方法、文本翻译方法及生成模型的训练方法

申请号：CN202510464605

申请日期：2025-04-14

公开号：CN120387527A

公开日期：2025-07-29

类型：发明专利

摘要

本申请涉及一种翻译模型的训练方法、文本翻译方法及生成模型的训练方法。该方法包括：将第一语言的训练文本输入至初始翻译模型中，得到模型输出文本，模型输出文本包括第二语言的模型翻译文本；基于模型输出文本的格式得到模型输出文本对应的格式奖励，格式奖励用于表征模型输出文本是否符合预定格式；基于训练文本和模型翻译文本得到模型翻译文本对应的度量奖励，度量奖励用于表征模型翻译文本的翻译质量；根据格式奖励和度量奖励，得到目标奖励；基于目标奖励和预设强化学习算法对初始翻译模型进行训练，得到目标翻译模型。该训练方法中，采用格式和度量的混合奖励方式，为强化学习提供信息丰富且有效的指导信号，能够提高翻译模型的翻译质量。

技术关键词

翻译模型度量强化学习算法格式文本翻译方法数据训练装置模块翻译装置计算机程序产品处理器计算机设备可读存储介质存储器分段数值指令参数