翻译模型的训练方法、文本翻译方法及生成模型的训练方法
申请号:CN202510464605
申请日期:2025-04-14
公开号:CN120387527A
公开日期:2025-07-29
类型:发明专利
摘要
本申请涉及一种翻译模型的训练方法、文本翻译方法及生成模型的训练方法。该方法包括:将第一语言的训练文本输入至初始翻译模型中,得到模型输出文本,模型输出文本包括第二语言的模型翻译文本;基于模型输出文本的格式得到模型输出文本对应的格式奖励,格式奖励用于表征模型输出文本是否符合预定格式;基于训练文本和模型翻译文本得到模型翻译文本对应的度量奖励,度量奖励用于表征模型翻译文本的翻译质量;根据格式奖励和度量奖励,得到目标奖励;基于目标奖励和预设强化学习算法对初始翻译模型进行训练,得到目标翻译模型。该训练方法中,采用格式和度量的混合奖励方式,为强化学习提供信息丰富且有效的指导信号,能够提高翻译模型的翻译质量。
技术关键词
翻译模型
度量
强化学习算法
格式
文本翻译方法
数据
训练装置
模块
翻译装置
计算机程序产品
处理器
计算机设备
可读存储介质
存储器
分段
数值
指令
参数