翻译模型的训练方法、文本翻译方法及生成模型的训练方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
翻译模型的训练方法、文本翻译方法及生成模型的训练方法
申请号:CN202510464605
申请日期:2025-04-14
公开号:CN120387527A
公开日期:2025-07-29
类型:发明专利
摘要
本申请涉及一种翻译模型的训练方法、文本翻译方法及生成模型的训练方法。该方法包括:将第一语言的训练文本输入至初始翻译模型中,得到模型输出文本,模型输出文本包括第二语言的模型翻译文本;基于模型输出文本的格式得到模型输出文本对应的格式奖励,格式奖励用于表征模型输出文本是否符合预定格式;基于训练文本和模型翻译文本得到模型翻译文本对应的度量奖励,度量奖励用于表征模型翻译文本的翻译质量;根据格式奖励和度量奖励,得到目标奖励;基于目标奖励和预设强化学习算法对初始翻译模型进行训练,得到目标翻译模型。该训练方法中,采用格式和度量的混合奖励方式,为强化学习提供信息丰富且有效的指导信号,能够提高翻译模型的翻译质量。
技术关键词
翻译模型 度量 强化学习算法 格式 文本翻译方法 数据 训练装置 模块 翻译装置 计算机程序产品 处理器 计算机设备 可读存储介质 存储器 分段 数值 指令 参数