基于语言模型知识蒸馏的藏汉神经机器翻译系统构建方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于语言模型知识蒸馏的藏汉神经机器翻译系统构建方法
申请号:CN202410916486
申请日期:2024-07-09
公开号:CN119358567A
公开日期:2025-01-24
类型:发明专利
摘要
本发明公开一种基于语言模型知识蒸馏的藏汉神经机器翻译系统构建方法,适用于人工智能及机器翻译领域。包括:S1、收集藏汉双语语料及藏汉单语语料,并进行预处理;S2、选取神经机器翻译模型作为学生模型,使用藏汉双语语料训练学生模型;S3、选取单语语言模型作为教师模型,使用汉藏单语语料训练教师模型;S4、对学生模型进行蒸馏训练,使学生模型输出概率拟合教师模型输出概率;S5、针对学生模型,计算生成译文与参考译文的差异,迭代训练及参数优化。本发明利用单语语言模型指导神经机器翻译模型进行训练,教师模型只参与学生模型训练,不参与翻译解码,可以提升解码速度,降低资源及存储需求,有利于部署到计算资源受限的平台中。
技术关键词
神经机器翻译系统 机器翻译模型 学生 蒸馏 双语语料 教师 爬取技术 生成译文 预训练模型 计算资源受限 噪声数据 文本 分词 解码器 训练集 编码器