摘要
一种基于语法和语义特征融合的蒙汉神经机器翻译方法,针对蒙古语低资源环境下的翻译挑战,从语法特征建模、语义特征融合及动态优化三个方面进行改进,以提升翻译的准确性、流畅度和词汇泛化能力。利用卷积层和自注意力机制提取局部与全局语法信息,动态调整注意力权重来引导Transformer模型关注语法相关内容,提升语法一致性;使用BERT预训练模型提取上下文语义信息,并结合嵌入Mixup和层级Mixup策略优化编码表示,在解码端融合低层语言特征与高层语义信息,增强译文的语义表达能力;采用不同粒度子词分割方式,并引入一致性损失优化翻译结果,在译文生成阶段结合Top‑k和Top‑p采样策略提升词汇忠实度和多样性。本发明能提高低资源语言翻译的质量和适应能力。