基于词粒度对齐的大模型上下文学习机器翻译方法

申请号：CN202510829731

申请日期：2025-06-20

公开号：CN120893450A

公开日期：2025-11-04

类型：发明专利

摘要

本发明提供基于词粒度对齐的大模型上下文学习机器翻译方法，涉及自然语言处理领域，本发明包括：外部知识辅助阶段，对源文本词汇对齐集合进行多层次检索匹配；大模型翻译阶段，得到大模型翻译集合，将大模型翻译集合作为候选翻译之一；后选择阶段，将获取的源文本词对齐集合和外部字典词对齐集合、实体库对齐集合、辅助翻译集合的嵌入表征、大模型翻译集合分别进行多次的相似度计算打分，根据相似度得分进行筛选以得到候选词对齐集合；根据任务设计提示模板，将源文本词对齐集合和候选词对齐集合放到提示模板中，通过高度对齐的外部词对齐集合供大模型上下文学习生成最佳翻译结果；本发明在缓解了大模型在低资源环境下各种翻译错误。

技术关键词

机器翻译方法语法结构机器翻译模型文本双语对齐语料实体字典模板在线学习机制子模块多层次词向量表征阶段动态更新语义无监督检索策略结构封装编码器