摘要
本发明涉及一种基于多模态语料库的英语翻译训练方法,所述方法包括:采集文本、语音、图像及上下文场景信息数据,构建多模态平行语料库,通过跨模态对齐技术生成增强型训练数据;采用动态采样策略,根据用户输入领域自动加权相关语料,优化领域适应性;设计混合损失函数,结合语义相似度、句法结构和跨模态一致性进行联合训练;引入在线反馈机制,通过用户纠错数据实时更新语料库和模型参数。本发明通过多模态语料库和动态训练策略,解决了传统翻译模型领域适应性差、数据依赖性强的问题,提升了翻译模型的准确性、鲁棒性和跨领域适应性。