摘要
本申请公开了一种基于大模型的端侧翻译方法、装置、设备及存储介质,涉及模型优化技术领域,本申请的方法包括:获取目标应用场景的翻译语料库,所述目标应用场景为移动终端侧翻译场景;根据所述翻译语料库对预训练模型进行训练,得到端侧翻译模型;根据预设裁剪策略对所述端侧翻译模型进行结构化裁剪,得到轻量化模型;根据预设部署策略部署所述轻量化模型,并根据所述轻量化模型对输入文本进行翻译。本申请通过数据收集、模型训练、结构化裁剪及量化部署策略,完成了将大模型端侧翻译落地到移动终端中,解决了网络延迟、数据隐私以及端侧资源限制问题,提高了翻译的即时性和准确性。