基于大模型的实时语音翻译方法及系统

申请号：CN202510917992

申请日期：2025-07-03

公开号：CN120690199A

公开日期：2025-09-23

类型：发明专利

摘要

本申请实施例提供了一种基于大模型的实时语音翻译方法及系统，属于自然语言技术领域。该方法包括：获取原始语音数据并进行特征提取，得到语音帧特征序列。将语音帧特征序列输入至韵律边界识别模型，得到边界置信度序列。根据边界置信度序列和切分阈值对原始语音数据进行语段切分，得到候选语段集合。根据候选语段集合进行语音识别，得到文本转写序列集合；其中，文本转写序列集合包括多个文本转写序列。根据语义密度评分函数对文本转写序列进行评分，得到语义密度评分。根据语义密度评分在文本转写序列集合中进行选取，得到输入文本序列集合。将输入文本序列集合输入至翻译模型，得到翻译结果，提高了实时语音翻译的准确性。

技术关键词

文本序列实时语音翻译方法翻译模型语义密度自然语言技术语音识别模块数据可读存储介质翻译系统电子设备处理器存储器计算机参数