基于大模型的实时语音翻译方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于大模型的实时语音翻译方法及系统
申请号:CN202510917992
申请日期:2025-07-03
公开号:CN120690199A
公开日期:2025-09-23
类型:发明专利
摘要
本申请实施例提供了一种基于大模型的实时语音翻译方法及系统,属于自然语言技术领域。该方法包括:获取原始语音数据并进行特征提取,得到语音帧特征序列。将语音帧特征序列输入至韵律边界识别模型,得到边界置信度序列。根据边界置信度序列和切分阈值对原始语音数据进行语段切分,得到候选语段集合。根据候选语段集合进行语音识别,得到文本转写序列集合;其中,文本转写序列集合包括多个文本转写序列。根据语义密度评分函数对文本转写序列进行评分,得到语义密度评分。根据语义密度评分在文本转写序列集合中进行选取,得到输入文本序列集合。将输入文本序列集合输入至翻译模型,得到翻译结果,提高了实时语音翻译的准确性。
技术关键词
文本 序列 实时语音 翻译方法 翻译模型 语义 密度 自然语言技术 语音识别模块 数据 可读存储介质 翻译系统 电子设备 处理器 存储器 计算机 参数