摘要
本发明涉及基于语音大模型的老挝语‑英语混合语言语音合成方法,属于自然语言处理技术领域。老挝由于其独特的经济背景、地理位置以及历史因素,使其语言面临着文本中存在许多英语词汇,针对在单语语音数据的情况下,老挝语中的英语词汇难以准确发音的问题,本发明提出了一种基于语音大模型的老挝语‑英语混合语言语音合成方法,主要包括融合不同语言的统一潜在空间的混合语言语音大模型构建、融入老挝语语言ID、老挝语‑英语混合语言语音合成三部分。本发明使合成的混合语言语音不仅能在语音质量上达到较高的自然度,还能够有效应对不同语言的发音差异,使得在语言切换时的合成语音听起来更加流畅。