一种语音合成方法、装置、终端设备及存储介质

申请号：CN202411937534

申请日期：2024-12-26

公开号：CN119993120B

公开日期：2025-10-03

类型：发明专利

摘要

本发公开了一种语音合成方法、装置、设备及存储介质，所述方法包括获取待处理的语音及文本数据并将其输入至目标语音合成模型中，以此获取对应声学特征和对应内容的目标合成语音数据；其中，目标语音合成模型的生成是在进行模型训练过程中，通过获取并根据教师语音合成模型和学生语音合成模型输出分布之间的相对熵，来调整学生语音合成模型的模型参数，并在相对熵达到第一预设阈值时，所对应的学生语音合成模型作为目标语音合成模型。通过实施本发明，能够确保目标语音合成模型的表达能力和生成质量的同时，还满足了用户的实时性需求。

技术关键词

训练文本数据声学特征学生语音特征教师文本编码器解码数据获取模块语义特征终端设备处理器声波存储器参数信号计算机

系统为您推荐了相关专利信息

基于门控注意力机制的语音合成方法、装置、设备及介质

符号注意力机制语音编码器序列文本编码器

语音检测处理方法及装置

情绪识别模型标记数据存储模块策略客服

一种轻量级异常心律检测方法

心律检测方法全局平均池化网络特征数字带阻滤波器学生

一种通用命令词识别模型的训练方法及装置

后处理模块校验模块自动语音识别学生命令

一种基于深度学习的石油管道泄漏监测与预警方法

石油管道泄漏监测编码器预警方法教师无监督学习方法