语音合成、模型训练方法、系统、设备、介质及程序产品

申请号：CN202411075188

申请日期：2024-08-06

公开号：CN119132274A

公开日期：2024-12-13

类型：发明专利

摘要

本申请提供一种语音合成、模型训练方法、系统、设备、介质及程序产品，语音合成方法包括：获取待处理的语音数据、用于描述说话风格的风格描述文本以及目标文字；通过语音合成模型，基于语音数据提取声音特征，并基于风格描述文本确定说话风格特征；基于声音特征以及说话风格特征，将目标文字转换为目标语音；输出目标语音。本申请可以提高语音合成的灵活性。

技术关键词

语义向量风格语音样本文本语义特征提取特征提取模块编码模型训练方法计算机执行指令数据服务端融合特征噪声客户端处理器可读存储介质计算机程序产品电子设备