语音合成、模型训练方法、系统、设备、介质及程序产品
申请号:CN202411075188
申请日期:2024-08-06
公开号:CN119132274A
公开日期:2024-12-13
类型:发明专利
摘要
本申请提供一种语音合成、模型训练方法、系统、设备、介质及程序产品,语音合成方法包括:获取待处理的语音数据、用于描述说话风格的风格描述文本以及目标文字;通过语音合成模型,基于语音数据提取声音特征,并基于风格描述文本确定说话风格特征;基于声音特征以及说话风格特征,将目标文字转换为目标语音;输出目标语音。本申请可以提高语音合成的灵活性。
技术关键词
语义向量
风格
语音
样本
文本
语义特征提取
特征提取模块
编码
模型训练方法
计算机执行指令
数据
服务端
融合特征
噪声
客户端
处理器
可读存储介质
计算机程序产品
电子设备