摘要
本发明涉及语音合成技术领域,公开了一种语音合成方法、装置、计算机设备及存储介质,其方法通过获取参考语音数据和待合成文本;通过预设韵律编码器对参考语音数据进行编码处理,获得韵律嵌入向量;通过预设语音识别模型对参考语音数据进行特征提取处理,获得补偿特征向量;通过预设韵律补偿编码器对补偿特征向量进行编码处理,获得韵律补偿向量;对韵律嵌入向量和韵律补偿向量进行融合,获得韵律特征向量;通过预设语音合成模型对待合成文本和韵律特征向量进行合成处理,生成目标合成语音。本发明通过韵律嵌入和韵律补偿辅助语音合成,减小了韵律信息的损失,提高了语音合成效果,在金融服务业务场景中体现智能化和人性化服务,提升用户体验。