摘要
本申请公开了一种语音转换模型的训练方法、语音转换方法、及其装置、电子设备、以及计算机可读存储介质。所述训练方法包括:获取多个音频训练数据,并提取第一特征训练数据和第二特征训练数据;获取音频训练数据对应的梅尔谱图,并获得梅尔谱图对应的掩码梅尔图片和噪声梅尔谱图;将音频训练数据对应的第一特征训练数据、第二特征训练数据、掩码梅尔谱图、以及噪声梅尔谱图输入待训练的语音转换模型,获得预测梅尔谱图;根据梅尔谱图和预测梅尔谱图,对待训练的语音转换模型进行模型参数调整,获得训练后的语音转换模型。该方法解决了现有技术存在的因无法兼顾音色相似度、噪声鲁棒性和表现力,导致语音转换效果不佳的技术问题。