摘要
本申请实施例提供了一种语音转换模型训练方法、装置、计算机设备及存储介质,属于人工智能技术领域。包括:获取样本语音以及样本语音的样本音色特征和样本文本特征,获取参考语音的参考语音特征和参考音色特征;将样本语音输入到训练后的编码子模型中,输出样本语音的样本语音特征;将样本语音特征、样本文本特征和样本音色特征正向输入到可逆生成子模型中,输出目标文本特征,并确定目标文本特征和样本文本特征之间的第一损失值;将目标文本特征和参考音色特征逆向输入到可逆生成子模型中,输出目标语音特征,并确定目标语音特征和参考语音特征之间的第二损失值;根据第一损失值和第二损失值对可逆生成子模型迭代,得到训练后的可逆生成子模型。