摘要
本公开关于语音表征模型训练方法、装置及相关设备,该方法包括获取样本文本、对应的样本梅尔谱及对应的样本音素序列;通过初始模型的音素编码器对样本音素序列进行编码得到样本音素特征;通过初始模型的语音编码器对样本梅尔谱进行编码得到样本语音特征;对样本语音特征进行量化得到样本语音量化特征;对样本梅尔谱进行截取得到提示梅尔谱;通过初始模型的提示编码器对提示梅尔谱进行编码得到样本提示特征;通过初始模型的语音解码器,基于样本提示特征对样本语音量化特征进行解码得到预测梅尔谱;通过初始模型的音素解码器,对样本语音量化特征进行解码得到预测音素序列;基于模型损失训练初始模型得到语音表征模型。本公开可提升语音表征质量。