语音转换模型训练方法、装置、计算机设备及存储介质

申请号：CN202411667344

申请日期：2024-11-19

公开号：CN119400151A

公开日期：2025-02-07

类型：发明专利

摘要

本申请实施例提供了一种语音转换模型训练方法、装置、计算机设备及存储介质，属于人工智能技术领域。包括：获取样本语音以及样本语音的样本音色特征和样本文本特征，获取参考语音的参考语音特征和参考音色特征；将样本语音输入到训练后的编码子模型中，输出样本语音的样本语音特征；将样本语音特征、样本文本特征和样本音色特征正向输入到可逆生成子模型中，输出目标文本特征，并确定目标文本特征和样本文本特征之间的第一损失值；将目标文本特征和参考音色特征逆向输入到可逆生成子模型中，输出目标语音特征，并确定目标语音特征和参考语音特征之间的第二损失值；根据第一损失值和第二损失值对可逆生成子模型迭代，得到训练后的可逆生成子模型。

技术关键词

语音特征音色特征样本模型训练方法文本编码计算机设备输入模块解码模型训练装置可读存储介质人工智能技术处理器存储器指令参数网络