语音转换模型训练方法、装置、计算机设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
语音转换模型训练方法、装置、计算机设备及存储介质
申请号:CN202411667344
申请日期:2024-11-19
公开号:CN119400151A
公开日期:2025-02-07
类型:发明专利
摘要
本申请实施例提供了一种语音转换模型训练方法、装置、计算机设备及存储介质,属于人工智能技术领域。包括:获取样本语音以及样本语音的样本音色特征和样本文本特征,获取参考语音的参考语音特征和参考音色特征;将样本语音输入到训练后的编码子模型中,输出样本语音的样本语音特征;将样本语音特征、样本文本特征和样本音色特征正向输入到可逆生成子模型中,输出目标文本特征,并确定目标文本特征和样本文本特征之间的第一损失值;将目标文本特征和参考音色特征逆向输入到可逆生成子模型中,输出目标语音特征,并确定目标语音特征和参考语音特征之间的第二损失值;根据第一损失值和第二损失值对可逆生成子模型迭代,得到训练后的可逆生成子模型。
技术关键词
语音特征 音色特征 样本 模型训练方法 文本 编码 计算机设备 输入模块 解码 模型训练装置 可读存储介质 人工智能技术 处理器 存储器 指令 参数 网络