模型训练方法、语音处理方法和装置

申请号：CN202510146632

申请日期：2025-02-10

公开号：CN120183411A

公开日期：2025-06-20

类型：发明专利

摘要

本发明提供一种模型训练方法、语音处理方法和装置，其中方法包括：将样本语音对中的提示语音对应的声学特征输入至语音特征提取模型，得到样本语音特征；将样本语音对中的目标语音，以及目标语音对应的样本文本和样本语音特征，输入至语音合成单元，得到合成语音；将目标语音，以及目标语音对应的样本文本和样本语音特征，输入至音色转换单元，得到音色转换语音；根据合成语音和/或音色转换语音，以及样本语音特征对应的声纹识别结果，对语音特征提取模型进行多任务联合训练，得到目标语音特征提取模型。本发明实现通过多任务约束优化训练语音特征提取模型，以有效提取更加丰富且鲁棒的说话人的语音特征。

技术关键词

语音特征提取模型训练方法语音处理单元多任务联合训练样本声学特征转换单元文本非暂态计算机可读存储介质残差网络模型训练装置特征提取单元标签处理器加载单元存储器