语音转换模型的训练方法、语音转换方法、及其装置

申请号：CN202510045796

申请日期：2025-01-10

公开号：CN120148485B

公开日期：2025-12-09

类型：发明专利

摘要

本申请公开了一种语音转换模型的训练方法、语音转换方法、及其装置、电子设备、以及计算机可读存储介质。所述训练方法包括：获取多个音频训练数据，并提取第一特征训练数据和第二特征训练数据；获取音频训练数据对应的梅尔谱图，并获得梅尔谱图对应的掩码梅尔图片和噪声梅尔谱图；将音频训练数据对应的第一特征训练数据、第二特征训练数据、掩码梅尔谱图、以及噪声梅尔谱图输入待训练的语音转换模型，获得预测梅尔谱图；根据梅尔谱图和预测梅尔谱图，对待训练的语音转换模型进行模型参数调整，获得训练后的语音转换模型。该方法解决了现有技术存在的因无法兼顾音色相似度、噪声鲁棒性和表现力，导致语音转换效果不佳的技术问题。

技术关键词

音频监督学习模型语音识别模型发音语音转换方法样本多尺度数据处理单元数据转换单元特征提取单元数据获取单元语音转换装置拼接单元噪声鲁棒性时序计算机可读存储介质