语音转换模型的训练方法、语音转换方法、及其装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
语音转换模型的训练方法、语音转换方法、及其装置
申请号:CN202510045796
申请日期:2025-01-10
公开号:CN120148485B
公开日期:2025-12-09
类型:发明专利
摘要
本申请公开了一种语音转换模型的训练方法、语音转换方法、及其装置、电子设备、以及计算机可读存储介质。所述训练方法包括:获取多个音频训练数据,并提取第一特征训练数据和第二特征训练数据;获取音频训练数据对应的梅尔谱图,并获得梅尔谱图对应的掩码梅尔图片和噪声梅尔谱图;将音频训练数据对应的第一特征训练数据、第二特征训练数据、掩码梅尔谱图、以及噪声梅尔谱图输入待训练的语音转换模型,获得预测梅尔谱图;根据梅尔谱图和预测梅尔谱图,对待训练的语音转换模型进行模型参数调整,获得训练后的语音转换模型。该方法解决了现有技术存在的因无法兼顾音色相似度、噪声鲁棒性和表现力,导致语音转换效果不佳的技术问题。
技术关键词
音频 监督学习模型 语音识别模型 发音 语音转换方法 样本 多尺度 数据处理单元 数据转换单元 特征提取单元 数据获取单元 语音转换装置 拼接单元 噪声鲁棒性 时序 计算机 可读存储介质