模型训练方法、语音处理方法和装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
模型训练方法、语音处理方法和装置
申请号:CN202510146632
申请日期:2025-02-10
公开号:CN120183411A
公开日期:2025-06-20
类型:发明专利
摘要
本发明提供一种模型训练方法、语音处理方法和装置,其中方法包括:将样本语音对中的提示语音对应的声学特征输入至语音特征提取模型,得到样本语音特征;将样本语音对中的目标语音,以及目标语音对应的样本文本和样本语音特征,输入至语音合成单元,得到合成语音;将目标语音,以及目标语音对应的样本文本和样本语音特征,输入至音色转换单元,得到音色转换语音;根据合成语音和/或音色转换语音,以及样本语音特征对应的声纹识别结果,对语音特征提取模型进行多任务联合训练,得到目标语音特征提取模型。本发明实现通过多任务约束优化训练语音特征提取模型,以有效提取更加丰富且鲁棒的说话人的语音特征。
技术关键词
语音特征提取 模型训练方法 语音处理单元 多任务联合训练 样本 声学特征 转换单元 文本 非暂态计算机可读存储介质 残差网络 模型训练装置 特征提取单元 标签 处理器 加载单元 存储器