声纹识别模型的训练方法、装置、设备以及介质

申请号：CN202411749967

申请日期：2024-11-28

公开号：CN119626228B

公开日期：2025-09-30

类型：发明专利

摘要

本发明实施例提供一种声纹识别模型的训练方法、装置、设备以及介质，属于声纹识别技术领域。该方法包括利用模型的特征提取层对初始音频数据进行特征提取获得初始声音特征；利用模型的声纹嵌入层对初始声音特征进行表征提取获得初始声音表征信息；利用模型的口音识别层根据初始声音表征信息进行口音识别获得第一分类结果；利用模型的口音损失层根据第一分类结果和口音标签进行损失计算获得第一损失值；利用模型的身份识别层根据初始声音表征信息进行说话人识别获得第二分类结果；利用模型的声纹损失层根据第二分类结果和说话人标签进行损失计算获得第二损失值；根据第一损失值和第二损失值对声纹识别模型进行模型训练获得目标识别模型。

技术关键词

声纹识别模型语音识别模型网络结构说话人识别声音特征提取声学特征数据模型更新音频标签计算机存储介质距离信息文本声纹识别技术训练装置身份识别模块参数模型训练模块