声纹识别模型的训练方法、装置、设备以及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
声纹识别模型的训练方法、装置、设备以及介质
申请号:CN202411749967
申请日期:2024-11-28
公开号:CN119626228B
公开日期:2025-09-30
类型:发明专利
摘要
本发明实施例提供一种声纹识别模型的训练方法、装置、设备以及介质,属于声纹识别技术领域。该方法包括利用模型的特征提取层对初始音频数据进行特征提取获得初始声音特征;利用模型的声纹嵌入层对初始声音特征进行表征提取获得初始声音表征信息;利用模型的口音识别层根据初始声音表征信息进行口音识别获得第一分类结果;利用模型的口音损失层根据第一分类结果和口音标签进行损失计算获得第一损失值;利用模型的身份识别层根据初始声音表征信息进行说话人识别获得第二分类结果;利用模型的声纹损失层根据第二分类结果和说话人标签进行损失计算获得第二损失值;根据第一损失值和第二损失值对声纹识别模型进行模型训练获得目标识别模型。
技术关键词
声纹识别模型 语音识别模型 网络结构 说话人识别 声音特征提取 声学特征 数据 模型更新 音频 标签 计算机存储介质 距离信息 文本 声纹识别技术 训练装置 身份识别模块 参数 模型训练模块