音频识别模型的训练方法及装置、存储介质、电子设备

申请号：CN202411945376

申请日期：2024-12-26

公开号：CN119832899A

公开日期：2025-04-15

类型：发明专利

摘要

本公开涉及人工智能技术领域，提供了一种音频识别模型的训练方法、音频识别模型的训练装置、计算机可读存储介质、电子设备，其中，方法包括：获取多组训练样本，并采集每组训练样本中包含的每个音频对应的每个频谱信息；通过特征提取网络提取每个频谱特征，通过音频编码器对每个频谱特征进行编码，获得每个音频向量；根据每组训练样本对应的音频向量之间的差异程度确定每组训练样本对应的对比损失值，并根据多组对比损失值对特征提取网络和音频编码器进行迭代训练；在对比损失值满足第一预设收敛条件时，冻结特征提取网络和音频编码器，根据多组训练样本对应的音频向量对分类器进行迭代训练，获得音频识别模型。本公开能够提升音频识别准确度。

技术关键词

音频编码器特征提取网络样本频谱特征分类器标签训练装置电子设备可读存储介质人工智能技术处理器编码模块资源库计算机滤波器指令信号

系统为您推荐了相关专利信息

基于群体算法的容性设备在线监测系统

设备在线监测系统融合特征参数编码指数

一种基于双重身份的信号接受方法

环境监测模块数字信号处理器传感器模块信号处理模块消除直流偏置

基于煤矿强噪声环境下的语音识别方法及装置

强噪声环境语音特征语音识别方法煤矿井下信号

一种基于脑电信号和眼动信号的动态情绪识别方法及系统

动态情绪识别方法标准差特征支持向量回归模型脑电特征原始脑电信号

基于边缘感知多原型学习的少样本医学图像分割方法

原型医学图像分割方法查询特征注意力样本