音频识别模型的训练方法及装置、存储介质、电子设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
音频识别模型的训练方法及装置、存储介质、电子设备
申请号:CN202411945376
申请日期:2024-12-26
公开号:CN119832899A
公开日期:2025-04-15
类型:发明专利
摘要
本公开涉及人工智能技术领域,提供了一种音频识别模型的训练方法、音频识别模型的训练装置、计算机可读存储介质、电子设备,其中,方法包括:获取多组训练样本,并采集每组训练样本中包含的每个音频对应的每个频谱信息;通过特征提取网络提取每个频谱特征,通过音频编码器对每个频谱特征进行编码,获得每个音频向量;根据每组训练样本对应的音频向量之间的差异程度确定每组训练样本对应的对比损失值,并根据多组对比损失值对特征提取网络和音频编码器进行迭代训练;在对比损失值满足第一预设收敛条件时,冻结特征提取网络和音频编码器,根据多组训练样本对应的音频向量对分类器进行迭代训练,获得音频识别模型。本公开能够提升音频识别准确度。
技术关键词
音频编码器 特征提取网络 样本 频谱特征 分类器 标签 训练装置 电子设备 可读存储介质 人工智能技术 处理器 编码模块 资源库 计算机 滤波器 指令 信号
系统为您推荐了相关专利信息
设备在线监测系统 融合特征 参数 编码 指数
环境监测模块 数字信号处理器 传感器模块 信号处理模块 消除直流偏置
强噪声环境 语音特征 语音识别方法 煤矿井下 信号
动态情绪识别方法 标准差特征 支持向量回归模型 脑电特征 原始脑电信号
原型 医学图像分割方法 查询特征 注意力 样本