音频识别方法及装置、电子设备、存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
音频识别方法及装置、电子设备、存储介质
申请号:CN202511454056
申请日期:2025-10-13
公开号:CN120913546A
公开日期:2025-11-07
类型:发明专利
摘要
本申请提供了一种音频识别方法及装置、电子设备、存储介质,属于音频处理技术领域,该方法包括:对非语音类信号进行傅里叶变换,得到噪音频域信号,并计算非语音类信号中背景噪音信号的第一功率谱密度;对语音类信号进行傅里叶变换,得到语音频域信号,并基于语音频域信号和第一功率谱密度计算初始语音信号对应的第二功率谱密度;计算语音类信号中初始语音信号与背景噪音信号的功率比;基于功率比、语音频域信号、第一功率谱密度和第二功率谱密度对初始语音信号进行信号增强,得到目标语音信号;基于目标模型对目标语音信号进行识别。本申请提供的音频识别方法及装置、电子设备、存储介质可以提高音频识别的精度。
技术关键词
音频识别方法 非语音 功率 密度 识别置信度 噪声抑制 轻量级卷积神经网络 深度残差网络模型 双向长短期记忆网络 音频识别装置 语音特征 信号识别模块 电子设备 可读存储介质 信噪比 处理器 滤波