一种多尺度自适应特征融合的声音事件定位与检测方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种多尺度自适应特征融合的声音事件定位与检测方法
申请号:CN202411892219
申请日期:2024-12-20
公开号:CN119724238A
公开日期:2025-03-28
类型:发明专利
摘要
本发明公开了一种多尺度自适应特征融合的声音事件定位与检测方法,对待检测的多通道音频信号进行预处理,生成Mel谱图并计算有效强度向量,构建输入特征矩阵并输入编码器进行多尺度特征提取,输出多层空间特征;通过选择性频率感知特征融合模块对多层空间特征进行频率自适应调节,平滑全局特征并增强边界细节。使用分层多尺度特征集成模块对浅层特征与深层特征进行融合,并结合双向门控循环单元进行时间建模,输出检测结果。本发明能够解决多源重叠声源干扰、噪声影响下的定位不稳定性、边界模糊引起的检测精度下降问题,以及特征混淆导致的时间频率细节丢失问题,能够显著提升定位和检测性能。
技术关键词
门控循环单元 感知特征 多尺度特征提取 集成模块 编码器 高通滤波器 频率 低通滤波器 抑制高频噪声 语义信息提取 深层特征提取 短时傅里叶变换 多通道 融合特征 矩阵 特征金字塔 融合全局