一种基于注意力机制的ResNet声源定位方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于注意力机制的ResNet声源定位方法
申请号:CN202510308744
申请日期:2025-03-17
公开号:CN120161409A
公开日期:2025-06-17
类型:发明专利
摘要
本发明公开了一种基于注意力机制的ResNet声源定位方法,涉及声源定位技术领域;其包括如下步骤:获取声源信号,声源信号包括麦克风阵列中每一麦克风的声源信号,将声源信号经短时傅里叶变换至频域,在频域内提取获得麦克风声源信号的相位分量,将每两个麦克风之间的相位分量做差得到相位差,将相位差图馈入训练好的基于改进注意力机制的残差网络,网络输出声源角度预测概率;残差网络包括依次连接的ResNet‑34 Stage1~4、第一输出部分、SC‑SEAM模块、ResNet‑34 Stage5、SC‑SEAM模块、第二输出部分、全连接层以及输出层,该残差网络为改进后的神经网络结构,声源定位精度更高,鲁棒性更好。
技术关键词
声源定位方法 残差网络 通道注意力机制 麦克风阵列 短时傅里叶变换 声源定位技术 信号 模块 神经网络结构 输出特征 鲁棒性 参数 幅值 因子 频率