基于特征金字塔注意力的动态残差神经网络声源定位方法
申请号:CN202510475203
申请日期:2025-04-16
公开号:CN120375857A
公开日期:2025-07-25
类型:发明专利
摘要
本发明提出一种基于特征金字塔注意力的动态残差神经网络声源定位方法,通过动态卷积和注意力机制,结合局部卷积特征与全局上下文信息,提升了声音事件定位与检测的精度和鲁棒性。采用动态残差卷积网络作为骨干网络,将残差动态卷积替代了标准卷积,以增强特征提取能力;特征金字塔注意力模块通过三个子模块细化并整合骨干网络输出的特征图,这三个子模块包括维度对齐模块、金字塔空间注意力模块、金字塔通道注意力模块。在此基础上,模型引入双向门控循环单元用于增强对上下文信息的建模能力。最后,经过全连接层输出最终结果。
技术关键词
特征金字塔
声源定位方法
残差神经网络
注意力
门控循环单元
动态
短时傅里叶变换
对齐模块
多层次特征提取
加权特征
通道
网络模块
损失函数优化
多层级特征
特征提取能力
特征值
全局平均池化