一种多声源波达方向估计模型的训练方法、多声源波达方向估计方法、设备、介质及产品
申请号:CN202511145776
申请日期:2025-08-15
公开号:CN120910566A
公开日期:2025-11-07
类型:发明专利
摘要
本申请公开了一种多声源波达方向估计模型的训练方法、多声源波达方向估计方法、设备、介质及产品,涉及信号处理与人工智能交叉技术领域,训练方法包括:计算多通道阵列原始信号的时频特征和互相关特征;对时频特征和麦克风位置信息分别进行位置编码;再将这些特征融合为输入矩阵输入改进Transformer模型的主干网络;利用第一多头自注意力层,计算输入矩阵的注意力得分并生成头输出,再将头输出输入第二多头自注意力层,计算注意力得分并生成头输出,再将输出输入多任务输出模块,得到方向估计结果。本申请引入多头注意力机制,捕捉长时间、多频段之间的复杂依赖,提升声源区分能力,多个头从不同视角捕捉方向信息,保证在复杂环境下仍能保证高精确度。
技术关键词
多声源
编码特征
估计方法
多通道
矩阵
时间域
人工智能交叉技术
输出模块
多任务
麦克风
编码模块
池化特征
预测特征
阵列
多头注意力机制
信号
离散小波变换
编码器