一种多声源波达方向估计模型的训练方法、多声源波达方向估计方法、设备、介质及产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种多声源波达方向估计模型的训练方法、多声源波达方向估计方法、设备、介质及产品
申请号:CN202511145776
申请日期:2025-08-15
公开号:CN120910566A
公开日期:2025-11-07
类型:发明专利
摘要
本申请公开了一种多声源波达方向估计模型的训练方法、多声源波达方向估计方法、设备、介质及产品,涉及信号处理与人工智能交叉技术领域,训练方法包括:计算多通道阵列原始信号的时频特征和互相关特征;对时频特征和麦克风位置信息分别进行位置编码;再将这些特征融合为输入矩阵输入改进Transformer模型的主干网络;利用第一多头自注意力层,计算输入矩阵的注意力得分并生成头输出,再将头输出输入第二多头自注意力层,计算注意力得分并生成头输出,再将输出输入多任务输出模块,得到方向估计结果。本申请引入多头注意力机制,捕捉长时间、多频段之间的复杂依赖,提升声源区分能力,多个头从不同视角捕捉方向信息,保证在复杂环境下仍能保证高精确度。
技术关键词
多声源 编码特征 估计方法 多通道 矩阵 时间域 人工智能交叉技术 输出模块 多任务 麦克风 编码模块 池化特征 预测特征 阵列 多头注意力机制 信号 离散小波变换 编码器