摘要
本发明提供了一种远场麦克风捕声优化方法及相关设备,将获取的近场麦克风阵列采集的音频作为优化目标、远场麦克风采集的音频数据作为被优化对象,同时采集近、远场音频数据作为训练数据对构建的复合网络进行训练,得到音频优化网络包括时域去噪模型、频域空间增强模型和时频融合模型,时域去噪模型通过在元学习框架下进行预训练得到近远场的通用优化模型参数;进一步通过时域去噪模型对时域信号进行去噪、频域空间增强模型对频域信号进行增强,通过时频融合模型将去噪的信号和增强后的信号进行融合,最终待优化的远场音频数据输入音频优化网络后,得到优化后的近似近场音质的音频数据,从而提升了音频信号的质量。