摘要
本发明公开了一种面向手术室语音交互的多模态特征融合的噪声抑制方法,其中语音噪声分离模型的建立方法包括:获取语音样本数据、噪声样本数据及对应的噪声特性数据;将所述语音样本数据和噪声样本数据按照预设比例混合形成混合语音样本数据;对所述混合语音样本数据、所述噪声特性数据分别进行特征提取,得到混合音频特征和噪声特征;对所述混合音频特征和所述噪声特性特征进行融合,得到融合特征;将融合特征进行自注意力机制计算,输出特征矩阵;将所述特征矩阵作为输入,以语音数据和噪声数据的分离特征作为输出,对动态域自适应神经网络中进行训练,得到语音噪声分离模型。