面向手术室语音交互的多模态特征融合的噪声抑制方法

申请号：CN202510688876

申请日期：2025-05-27

公开号：CN120748421A

公开日期：2025-10-03

类型：发明专利

摘要

本发明公开了一种面向手术室语音交互的多模态特征融合的噪声抑制方法，其中语音噪声分离模型的建立方法包括：获取语音样本数据、噪声样本数据及对应的噪声特性数据；将所述语音样本数据和噪声样本数据按照预设比例混合形成混合语音样本数据；对所述混合语音样本数据、所述噪声特性数据分别进行特征提取，得到混合音频特征和噪声特征；对所述混合音频特征和所述噪声特性特征进行融合，得到融合特征；将融合特征进行自注意力机制计算，输出特征矩阵；将所述特征矩阵作为输入，以语音数据和噪声数据的分离特征作为输出，对动态域自适应神经网络中进行训练，得到语音噪声分离模型。

技术关键词

语音噪声噪声样本噪声抑制方法融合特征音频特征噪声特征噪声数据手术室内窥镜系统注意力机制图像采集装置输出特征多模态特征融合处理器