面向手术室语音交互的多模态特征融合的噪声抑制方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
面向手术室语音交互的多模态特征融合的噪声抑制方法
申请号:CN202510688876
申请日期:2025-05-27
公开号:CN120748421A
公开日期:2025-10-03
类型:发明专利
摘要
本发明公开了一种面向手术室语音交互的多模态特征融合的噪声抑制方法,其中语音噪声分离模型的建立方法包括:获取语音样本数据、噪声样本数据及对应的噪声特性数据;将所述语音样本数据和噪声样本数据按照预设比例混合形成混合语音样本数据;对所述混合语音样本数据、所述噪声特性数据分别进行特征提取,得到混合音频特征和噪声特征;对所述混合音频特征和所述噪声特性特征进行融合,得到融合特征;将融合特征进行自注意力机制计算,输出特征矩阵;将所述特征矩阵作为输入,以语音数据和噪声数据的分离特征作为输出,对动态域自适应神经网络中进行训练,得到语音噪声分离模型。
技术关键词
语音噪声 噪声样本 噪声抑制方法 融合特征 音频特征 噪声特征 噪声数据 手术室 内窥镜系统 注意力机制 图像采集装置 输出特征 多模态特征融合 处理器