自适应噪声抑制的多语言长录音转写方法、系统以及设备
申请号:CN202411452249
申请日期:2024-10-17
公开号:CN119007740B
公开日期:2025-01-10
类型:发明专利
摘要
本发明提供了一种自适应噪声抑制的多语言长录音转写方法、系统以及设备,包括:对多语言长录音进行音频分割,得到多个音频片段;对每个音频片段进行频谱分析,得到对应的频谱特征;根据频谱特征对各个音频片段进行噪声检测,确定噪声片段;对所述多语言长录音中的各个噪声片段进行自适应噪声抑制,得到去噪后的多语言音频;对去噪后的多语言音频进行语音活动检测,确定语音片段和非语音片段;对语音片段进行特征提取,得到语音特征;将语音特征输入预先训练的多语言转写模型进行转写,得到对应的文本结果。在本发明中,通过对所述多语言长录音中的各个噪声片段进行自适应噪声抑制,有效降低噪声的干扰,提升语音质量。
技术关键词
翻译终端
噪声抑制
转写方法
音频
语音特征
多语言
频谱特征
二叉树结构
语音活动检测
字符
标识
语法特征
噪声特征提取
依序
训练滤波器
语义特征
深度特征提取