自适应噪声抑制的多语言长录音转写方法、系统以及设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
自适应噪声抑制的多语言长录音转写方法、系统以及设备
申请号:CN202411452249
申请日期:2024-10-17
公开号:CN119007740B
公开日期:2025-01-10
类型:发明专利
摘要
本发明提供了一种自适应噪声抑制的多语言长录音转写方法、系统以及设备,包括:对多语言长录音进行音频分割,得到多个音频片段;对每个音频片段进行频谱分析,得到对应的频谱特征;根据频谱特征对各个音频片段进行噪声检测,确定噪声片段;对所述多语言长录音中的各个噪声片段进行自适应噪声抑制,得到去噪后的多语言音频;对去噪后的多语言音频进行语音活动检测,确定语音片段和非语音片段;对语音片段进行特征提取,得到语音特征;将语音特征输入预先训练的多语言转写模型进行转写,得到对应的文本结果。在本发明中,通过对所述多语言长录音中的各个噪声片段进行自适应噪声抑制,有效降低噪声的干扰,提升语音质量。
技术关键词
翻译终端 噪声抑制 转写方法 音频 语音特征 多语言 频谱特征 二叉树结构 语音活动检测 字符 标识 语法特征 噪声特征提取 依序 训练滤波器 语义特征 深度特征提取