一种基于ResUNet的多任务语音恢复方法

申请号：CN202410898854

申请日期：2024-07-05

公开号：CN118737178A

公开日期：2024-10-01

类型：发明专利

摘要

本发明涉及音频数据处理领域，具体涉及一种基于ResUNet的多任务语音恢复方法，包括将采集的干净语音数据和噪声数据进行混合处理得到带噪语音数据；对带噪语音数据进行失真处理，得到退化语音数据；构建基于ResUNet的多任务语音恢复模型，其包括上采样模块、瓶颈层、下采样模块；采用退化语音数据训练多任务语音恢复模型，并采用多分辨率短时傅里叶变换损失函数计算损失；将待处理低质量语音送入训练好的多任务语音恢复模型，生成高质量语音。

技术关键词

语音恢复方法短时傅里叶变换多任务线性单元 GSM传输多分辨率分支采样模块房间脉冲响应级联噪声数据音频数据处理采样率上采样解码通道压缩算法