一种基于ResUNet的多任务语音恢复方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种基于ResUNet的多任务语音恢复方法
申请号:
CN202410898854
申请日期:
2024-07-05
公开号:
CN118737178A
公开日期:
2024-10-01
类型:
发明专利
摘要
本发明涉及音频数据处理领域,具体涉及一种基于ResUNet的多任务语音恢复方法,包括将采集的干净语音数据和噪声数据进行混合处理得到带噪语音数据;对带噪语音数据进行失真处理,得到退化语音数据;构建基于ResUNet的多任务语音恢复模型,其包括上采样模块、瓶颈层、下采样模块;采用退化语音数据训练多任务语音恢复模型,并采用多分辨率短时傅里叶变换损失函数计算损失;将待处理低质量语音送入训练好的多任务语音恢复模型,生成高质量语音。
技术关键词
语音恢复方法
短时傅里叶变换
多任务
线性单元
GSM传输
多分辨率
分支
采样模块
房间脉冲响应
级联
噪声数据
音频数据处理
采样率
上采样
解码
通道
压缩算法