摘要
本发明涉及语音处理技术领域,可应用于金融及医疗领域,公开了一种语言增强方法、装置、计算机设备及存储介质,方法包括:获取带噪声的输入语音信号;通过预训练的生成式音频编码器将带噪声的输入语音信号转换为噪声嵌入数据;通过去噪编码器对噪声嵌入数据进行去噪处理,得到干净嵌入数据;通过预训练的声码器将干净嵌入数据转换为增强后的目标语音信号。本发明有效提升增强后语音的自然度与说话人一致性,降低了对复杂噪声分布的建模难度,减少语音失真,同时大幅降低了模型参数量与训练复杂度,提升了推理速度,使其能在低资源环境下实现实时应用。