语音数据的重建方法、装置、计算机设备及存储介质

申请号：CN202411724501

申请日期：2024-11-27

公开号：CN119559929A

公开日期：2025-03-04

类型：发明专利

摘要

本发明公开了一种语音数据的重建方法、装置、计算机设备及存储介质。所述方法包括：通过预设的文本编码器对音素文本执行编码处理后，得到输出向量；通过预设的说话人编码器对说话人提示语言进行编码处理后，得到全局说话人表示；通过预设的韵律模块对所述输出向量和所述全局说话人表示执行预测处理后，得到韵律表示向量；通过预设的解码器对所述韵律表示向量执行解码处理后，得到重建出的语音数据。本方案使用预设的韵律模块处理说话人编码器的全局说话人表示和文本编码器的输出向量，考虑到韵律的全局一致性和局部变化，捕捉当中韵律的分层变化，最终得到提升韵律质量的重建语音，可在自然度和情感表达方面表现更佳。

技术关键词

韵律模块正弦激励信号文本编码器语音噪声数据解码器适配器计算机设备分层神经网络参数可读存储介质处理器存储器