语音数据的重建方法、装置、计算机设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
语音数据的重建方法、装置、计算机设备及存储介质
申请号:CN202411724501
申请日期:2024-11-27
公开号:CN119559929A
公开日期:2025-03-04
类型:发明专利
摘要
本发明公开了一种语音数据的重建方法、装置、计算机设备及存储介质。所述方法包括:通过预设的文本编码器对音素文本执行编码处理后,得到输出向量;通过预设的说话人编码器对说话人提示语言进行编码处理后,得到全局说话人表示;通过预设的韵律模块对所述输出向量和所述全局说话人表示执行预测处理后,得到韵律表示向量;通过预设的解码器对所述韵律表示向量执行解码处理后,得到重建出的语音数据。本方案使用预设的韵律模块处理说话人编码器的全局说话人表示和文本编码器的输出向量,考虑到韵律的全局一致性和局部变化,捕捉当中韵律的分层变化,最终得到提升韵律质量的重建语音,可在自然度和情感表达方面表现更佳。
技术关键词
韵律模块 正弦激励信号 文本编码器 语音 噪声数据 解码器 适配器 计算机设备 分层 神经网络参数 可读存储介质 处理器 存储器