深度学习模型的训练方法及语音合成方法

申请号：CN202411058653

申请日期：2024-08-02

公开号：CN118571254B

公开日期：2024-10-18

类型：发明专利

摘要

本申请涉及一种深度学习模型的训练方法及语音合成方法，其中，该深度学习模型的训练方法包括：构建深度学习模型，其中，深度学习模型包括具有多头注意力层的变换器网络和KAN网络，多头注意力层用于捕捉训练数据集中的文本数据和音频数据之间的关联关系以输出关联关系矩阵，KAN网络用于对关联关系矩阵进行线性变换；利用训练数据集来训练深度学习模型使得深度学习模型输出预测的合成语音，比较预测的合成语音和训练数据集中相应的音频数据中的目标对象的语音，确定深度学习模型的损失；根据损失调整KAN网络的权重矩阵，以更新深度学习模型，其中，KAN网络的权重矩阵用于结合共享基函数和样条插值函数来对关联关系矩阵进行线性变换。

技术关键词

矩阵关系注意力语音网络样条数据文本变换器训练深度学习模型机器可读介质回归方法计算机程序产品音频特征生成装置生成方法对象