深度学习模型的训练方法及语音合成方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
深度学习模型的训练方法及语音合成方法
申请号:CN202411058653
申请日期:2024-08-02
公开号:CN118571254B
公开日期:2024-10-18
类型:发明专利
摘要
本申请涉及一种深度学习模型的训练方法及语音合成方法,其中,该深度学习模型的训练方法包括:构建深度学习模型,其中,深度学习模型包括具有多头注意力层的变换器网络和KAN网络,多头注意力层用于捕捉训练数据集中的文本数据和音频数据之间的关联关系以输出关联关系矩阵,KAN网络用于对关联关系矩阵进行线性变换;利用训练数据集来训练深度学习模型使得深度学习模型输出预测的合成语音,比较预测的合成语音和训练数据集中相应的音频数据中的目标对象的语音,确定深度学习模型的损失;根据损失调整KAN网络的权重矩阵,以更新深度学习模型,其中,KAN网络的权重矩阵用于结合共享基函数和样条插值函数来对关联关系矩阵进行线性变换。
技术关键词
矩阵 关系 注意力 语音 网络 样条 数据 文本 变换器 训练深度学习模型 机器可读介质 回归方法 计算机程序产品 音频特征 生成装置 生成方法 对象