歌声合成模型的处理方法、歌声合成方法、设备和介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
歌声合成模型的处理方法、歌声合成方法、设备和介质
申请号:CN202410979905
申请日期:2024-07-22
公开号:CN118737120A
公开日期:2024-10-01
类型:发明专利
摘要
本申请涉及一种歌声合成模型处理方法、歌声合成方法、设备和存储介质。歌声合成模型的处理方法包括:将样本特征输入待训练的歌声合成模型中歌声特征预测器,得到预测歌声特征,并通过预测歌声特征训练歌声特征预测器;将样本歌声信号对应的样本频谱信息输入歌声合成模型中的频谱生成模块,得到预测频谱信息,通过预测频谱信息训练频谱生成模块;将样本歌词文本对应的语义信息输入歌声合成模型的扩散模块,得到样本歌声信号对应的先验特征,并利用先验特征训练扩散模块;根据训练完成的歌声特征预测器、频谱生成模块以及扩散模块,得到训练完成的歌声合成模型。采用本方法不需要依赖于曲谱信息的标注,能降低模型标注的成本。
技术关键词
样本 文本 编码特征 模块 噪声特征 解码器 信号 编码器 语义 特征提取模型 计算机程序产品 处理器 声码器 计算机设备 可读存储介质 存储器 序列