一种模型训练方法、音频生成方法、水印检测方法及装置
申请号:CN202510387236
申请日期:2025-03-28
公开号:CN120236605A
公开日期:2025-07-01
类型:发明专利
摘要
本申请实施例提供了一种模型训练方法、音频生成方法、水印检测方法及装置,涉及数据处理技术领域,该模型训练方法包括:获取样本对;将样本文本输入至待训练的文本到语音生成模型,得到样本文本对应的音频输出结果;将样本文本对应的音频输出结果转换为频谱图,得到样本文本对应的待利用频谱图;基于样本音频和样本文本对应的音频输出结果的差异,以及样本频谱图和样本文本对应的待利用频谱图的差异,确定目标模型损失;响应于根据目标模型损失判定文本到语音生成模型未收敛,对文本到语音生成模型进行参数调整。通过本申请所训练的文本到语音生成模型能够生成添加随机水印的音频,以便有效识别音频的归属。
技术关键词
语音生成模型
音频生成方法
文本
样本
水印检测方法
模型训练方法
图像
网络
水印检测装置
频率
模型训练装置
输入模块
可读存储介质
数据处理技术
生成装置
参数