一种模型训练方法、音频生成方法、水印检测方法及装置

申请号：CN202510387236

申请日期：2025-03-28

公开号：CN120236605A

公开日期：2025-07-01

类型：发明专利

摘要

本申请实施例提供了一种模型训练方法、音频生成方法、水印检测方法及装置，涉及数据处理技术领域，该模型训练方法包括：获取样本对；将样本文本输入至待训练的文本到语音生成模型，得到样本文本对应的音频输出结果；将样本文本对应的音频输出结果转换为频谱图，得到样本文本对应的待利用频谱图；基于样本音频和样本文本对应的音频输出结果的差异，以及样本频谱图和样本文本对应的待利用频谱图的差异，确定目标模型损失；响应于根据目标模型损失判定文本到语音生成模型未收敛，对文本到语音生成模型进行参数调整。通过本申请所训练的文本到语音生成模型能够生成添加随机水印的音频，以便有效识别音频的归属。

技术关键词

语音生成模型音频生成方法文本样本水印检测方法模型训练方法图像网络水印检测装置频率模型训练装置输入模块可读存储介质数据处理技术生成装置参数

系统为您推荐了相关专利信息

一种作业指导书解析方法

作业指导书解析方法生成高分辨率生成对抗网络模型依存句法

头戴显示器的图像显示方法、构建系统及计算控制单元

头戴显示器图像显示模式显示模组图像显示方法人眼

基于模态分解和独立注意力机制的电力系统负荷预测方法

负荷历史数据注意力机制嵌入位置信息样本电力系统负荷预测

一种工程招标文件切分与聚合查询方法、系统及程序产品

分块查询主题查询方法分词注意力

一种基于大语言模型的多模态自动化知识图谱构建方法

知识图谱构建方法大语言模型可视化组件时序神经网络跨模态