一种模型训练方法、音频生成方法、水印检测方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种模型训练方法、音频生成方法、水印检测方法及装置
申请号:CN202510387236
申请日期:2025-03-28
公开号:CN120236605A
公开日期:2025-07-01
类型:发明专利
摘要
本申请实施例提供了一种模型训练方法、音频生成方法、水印检测方法及装置,涉及数据处理技术领域,该模型训练方法包括:获取样本对;将样本文本输入至待训练的文本到语音生成模型,得到样本文本对应的音频输出结果;将样本文本对应的音频输出结果转换为频谱图,得到样本文本对应的待利用频谱图;基于样本音频和样本文本对应的音频输出结果的差异,以及样本频谱图和样本文本对应的待利用频谱图的差异,确定目标模型损失;响应于根据目标模型损失判定文本到语音生成模型未收敛,对文本到语音生成模型进行参数调整。通过本申请所训练的文本到语音生成模型能够生成添加随机水印的音频,以便有效识别音频的归属。
技术关键词
语音生成模型 音频生成方法 文本 样本 水印检测方法 模型训练方法 图像 网络 水印检测装置 频率 模型训练装置 输入模块 可读存储介质 数据处理技术 生成装置 参数
系统为您推荐了相关专利信息
作业指导书 解析方法 生成高分辨率 生成对抗网络模型 依存句法
头戴显示器 图像显示模式 显示模组 图像显示方法 人眼
负荷历史数据 注意力机制 嵌入位置信息 样本 电力系统负荷预测
分块 查询主题 查询方法 分词 注意力
知识图谱构建方法 大语言模型 可视化组件 时序神经网络 跨模态