一种语音合成方法、装置、终端设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种语音合成方法、装置、终端设备及存储介质
申请号:CN202411937534
申请日期:2024-12-26
公开号:CN119993120B
公开日期:2025-10-03
类型:发明专利
摘要
本发公开了一种语音合成方法、装置、设备及存储介质,所述方法包括获取待处理的语音及文本数据并将其输入至目标语音合成模型中,以此获取对应声学特征和对应内容的目标合成语音数据;其中,目标语音合成模型的生成是在进行模型训练过程中,通过获取并根据教师语音合成模型和学生语音合成模型输出分布之间的相对熵,来调整学生语音合成模型的模型参数,并在相对熵达到第一预设阈值时,所对应的学生语音合成模型作为目标语音合成模型。通过实施本发明,能够确保目标语音合成模型的表达能力和生成质量的同时,还满足了用户的实时性需求。
技术关键词
训练文本数据 声学特征 学生 语音特征 教师 文本编码器 解码 数据获取模块 语义特征 终端设备 处理器 声波 存储器 参数 信号 计算机
系统为您推荐了相关专利信息
符号 注意力机制 语音编码器 序列 文本编码器
情绪识别模型 标记 数据存储模块 策略 客服
心律检测方法 全局平均池化 网络特征 数字带阻滤波器 学生
后处理模块 校验模块 自动语音识别 学生 命令
石油管道泄漏监测 编码器 预警方法 教师 无监督学习方法