文本到语音的生成方法、装置及电子设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
文本到语音的生成方法、装置及电子设备
申请号:CN202411066953
申请日期:2024-08-05
公开号:CN118629395A
公开日期:2024-09-10
类型:发明专利
摘要
本申请涉及计算机技术领域,公开了一种文本到语音的生成方法、装置及电子设备,该方法包括:获取待处理文本和目标参考语音;对待处理文本进行预处理,得到待处理文本对应的目标编码;基于目标编码、目标参考语音,以及目标语音生成模型中的风格向量单元,生成目标风格向量;基于目标风格向量、待处理文本,以及目标语音生成模型中的生成单元,生成待处理文本和目标参考语音对应的目标合成语音。本申请实施例提供的文本到语音的生成方法所生成的目标合成语音具有待处理文本的韵律特征和目标参考语音的韵律特征,提高了合成语音的真实性和丰富性。
技术关键词
语音生成模型 文本 风格 韵律特征 特征提取器 编码器 生成方法 梅尔频率倒谱系数 序列 音频特征 方差信息 样本 注意力机制 采样器 电子设备 适配器 模块 数据