一种单阶段语音合成方法、装置、设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种单阶段语音合成方法、装置、设备及存储介质
申请号:CN202411687489
申请日期:2024-11-22
公开号:CN119600986B
公开日期:2025-11-21
类型:发明专利
摘要
本发明涉及数据存储技术领域,公开了一种单阶段语音合成方法、装置、设备及存储介质,包括:通过单阶段TTS模型接收输入的待处理文本,并通过语义知识蒸馏算法对所述待处理文本进行语义增强处理,捕捉所述待处理文本中的深层语义特征;根据所述语义增强处理后的待处理文本进行音频生成,并在音频生成过程中,利用音频掩码建模算法随机掩盖部分音频信号,生成掩码音频信号;根据所述语义增强处理后的待处理文本和掩码音频信号预测未被掩盖的音频信号,生成符合所述深层语义特征且具有自然情感的音频信号。本发明采用单阶段TTS模型架构,将语义知识蒸馏算法和音频掩码建模算法相结合,简化生成流程,提升了推理速度,能够在实时场景中生成高质量音频。
技术关键词
音频 语义特征 文本 建模算法 语音 信号 阶段 蒸馏 预训练语言模型 数据存储技术 离散余弦变换 可读存储介质 语法结构 处理器 计算机设备 存储器 编码
系统为您推荐了相关专利信息
语音特征参数 语音传输方法 时间偏移量 信号 门控循环单元
在线问诊方法 消息 神经网络模型 终端设备 疾病
图像编码 解码模型 节点 文本 标识标签
实体 大语言模型 文本 图谱生成方法 嵌入特征
对话系统 标识符 对话方法 字段 变量