一种低延迟语音合成方法、装置、设备和介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种低延迟语音合成方法、装置、设备和介质
申请号:CN202510214278
申请日期:2025-02-26
公开号:CN120164454B
公开日期:2025-09-05
类型:发明专利
摘要
本发明公开了一种低延迟语音合成方法、装置、介质和设备,属于语音处理技术领域,所述方法包括:S10:对输入文本进行规范化处理,得到规范化文本;S20:对所述规范化文本进行分词处理、词性标注处理和韵律信息分析,得到语言结构化文本;S30:利用深度学习算法对所述语言结构化文本进行特征提取,得到文本特征向量;S40:使用基于变换器的非自回归的语音合成模型,将所述文本特征向量转换为语音信号。本发明降低了语音合成的延迟时间,提高了语音的自然度和表现力。
技术关键词
文本特征向量 并行解码方法 生成语音信号 深度学习算法 长度调节器 低延迟 序列 编码器 分词 变换器 语义特征 解码器 子模块 数据 语法结构 长短期记忆模型