一种低延迟语音合成方法、装置、设备和介质
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种低延迟语音合成方法、装置、设备和介质
申请号:
CN202510214278
申请日期:
2025-02-26
公开号:
CN120164454B
公开日期:
2025-09-05
类型:
发明专利
摘要
本发明公开了一种低延迟语音合成方法、装置、介质和设备,属于语音处理技术领域,所述方法包括:S10:对输入文本进行规范化处理,得到规范化文本;S20:对所述规范化文本进行分词处理、词性标注处理和韵律信息分析,得到语言结构化文本;S30:利用深度学习算法对所述语言结构化文本进行特征提取,得到文本特征向量;S40:使用基于变换器的非自回归的语音合成模型,将所述文本特征向量转换为语音信号。本发明降低了语音合成的延迟时间,提高了语音的自然度和表现力。
技术关键词
文本特征向量
并行解码方法
生成语音信号
深度学习算法
长度调节器
低延迟
序列
编码器
分词
变换器
语义特征
解码器
子模块
数据
语法结构
长短期记忆模型