基于音素对比能量学习的方言语音合成方法、终端及介质
申请号:CN202511316462
申请日期:2025-09-16
公开号:CN120833778B
公开日期:2025-12-12
类型:发明专利
摘要
本发明涉及语音合成技术领域,公开了基于音素对比能量学习的方言语音合成方法、终端及介质。该语音合成方法首先获取标准语言文本,并将其转换为标准语言音素序列;基于方言的音频样本构建方言音素集合;然后利用训练完成的音素对比能量模型,分别计算每个标准语言音素与各方言音素之间的能量差异,并为每个标准语言音素选取能量差距最小的方言音素作为映射结果;再根据映射结果生成与标准语言音素序列长度一致的方言音素序列;最后将方言音素序列转换为目标方言语音波形能量差异用于表征音素特征之间的相似度,基于音素在特征空间的距离、发音方式特征和发音部位特征联合计算获得。本发明能在低资源条件下实现高效、准确的方言语音合成。
技术关键词
语音
发音
序列
样本
表达式
三元组
元学习策略
动态规划算法
梯度下降算法
音频
计算机终端
文本
处理器
波形
重构
语义
参数
可读存储介质
存储器
解码器