构音障碍语音的个性化合成与识别增强方法

申请号：CN202510359114

申请日期：2025-03-25

公开号：CN120412540A

公开日期：2025-08-01

类型：发明专利

摘要

本发明公开了一种构音障碍语音的个性化合成与识别增强方法，构音障碍语音合成模型包括：长程依赖特征编码模块、非稳态特征编码模块和解码模块，构音障碍语音合成模型的输入包括样本，输出包括合成构音障碍语音，样本为构音障碍文本序列；长程依赖特征编码模块的输入包括样本、输出为对齐向量z；非稳态特征编码模块的输入包括对齐向量z、输出为最终嵌入表示解码模块的输入为最终嵌入表示输出为合成构音障碍语音。本发明的构音障碍语音合成模型提升了对构音障碍语音个性化特征的提取能力和语音合成性能以及构音障碍语音特征的精细化表达能力。

技术关键词

编码模块稳态特征特征提取模块随机噪声依赖特征解码模块对齐模块样本音频语音识别模型个性化特征语音特征序列错误率文本阶段

系统为您推荐了相关专利信息

车辆电池包的热失控预测方法、系统、设备及存储介质

预测模型训练热失控风险车辆电池电压训练集

一种基于图像处理技术的皮肤改进方法及系统

图像处理技术照片特征数据信息神经网络模型累积分布函数

一种基于新型算法的视频编码解码方法

视频编码解码方法新型算法视频特征数据流媒体技术编码算法

一种电瓶车违规充电的检测方法

电瓶车重构误差变分自动编码器数据解码器

一种基于数字孪生技术的智慧园区数字管理系统

数字管理系统全息数字数字孪生技术数字孪生建模集成模块