构音障碍语音的个性化合成与识别增强方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
构音障碍语音的个性化合成与识别增强方法
申请号:CN202510359114
申请日期:2025-03-25
公开号:CN120412540A
公开日期:2025-08-01
类型:发明专利
摘要
本发明公开了一种构音障碍语音的个性化合成与识别增强方法,构音障碍语音合成模型包括:长程依赖特征编码模块、非稳态特征编码模块和解码模块,构音障碍语音合成模型的输入包括样本,输出包括合成构音障碍语音,样本为构音障碍文本序列;长程依赖特征编码模块的输入包括样本、输出为对齐向量z;非稳态特征编码模块的输入包括对齐向量z、输出为最终嵌入表示解码模块的输入为最终嵌入表示输出为合成构音障碍语音。本发明的构音障碍语音合成模型提升了对构音障碍语音个性化特征的提取能力和语音合成性能以及构音障碍语音特征的精细化表达能力。
技术关键词
编码模块 稳态特征 特征提取模块 随机噪声 依赖特征 解码模块 对齐模块 样本 音频 语音识别模型 个性化特征 语音特征 序列 错误率 文本 阶段
系统为您推荐了相关专利信息
预测模型训练 热失控风险 车辆电池 电压 训练集
图像处理技术 照片 特征数据信息 神经网络模型 累积分布函数
视频编码解码方法 新型算法 视频特征数据 流媒体技术 编码算法
电瓶车 重构误差 变分自动编码器 数据 解码器
数字管理系统 全息数字 数字孪生技术 数字孪生建模 集成模块