一种面向构音障碍群体的语音识别方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种面向构音障碍群体的语音识别方法及系统
申请号:CN202510808684
申请日期:2025-06-17
公开号:CN120656444A
公开日期:2025-09-16
类型:发明专利
摘要
本发明涉及一种面向构音障碍群体的语音识别方法及系统,方法包括:采集构音障碍语音数据,对构音障碍语音数据进行预处理,获取有效语音段;将有效语音段输入构音障碍语音识别模型,获取音素级或汉字级的识别结果;构音障碍语音识别模型利用第一训练集训练Conformer模型获得,第一训练集包括:伪造构音障碍音频数据;伪造构音障碍音频数据基于CycleGAN‑VC语音转换模型进行语音转换获得;在第一训练集训练模型过程中,调整Conformer模型的模型参数,并通过鲸鱼优化算法优化Conformer模型。本发明能够提高构音障碍语音识别的准确性和鲁棒性。
技术关键词
语音识别方法 语音识别模型 梅尔频率倒谱系数 训练集 鲸鱼优化算法 感知线性预测 数据 音频 频谱特征提取 语音识别系统 语音识别模块 滤波器 汉字 采样率 参数 存储单元 采样点 处理单元