一种面向构音障碍群体的语音识别方法及系统

申请号：CN202510808684

申请日期：2025-06-17

公开号：CN120656444A

公开日期：2025-09-16

类型：发明专利

摘要

本发明涉及一种面向构音障碍群体的语音识别方法及系统，方法包括：采集构音障碍语音数据，对构音障碍语音数据进行预处理，获取有效语音段；将有效语音段输入构音障碍语音识别模型，获取音素级或汉字级的识别结果；构音障碍语音识别模型利用第一训练集训练Conformer模型获得，第一训练集包括：伪造构音障碍音频数据；伪造构音障碍音频数据基于CycleGAN‑VC语音转换模型进行语音转换获得；在第一训练集训练模型过程中，调整Conformer模型的模型参数，并通过鲸鱼优化算法优化Conformer模型。本发明能够提高构音障碍语音识别的准确性和鲁棒性。

技术关键词

语音识别方法语音识别模型梅尔频率倒谱系数训练集鲸鱼优化算法感知线性预测数据音频频谱特征提取语音识别系统语音识别模块滤波器汉字采样率参数存储单元采样点处理单元