英语口语教学语音识别处理系统及方法

申请号：CN202511142767

申请日期：2025-08-15

公开号：CN120877769A

公开日期：2025-10-31

类型：发明专利

摘要

本发明公开了英语口语教学语音处理系统及方法，属于教育技术与语音处理领域。通过高灵敏度麦克风采集多场景语音数据，利用Cnfrmer+LSTM架构进行语音识别，结合梅尔倒谱系数提取特征，构建包含地域方言特征库与等级评估体系的三维教学框架。针对山东、广东等方言区的发音混淆点，如/r/l/、/ʒ/s/混淆，通过44个音素级双分支神经网络建模，实现“地域等级音素”三维分类。借助近端策略优化算法动态调整教学策略，结合Autoencoder+t‑SNE聚类与MAML元学习实现模型迭代。系统支持AR口型指导与多模态反馈，山东学生实验组音素错误率（PER）降低28%，模型内存占用降低99%，处理延迟＜80ms，有效解决传统教学同质化、评估滞后问题，适用于在线教育与课堂教学场景。

技术关键词

双分支网络英语口语教学错误率语音梅尔倒谱系数地域方言注意力机制高灵敏度麦克风课堂教学场景麦克风阵列采集发音元学习算法学生识别方言多节点线性回归模型多场景离散余弦变换