一种基于对比学习的儿童语音表达错误识别与纠正方法

申请号：CN202511204637

申请日期：2025-08-27

公开号：CN121011207A

公开日期：2025-11-25

类型：发明专利

摘要

本发明公开了一种基于对比学习的儿童语音表达错误识别与纠正方法，包括：对输入的儿童语音信号进行预处理，得到对数梅尔频谱特征序列，通过改进的Transformer编码器转换为语音语义编码特征；基于年龄自适应正负样本选择机制，利用对比学习方法优化语音特征，获得增强的语音表示向量；构建多模态融合网络，结合增强的语音向量与BERT语言模型特征，通过多头交叉注意力和门控机制实现自适应融合，采用双向LSTM设计错误定位模块识别发音错误位置和类型，使用联合损失函数执行端到端训练；根据错误类型生成标准纠正音频，为儿童提供纠正指导。本发明实现儿童语音表达错误的高精度识别、定位和纠正，为儿童语言发展提供技术支撑。

技术关键词

语音纠正方法样本错误检测儿童频谱特征发音年龄编码器全局平均池化序列交叉注意力机制联合损失函数语义模态特征网络多模态文本高频特征