一种基于对比学习的儿童语音表达错误识别与纠正方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于对比学习的儿童语音表达错误识别与纠正方法
申请号:CN202511204637
申请日期:2025-08-27
公开号:CN121011207A
公开日期:2025-11-25
类型:发明专利
摘要
本发明公开了一种基于对比学习的儿童语音表达错误识别与纠正方法,包括:对输入的儿童语音信号进行预处理,得到对数梅尔频谱特征序列,通过改进的Transformer编码器转换为语音语义编码特征;基于年龄自适应正负样本选择机制,利用对比学习方法优化语音特征,获得增强的语音表示向量;构建多模态融合网络,结合增强的语音向量与BERT语言模型特征,通过多头交叉注意力和门控机制实现自适应融合,采用双向LSTM设计错误定位模块识别发音错误位置和类型,使用联合损失函数执行端到端训练;根据错误类型生成标准纠正音频,为儿童提供纠正指导。本发明实现儿童语音表达错误的高精度识别、定位和纠正,为儿童语言发展提供技术支撑。
技术关键词
语音 纠正方法 样本 错误检测 儿童 频谱特征 发音 年龄 编码器 全局平均池化 序列 交叉注意力机制 联合损失函数 语义 模态特征 网络 多模态 文本 高频特征