一种多英语口音的语音识别方法及系统

申请号：CN202410819623

申请日期：2024-06-24

公开号：CN118782092A

公开日期：2024-10-15

类型：发明专利

摘要

本发明公开一种多英语口音的语音识别方法及系统，属于口音识别领域。针对现有英语口音识别精度差且成本高的问题，本发明提供一种多英语口音的语音识别方法，包括采集音频数据；对音频数据进行特征提取，并根据特征计算该音频数据的特征向量值；根据特征向量值判断该音频数据所属的口音类别；根据音频数据所属的口音类别选择对应的预训练模型对音频数据进行语音识别。本发明根据音频的特征向量值确定音频数据所属的口音类别，避免直接根据音频说话人所属地域来划分口音类别所造成的误差；避免使用一种通用模型所带来的识别不准确的问题；整个识别方法实现了便携式低资源计算的英语口音识别，在混合多种英语口音的应用场景下，有效提高识别率。

技术关键词

语音识别方法特征向量值英语音频训练识别模型语音采集模块语音识别系统麦克风阵列信号处理模块数据存储模块识别模块解码场景误差资源精度