多方言语音识别系统及方法

申请号：CN202510401726

申请日期：2025-04-01

公开号：CN120260567A

公开日期：2025-07-04

类型：发明专利

摘要

本申请涉及语音识别技术领域，尤其涉及一种多方言语音识别系统及方法，包括接收输入的音频并提取音频特征，将音频特征同时输入到普通话链路识别模型和方言链路识别模型，方言链路识别模型包括多方言识别模型和语种分类模型，输出识别结果，基于语种分类模型的输出结果进行第一重决策，若是输出结果为方言，直接采用方言链路的识别结果作为最终结果。若是输出结果为普通话，则进入第二重决策判断，在第二重决策判断中，调用语义模型分别对普通话链路识别结果和方言链路识别结果进行语义置信度计算，采用语义置信度高的识别结果作为最终结果。本申请能够通过普通话链路和方言链路的并行处理，优化语音识别的准确性和适应性。

技术关键词

语音识别系统方言语音识别方法链路音频特征决策语义子模块增强子语音识别技术识别模块数据更新程序处理器输入模块可读存储介质存储器