多方言语音识别系统及方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
多方言语音识别系统及方法
申请号:CN202510401726
申请日期:2025-04-01
公开号:CN120260567A
公开日期:2025-07-04
类型:发明专利
摘要
本申请涉及语音识别技术领域,尤其涉及一种多方言语音识别系统及方法,包括接收输入的音频并提取音频特征,将音频特征同时输入到普通话链路识别模型和方言链路识别模型,方言链路识别模型包括多方言识别模型和语种分类模型,输出识别结果,基于语种分类模型的输出结果进行第一重决策,若是输出结果为方言,直接采用方言链路的识别结果作为最终结果。若是输出结果为普通话,则进入第二重决策判断,在第二重决策判断中,调用语义模型分别对普通话链路识别结果和方言链路识别结果进行语义置信度计算,采用语义置信度高的识别结果作为最终结果。本申请能够通过普通话链路和方言链路的并行处理,优化语音识别的准确性和适应性。
技术关键词
语音识别系统 方言语音识别方法 链路 音频特征 决策 语义 子模块 增强子 语音识别技术 识别模块 数据更新 程序 处理器 输入模块 可读存储介质 存储器