语音识别方法、装置、系统、电子设备和存储介质

申请号：CN202511200197

申请日期：2025-08-26

公开号：CN120913565A

公开日期：2025-11-07

类型：发明专利

摘要

本发明提供一种语音识别方法、装置、系统、电子设备和存储介质，其中方法应用于终端设备，包括：基于语音信号的语种信息，对语音信号进行声学特征提取，得到声学特征，并对声学特征进行解码，得到语音信号的多个初始识别结果；确定语音信号的语音识别结果；语音识别结果是在各初始识别结果、声学特征和语种信息的基础上，应用语音识别模型进行语义纠错得到的；语音识别模型是在大型语言模型的基础上构建的，克服了目前多语种语音识别准确率低，易误判的缺陷，通过两步式的识别流程，先在本地快速生成多个初始识别结果，再利用大模型强大的语义理解能力，并融合声学特征和语种信息进行多模态的深度纠错，从而极大地提升了多语种语音识别的准确率。

技术关键词

语音识别模型语音识别方法云端服务器语义特征音频终端设备置信度阈值样本上下文特征信号纠错文本多语种语音适配器编码器语音识别装置融合声学特征