摘要
本发明提供一种语音识别方法、装置、系统、电子设备和存储介质,其中方法应用于终端设备,包括:基于语音信号的语种信息,对语音信号进行声学特征提取,得到声学特征,并对声学特征进行解码,得到语音信号的多个初始识别结果;确定语音信号的语音识别结果;语音识别结果是在各初始识别结果、声学特征和语种信息的基础上,应用语音识别模型进行语义纠错得到的;语音识别模型是在大型语言模型的基础上构建的,克服了目前多语种语音识别准确率低,易误判的缺陷,通过两步式的识别流程,先在本地快速生成多个初始识别结果,再利用大模型强大的语义理解能力,并融合声学特征和语种信息进行多模态的深度纠错,从而极大地提升了多语种语音识别的准确率。