摘要
本申请提供了一种语音识别方法、装置、电子设备及介质,所述方法包括:响应于用户的语音识别请求,获取待识别音频,对待识别音频进行采样得到初始音频数据,确定初始音频数据的频谱特征数据,根据频谱特征数据对初始音频数据进行处理,得到人声音频数据,拆分人声音频数据得到目标音频数据,将目标音频数据输入预先训练的语音识别模型进行并行识别,得到语音识别模型输出的初始文本序列,根据人声音频数据确定初始文本序列中的单词对应的起止时间,按照起止时间对初始文本序列中的单词进行排序,得到目标文本序列,将目标文本序列作为语音识别结果,并将语音识别结果展示给用户。本申请能够在保证识别速度的同时提高识别准确率,提升用户体验。