摘要
本申请提供一种语音识别的方法、服务器、存储介质和程序产品。本申请的方法,在对语音数据进行语音识别时,通过语音识别模型提取语音数据的语音特征,对语音特征进行CTC处理,实现语音与文本的对齐,生成一个初步的文本序列预测结果,该初步的文本序列预测结果的长度也即是最终语音识别结果的长度;进一步地,根据初步的文本序列预测结果和语音特征,解码生成语音数据的语音识别结果,实现非自回归的语音识别,通过一步解码即可生成最终的语音识别结果,大大节省了解码输出语音识别结果的时间开销,提升了语音识别的速度和效率,并且可以取得较高的识别准确率。