语音识别的方法、服务器、存储介质和程序产品

申请号：CN202410753634

申请日期：2024-06-12

公开号：CN118645105A

公开日期：2024-09-13

类型：发明专利

摘要

本申请提供一种语音识别的方法、服务器、存储介质和程序产品。本申请的方法，在对语音数据进行语音识别时，通过语音识别模型提取语音数据的语音特征，对语音特征进行CTC处理，实现语音与文本的对齐，生成一个初步的文本序列预测结果，该初步的文本序列预测结果的长度也即是最终语音识别结果的长度；进一步地，根据初步的文本序列预测结果和语音特征，解码生成语音数据的语音识别结果，实现非自回归的语音识别，通过一步解码即可生成最终的语音识别结果，大大节省了解码输出语音识别结果的时间开销，提升了语音识别的速度和效率，并且可以取得较高的识别准确率。

技术关键词

语音特征语音识别模型文本样本时序序列声学特征标记数据语音识别方法计算机执行指令后处理模块特征提取模块解码模块编码模块服务器处理器可读存储介质