语音识别的方法、服务器、存储介质和程序产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
语音识别的方法、服务器、存储介质和程序产品
申请号:CN202410753634
申请日期:2024-06-12
公开号:CN118645105A
公开日期:2024-09-13
类型:发明专利
摘要
本申请提供一种语音识别的方法、服务器、存储介质和程序产品。本申请的方法,在对语音数据进行语音识别时,通过语音识别模型提取语音数据的语音特征,对语音特征进行CTC处理,实现语音与文本的对齐,生成一个初步的文本序列预测结果,该初步的文本序列预测结果的长度也即是最终语音识别结果的长度;进一步地,根据初步的文本序列预测结果和语音特征,解码生成语音数据的语音识别结果,实现非自回归的语音识别,通过一步解码即可生成最终的语音识别结果,大大节省了解码输出语音识别结果的时间开销,提升了语音识别的速度和效率,并且可以取得较高的识别准确率。
技术关键词
语音特征 语音识别模型 文本 样本 时序 序列 声学特征 标记 数据 语音识别方法 计算机执行指令 后处理模块 特征提取模块 解码模块 编码模块 服务器 处理器 可读存储介质