基于多配置分块上下文转换器模型的语音识别方法及装置

申请号：CN202510027286

申请日期：2025-01-08

公开号：CN119446125B

公开日期：2025-04-29

类型：发明专利

摘要

本发明提供一种基于多配置分块上下文转换器模型的语音识别方法及装置，属于人工智能技术领域，该方法包括：获取待识别语音的特征序列；将特征序列输入至经过训练的语音识别模型，利用语音识别模型对待识别语音进行语音识别，得到语音识别模型输出的识别结果；语音识别模型为多配置分块上下文转换器MCC‑Transformer模型，MCC‑Transformer模型是在转换器模型的基础上，在编码器中引入一个语音MCC‑Transformer块构建而成，语音MCC‑Transformer块由多个MCC‑Transformer块堆叠而成。本发明在编码器中引入一个由多个MCC‑Transformer块堆叠而成的语音MCC‑Transformer块，提高了语音识别的准确率。

技术关键词

语音识别模型语音识别方法分块转换器注意力解码器机制编码器非暂态计算机可读存储介质序列文本语音识别装置级联处理器人工智能技术计算机程序产品识别模块基础