基于多配置分块上下文转换器模型的语音识别方法及装置
申请号:CN202510027286
申请日期:2025-01-08
公开号:CN119446125B
公开日期:2025-04-29
类型:发明专利
摘要
本发明提供一种基于多配置分块上下文转换器模型的语音识别方法及装置,属于人工智能技术领域,该方法包括:获取待识别语音的特征序列;将特征序列输入至经过训练的语音识别模型,利用语音识别模型对待识别语音进行语音识别,得到语音识别模型输出的识别结果;语音识别模型为多配置分块上下文转换器MCC‑Transformer模型,MCC‑Transformer模型是在转换器模型的基础上,在编码器中引入一个语音MCC‑Transformer块构建而成,语音MCC‑Transformer块由多个MCC‑Transformer块堆叠而成。本发明在编码器中引入一个由多个MCC‑Transformer块堆叠而成的语音MCC‑Transformer块,提高了语音识别的准确率。
技术关键词
语音识别模型
语音识别方法
分块
转换器
注意力
解码器
机制
编码器
非暂态计算机可读存储介质
序列
文本
语音识别装置
级联
处理器
人工智能技术
计算机程序产品
识别模块
基础