一种基于大语言模型的语音识别方法、装置及设备

申请号：CN202510830908

申请日期：2025-06-20

公开号：CN120412560A

公开日期：2025-08-01

类型：发明专利

摘要

本说明书实施例提供一种基于大语言模型的语音识别方法。该方法包括：获取待输入语音；通过音频编码器从待输入语音中提取语音特征；利用连接时序分类预测层对所述语音特征进行解码，得到连接时序分类预测结果；将所述语音特征和连接时序分类预测结果作为提示内容输入至大语言模型，所述大语言模型根据所述提示内容生成语音识别结果。通过本发明提供的方法，可以缓解大语言模型的幻觉问题，能够提升语音识别的准确性。

技术关键词

大语言模型语音特征时序语音识别方法字符生成语音音频编码器语音识别装置语音识别模块特征提取模块序列解码模块处理器矩阵存储器电子设备文本标记