一种基于大语言模型的语音识别方法、装置及设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于大语言模型的语音识别方法、装置及设备
申请号:CN202510830908
申请日期:2025-06-20
公开号:CN120412560A
公开日期:2025-08-01
类型:发明专利
摘要
本说明书实施例提供一种基于大语言模型的语音识别方法。该方法包括:获取待输入语音;通过音频编码器从待输入语音中提取语音特征;利用连接时序分类预测层对所述语音特征进行解码,得到连接时序分类预测结果;将所述语音特征和连接时序分类预测结果作为提示内容输入至大语言模型,所述大语言模型根据所述提示内容生成语音识别结果。通过本发明提供的方法,可以缓解大语言模型的幻觉问题,能够提升语音识别的准确性。
技术关键词
大语言模型 语音特征 时序 语音识别方法 字符 生成语音 音频编码器 语音识别装置 语音识别模块 特征提取模块 序列 解码模块 处理器 矩阵 存储器 电子设备 文本 标记