语音识别方法、装置、系统、电子设备和存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
语音识别方法、装置、系统、电子设备和存储介质
申请号:CN202511200197
申请日期:2025-08-26
公开号:CN120913565A
公开日期:2025-11-07
类型:发明专利
摘要
本发明提供一种语音识别方法、装置、系统、电子设备和存储介质,其中方法应用于终端设备,包括:基于语音信号的语种信息,对语音信号进行声学特征提取,得到声学特征,并对声学特征进行解码,得到语音信号的多个初始识别结果;确定语音信号的语音识别结果;语音识别结果是在各初始识别结果、声学特征和语种信息的基础上,应用语音识别模型进行语义纠错得到的;语音识别模型是在大型语言模型的基础上构建的,克服了目前多语种语音识别准确率低,易误判的缺陷,通过两步式的识别流程,先在本地快速生成多个初始识别结果,再利用大模型强大的语义理解能力,并融合声学特征和语种信息进行多模态的深度纠错,从而极大地提升了多语种语音识别的准确率。
技术关键词
语音识别模型 语音识别方法 云端服务器 语义特征 音频 终端设备 置信度阈值 样本 上下文特征 信号 纠错 文本 多语种语音 适配器 编码器 语音识别装置 融合声学特征