一种语音识别方法、装置、电子设备及介质

申请号：CN202411845648

申请日期：2024-12-13

公开号：CN119811394A

公开日期：2025-04-11

类型：发明专利

摘要

本申请提供了一种语音识别方法、装置、电子设备及介质，所述方法包括：响应于用户的语音识别请求，获取待识别音频，对待识别音频进行采样得到初始音频数据，确定初始音频数据的频谱特征数据，根据频谱特征数据对初始音频数据进行处理，得到人声音频数据，拆分人声音频数据得到目标音频数据，将目标音频数据输入预先训练的语音识别模型进行并行识别，得到语音识别模型输出的初始文本序列，根据人声音频数据确定初始文本序列中的单词对应的起止时间，按照起止时间对初始文本序列中的单词进行排序，得到目标文本序列，将目标文本序列作为语音识别结果，并将语音识别结果展示给用户。本申请能够在保证识别速度的同时提高识别准确率，提升用户体验。

技术关键词

语音识别模型音频频谱特征语音识别方法序列训练文本数据注意力矩阵上存储计算机程序滤波器频率响应功率语音识别装置电子设备密度采样率线性

系统为您推荐了相关专利信息

一种基于混合分解与BiTCN-BiGRU的变压器油中溶解气体浓度预测方法

溶解气体浓度预测方法混合神经网络模型变分模态分解算法门控循环单元变压器油色谱气体

根据面试问题答案进行评分追问方法、装置和电子设备

答案电子设备处理器数学模型参数

一种检测与预测生物试剂生物活性的方法

光学检测模块数据采集模块统计学方法光学检测单元光源单元

一种基于USB的EQ测试方法及系统

待测芯片音频测试方法数据 USB线缆

自动泊车控制方法、装置及车辆

自动泊车控制方法轨迹图像序列生成训练数据