一种语音识别方法及相关装置、设备和存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种语音识别方法及相关装置、设备和存储介质
申请号:CN202411007495
申请日期:2024-07-25
公开号:CN118982986A
公开日期:2024-11-19
类型:发明专利
摘要
本申请公开了一种语音识别方法及相关装置、设备和存储介质,其中,语音识别方法包括:基于待识别语音的语音特征,得到声学编码特征、帧级发音特征和段级发音特征;基于声学编码特征进行预测,得到待识别语音的预测发音序列,并基于预测发音序列,提取得到文本编码特征;获取声学编码特征与帧级发音特征的第一融合特征,并获取文本编码特征与段级发音特征的第二融合特征;基于第一融合特征和第二融合特征进行解码,得到待识别语音的语音识别文本。上述方案,能够提升语音识别的准确性。
技术关键词
编码特征 发音特征 融合特征 语音识别模型 样本 语音识别文本 语音识别方法 序列 语音特征 解码模型 度量 嵌入特征 交叉注意力机制 元素 语音识别装置