一种语音识别方法及相关装置、设备和存储介质
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种语音识别方法及相关装置、设备和存储介质
申请号:
CN202411007495
申请日期:
2024-07-25
公开号:
CN118982986A
公开日期:
2024-11-19
类型:
发明专利
摘要
本申请公开了一种语音识别方法及相关装置、设备和存储介质,其中,语音识别方法包括:基于待识别语音的语音特征,得到声学编码特征、帧级发音特征和段级发音特征;基于声学编码特征进行预测,得到待识别语音的预测发音序列,并基于预测发音序列,提取得到文本编码特征;获取声学编码特征与帧级发音特征的第一融合特征,并获取文本编码特征与段级发音特征的第二融合特征;基于第一融合特征和第二融合特征进行解码,得到待识别语音的语音识别文本。上述方案,能够提升语音识别的准确性。
技术关键词
编码特征
发音特征
融合特征
语音识别模型
样本
语音识别文本
语音识别方法
序列
语音特征
解码模型
度量
嵌入特征
交叉注意力机制
元素
语音识别装置