模型的训练方法、装置、音素识别方法、设备及介质

申请号：CN202411595580

申请日期：2024-11-11

公开号：CN119091858B

公开日期：2025-03-18

类型：发明专利

摘要

本申请公开了一种模型的训练方法、装置、音素识别方法、设备及介质。该模型包括嵌入网络、嵌合网络和生成网络，该方法包括：获取语言的训练声学特征向量序列、训练文本特征向量序列及训练音素序列，利用嵌入网络对训练音素序列转换得到训练嵌入特征向量，利用嵌合网络基于训练声学特征向量序列和训练文本特征向量序列进行计算，得到多个训练隐向量序列，利用生成网络，基于训练嵌入特征向量和多个训练隐向量序列，计算预测音素概率向量序列和训练音素标签向量序列，基于预测音素概率向量序列和训练音素标签向量序列计算训练损失，基于损失对音素识别模型的模型参数进行调整，继续对调整后的音素识别模型训练，直至达到收敛条件得到音素识别模型。

技术关键词

文本特征向量序列音素识别方法标签编码识别模型训练多头注意力机制前馈神经网络可读存储介质处理器训练装置模块参数存储器计算机电子设备