基于国际音标的发音词典自动构建方法、装置、设备及介质

申请号：CN202411112591

申请日期：2024-08-14

公开号：CN119107938A

公开日期：2024-12-10

类型：发明专利

摘要

本发明提供了一种基于国际音标的发音词典自动构建方法、装置、设备及介质，包括：建立以音素为隐变量的语音识别模型；使用联合随机近似方法对语音识别模型进行训练以及优化，实现自动构建发音词典。本发明能够完成输入音频特征序列即可得到其音素和文本的对应，相对于现有的技术，其利用预训练的模型能够在一种新的语言上进行任务，使用预训练的模型，能够方便地迁移到另一种新的语言上进行训练，得到该语言的发音词典，正确率高，同时便于维护，成本较低。

技术关键词

发音词典自动构建方法语音识别模型音频特征特征矢量序列语音特征神经网络参数变量词语解码器编码器处理器通信正确率电子设备介质