基于国际音标的发音词典自动构建方法、装置、设备及介质
申请号:CN202411112591
申请日期:2024-08-14
公开号:CN119107938A
公开日期:2024-12-10
类型:发明专利
摘要
本发明提供了一种基于国际音标的发音词典自动构建方法、装置、设备及介质,包括:建立以音素为隐变量的语音识别模型;使用联合随机近似方法对语音识别模型进行训练以及优化,实现自动构建发音词典。本发明能够完成输入音频特征序列即可得到其音素和文本的对应,相对于现有的技术,其利用预训练的模型能够在一种新的语言上进行任务,使用预训练的模型,能够方便地迁移到另一种新的语言上进行训练,得到该语言的发音词典,正确率高,同时便于维护,成本较低。
技术关键词
发音词典
自动构建方法
语音识别模型
音频特征
特征矢量序列
语音特征
神经网络参数
变量
词语
解码器
编码器
处理器通信
正确率
电子设备
介质