摘要
本发明涉及一种基于泰老发音相似性的老挝语声学表征方法,属于自然语言处理技术领域。包括:对泰语、老挝语音频及文本数据进行统一预处理,构建泰语、老挝语词表;采用多语言自监督预训练模型,先用泰语训练集及泰语词表微调高层参数,冻结低层特征提取器,优化CTC损失,得到泰语微调后的模型;加载泰语微调后的模型,去除原泰语分类层,基于老挝语词表新建分类层并随机初始化,利用老挝语训练集进一步微调Transformer编码器及新分类层,优化CTC损失,得到适用于老挝语的声学表征模型;加载声学表征模型,在老挝语测试集上进行推理,计算CER,评估声学表征与识别性能。本发明显著提升了低资源语言老挝语的语音识别性能。