摘要
本发明涉及语音识别技术领域,公开了一种针对小语种的语音识别算法,包括:S1:构建多语种关键词平行语料库;S2:通过对多语种关键词平行语料库进行分析,获得各其他语种与目标小语种的关键词发音相似指数,并筛选出若干个第一参考语种;S3:构建综合平行语料库;S4:将综合平行语料库的语料信息划分为若干个语料分析单元;S5:筛选出目标语料分析单元;S6:根据综合平行语料库的语料信息数据筛选出各目标语料分析单元的目标迁移语种;S7:根据各目标语料分析单元的目标迁移语种进行跨语种迁移建模;实现了从海量语种中精准定位最优迁移源的目标;有效解决了目标小语种因数据稀缺而导致的模型训练困难问题。