摘要
本发明提供一种通用命令词识别模型的训练方法及装置,属于语音识别技术领域,其中,通用命令词识别模型的训练方法包括:对自动语音识别模型进行蒸馏,得到轻量化的学生模型;在学生模型的基础上,加入LoRA模型、热词后处理模块以及校验模块,构建通用命令词识别模型;将训练音频输入到通用命令词识别模型中进行训练,并在训练过程中根据是否包含热词选择不同的训练策略。本发明中的训练方法,通过LoRA模型实现命令词的定制化,使得模型具有更优的命令词识别效果及覆盖面,兼容命令词识别及连续语音识别,减少了模型优化时间及所需命令词训练语料,并且将热词增强算法拟合到网络中,解决了内存随热词个数不断增加的问题,且提高识别速度。