一种通用命令词识别模型的训练方法及装置

申请号：CN202510442234

申请日期：2025-04-09

公开号：CN120431906A

公开日期：2025-08-05

类型：发明专利

摘要

本发明提供一种通用命令词识别模型的训练方法及装置，属于语音识别技术领域，其中，通用命令词识别模型的训练方法包括：对自动语音识别模型进行蒸馏，得到轻量化的学生模型；在学生模型的基础上，加入LoRA模型、热词后处理模块以及校验模块，构建通用命令词识别模型；将训练音频输入到通用命令词识别模型中进行训练，并在训练过程中根据是否包含热词选择不同的训练策略。本发明中的训练方法，通过LoRA模型实现命令词的定制化，使得模型具有更优的命令词识别效果及覆盖面，兼容命令词识别及连续语音识别，减少了模型优化时间及所需命令词训练语料，并且将热词增强算法拟合到网络中，解决了内存随热词个数不断增加的问题，且提高识别速度。

技术关键词

后处理模块校验模块自动语音识别学生命令网络层结构训练装置注意力标签蒸馏音频连续语音识别参数语音识别技术网络结构校正旁路处理单元基础