一种通用命令词识别模型的训练方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种通用命令词识别模型的训练方法及装置
申请号:CN202510442234
申请日期:2025-04-09
公开号:CN120431906A
公开日期:2025-08-05
类型:发明专利
摘要
本发明提供一种通用命令词识别模型的训练方法及装置,属于语音识别技术领域,其中,通用命令词识别模型的训练方法包括:对自动语音识别模型进行蒸馏,得到轻量化的学生模型;在学生模型的基础上,加入LoRA模型、热词后处理模块以及校验模块,构建通用命令词识别模型;将训练音频输入到通用命令词识别模型中进行训练,并在训练过程中根据是否包含热词选择不同的训练策略。本发明中的训练方法,通过LoRA模型实现命令词的定制化,使得模型具有更优的命令词识别效果及覆盖面,兼容命令词识别及连续语音识别,减少了模型优化时间及所需命令词训练语料,并且将热词增强算法拟合到网络中,解决了内存随热词个数不断增加的问题,且提高识别速度。
技术关键词
后处理模块 校验模块 自动语音识别 学生 命令 网络层结构 训练装置 注意力 标签 蒸馏 音频 连续语音识别 参数 语音识别技术 网络结构 校正 旁路 处理单元 基础