基于Zip-MoE模型分组混合专家层的中英文语音识别方法和系统
申请号:CN202510607710
申请日期:2025-05-13
公开号:CN120126451B
公开日期:2025-07-18
类型:发明专利
摘要
本申请提出一种基于Zip‑MoE模型分组混合专家层的中英文语音识别方法和系统,Zip‑MoE模型包括6个编码器块,每两个编码器块间包含一个Bypass模块,学习前一个编码器块输出和当前编码器块输出加权的权重;前3个编码器块为标准的Zipformer结构;后3个编码器块采用含分组混合专家层的Zipformer‑MoE结构,用分组混合专家层替代Zipformer结构的最后一个前馈网络;分组混合专家层包括中文专家组、英文专家组和语种路由器,专家组均由若干个专家网络构成并分别配置无监督路由器。缓解了语种混淆的问题,能够适配不同时延流式场景,灵活扩展专家数量,无需进行预训练,大大提高了中英文的识别效率。
技术关键词
路由器
无监督
语音识别方法
Softmax函数
掩码矩阵
语种识别
语音特征
代表
结构编码器
语音识别系统
索引
计算机程序产品
网络
模块
上采样
字词
时延