基于Zip-MoE模型分组混合专家层的中英文语音识别方法和系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于Zip-MoE模型分组混合专家层的中英文语音识别方法和系统
申请号:CN202510607710
申请日期:2025-05-13
公开号:CN120126451B
公开日期:2025-07-18
类型:发明专利
摘要
本申请提出一种基于Zip‑MoE模型分组混合专家层的中英文语音识别方法和系统,Zip‑MoE模型包括6个编码器块,每两个编码器块间包含一个Bypass模块,学习前一个编码器块输出和当前编码器块输出加权的权重;前3个编码器块为标准的Zipformer结构;后3个编码器块采用含分组混合专家层的Zipformer‑MoE结构,用分组混合专家层替代Zipformer结构的最后一个前馈网络;分组混合专家层包括中文专家组、英文专家组和语种路由器,专家组均由若干个专家网络构成并分别配置无监督路由器。缓解了语种混淆的问题,能够适配不同时延流式场景,灵活扩展专家数量,无需进行预训练,大大提高了中英文的识别效率。
技术关键词
路由器 无监督 语音识别方法 Softmax函数 掩码矩阵 语种识别 语音特征 代表 结构编码器 语音识别系统 索引 计算机程序产品 网络 模块 上采样 字词 时延