摘要
本发明提供基于人工智能实训平台移动端模型轻量化方法,人工智能模型优化与移动端部署技术领域,包括:步骤1:对目标AI语音模型的各卷积层进行权重参数监测,在检测到冗余参数时,计算层重要性得分和参数稀疏度,并进行剪枝可行性分析和量化可行性分析,获得目标剪枝系数和目标量化系数;步骤2:计算所述关联推理任务对所述目标AI语音模型各层的依赖性权重,获得依赖关系网络;步骤3:获得最终剪枝阈值和剪枝比例;步骤4:采用所述最终剪枝阈值和剪枝比例进行分层剪枝操作,获得剪枝后模型;步骤5:生成轻量化模型,并输出移动端部署性能报告。提升AI语音模型在移动端的部署效率与响应性能。