摘要
本发明公开了一种稀疏矩阵乘法加速硬件、推荐系统加速方法和AI芯片。该硬件中的数据加载单元,针对稀疏矩阵乘法任务中稠密数据,建立数据搬运任务,将稠密数据搬运至寄存器;归一化加速单元组,根据从寄存器获取的左右矩阵分块执行乘法前激活操作后,将各左右矩阵分块发送至乘法计算单元组;乘法计算单元组,用于根据左右矩阵分块的数据规模,选择乘法计算单元实施乘法计算,并将计算结果提供给加法计算单元组实施加法计算;归一化加速单元组,还用于在需要进行乘法后归一化和/或乘法后激活操作时,根据加法计算结果,实施归一化计算和/或激活操作,得到最终结果。本实施例的技术方案可以在有限的计算资源下,实现快速的稀疏矩阵乘法计算。