摘要
本申请提供一种算力引擎构建方法、装置、设备和存储介质。涉及计算机数据处理技术领域。该方法基于一种计算芯片,该计算芯片包括处理单元架构、第一存储器以及第二存储器,处理单元架构与第一存储器和第二存储器连接,处理单元架构包括至少两个处理单元阵列;该方法包括:根据神经网络中每一层的权重,将原始张量逐步分解为多个子张量;其中,各个子张量的秩满足设定要求;将多个子张量存储于所述第一存储器中;根据子张量的排序顺序以及各子张量之间的计算依赖关系,确定计算顺序;根据计算顺序,利用处理单元架构执行并行计算。本申请通过提出新的张量核构建和计算排序机制,减少计算冗余,从而显著提高计算效率。