摘要
本申请涉及一种张量拆分结果验证方法、装置、计算机设备和存储介质,所属领域为计算机技术领域,所述方法包括:基于预设量化位数,对深度学习模型中目标层级的目标权重进行量化处理,得到量化处理结果;对量化处理结果进行压缩处理,并对压缩处理结果进行张量拆分,以生成预设格式的文件;响应于检测到张量拆分结果验证请求时,对预设格式的文件进行解析,得到解析结果;基于解析结果,确定深度学习模型的第一推理结果,并基于第一推理结果和第二推理结果,对张量拆分结果进行验证,第二推理结果为基于未进行权重张量拆分处理的深度学习模型确定的推理结果。本申请可以有效地提高int4量化模型张量并行推理的开发效率。