摘要
本申请实施例提供了一种张量内存搬运方法、设备、存储介质及程序产品,涉及人工智能技术领域,该方法包括:从原始张量的多个张量数据块中选取参考数据块,并先获得参考数据块的内存映射后的参考内存地址,然后基于参考数据块的参考内存地址、每个张量数据块在线程维度上相较于参考数据块的第一内存偏移量,以及每个张量数据块在张量数据块维度上相较于参考数据块的第二内存偏移量,确定每个张量数据块的目标内存地址。由于在内存地址映射时考虑了线程维度上的内存偏移量,因此,无论张量数据的形状在最后一个维度上是否按照张量数据块对齐,都可实现准确的内存地址映射,从而提高内存搬运功能的泛化性和通用性,进而提升内存搬运算子的性能。