摘要
本申请涉及数据处理的领域,特别是涉及一种数据处理方法、装置、设备和介质,方法包括:将注意力机制模块进行调整,具体为将参数矩阵中的K矩阵的转置矩阵转换为第一卷积层,以及,将参数矩阵中的C矩阵转换为第二卷积层;将第一卷积层与参数矩阵中的Q矩阵对应的q张量进行卷积运算,得到第一张量;并将第一张量和第二卷积层进行卷积运算得到第二张量;将第二张量进行reshape操作得到目标矩阵;利用包含注意力机制模块的具有至少两段子模型的训练模型进行模型训练,得到数据处理模型。通过等效替换注意力机制中大计算量的算子,使得一些性能强劲的算子计算量简化,能够在小算力芯片上部署。