摘要
本申请实施例公开了一种针对图像的模型训练方法及装置。包括:获取包括多个第一图像样本的第一训练数据;利用第一训练数据对图像编码器进行预训练,其中利用图像编码器对第一图像样本进行第一编码,得到第一图像样本的第一隐空间表示,对第一隐空间表示进行切分得到多个分块,对部分分块对应的隐空间表示进行掩码处理得到掩码块,对未掩码的分块进行第二编码,得到未掩码的分块对应的特征表示;将未掩码的分块对应的特征表示和掩码块输入第一解码器进行解码,得到第一图像样本的第二隐空间表示;预训练目标包括:最小化第一隐空间表示和第二隐空间表示之间的差异。利用预训练得到的图像编码器构建图像处理模型后,能够大幅度加快模型的收敛速度。