摘要
本申请涉及计算机视觉技术领域,特别涉及一种红外耦合编辑扩散生成模型的训练方法,包括:将样本纯净红外目标图像输入至总体特征提取器中,通过令牌的方式,将样本纯净红外目标图像分别编码为全局令牌和补丁令牌,将两种令牌进行拼接后再对齐到训练所需的潜空间中,得到总体特征;通过高通滤波、小波变换、或离散余弦变换对样本纯净红外目标图像进行处理,得到高频映射图,将高频映射图贴合到样本背景图像的指定位置后输入至细节特征提取器中,得到细节特征;构建红外耦合编辑扩散生成模型,将总体特征和细节特征一起注入到红外耦合编辑扩散生成模型中进行训练,从而快速训练得到能够调控目标形状和姿态的红外耦合编辑扩散生成模型。