RAE+VAE? 预训练表征助力扩散模型Tokenizer,加速像素压缩到语义提取 RAE+VAE? 预训练表征助力扩散模型Tokenizer,加速像素压缩到语义提取 关键词: AI,模型训练,RAE,VFM-VAE 近期,RAE(Diffusion Transformers with Representation Autoencoders)提出以「 冻结的预训练视觉表征」直接作为潜空间,以显著提升扩散模型的生成性能。 来自主题: AI技术研报 9856 点击 2025-11-14 10:21