字节发布视觉基础模型ViTamin,多项任务实现SOTA,入选CVPR2024 字节发布视觉基础模型ViTamin,多项任务实现SOTA,入选CVPR2024 关键词: ViTamin,视觉基础模型,SOTA,Transformer,模型训练 视觉语言模型屡屡出现新突破,但ViT仍是图像编码器的首选网络结构。 来自主题: AI技术研报 4789 点击 2024-04-27 12:15