多模态扩散模型开始爆发,这次是高速可控还能学习推理的LaViDa 多模态扩散模型开始爆发,这次是高速可控还能学习推理的LaViDa 关键词: AI,模型训练,LaViDa,人工智能 近段时间,已经出现了不少基于扩散模型的语言模型,而现在,基于扩散模型的视觉-语言模型(VLM)也来了,即能够联合处理视觉和文本信息的模型。今天我们介绍的这个名叫 LaViDa,继承了扩散语言模型高速且可控的优点,并在实验中取得了相当不错的表现。 来自主题: AI技术研报 6952 点击 2025-06-01 17:58