
ECCV 2024 | 让GPT-4图像理解更易出错,全新策略增强VLP模型对抗迁移性
ECCV 2024 | 让GPT-4图像理解更易出错,全新策略增强VLP模型对抗迁移性针对视觉-语言预训练(Vision-Language Pretraining, VLP)模型的对抗攻击,现有的研究往往仅关注对抗轨迹中对抗样本周围的多样性,但这些对抗样本高度依赖于代理模型生成,存在代理模型过拟合的风险。
针对视觉-语言预训练(Vision-Language Pretraining, VLP)模型的对抗攻击,现有的研究往往仅关注对抗轨迹中对抗样本周围的多样性,但这些对抗样本高度依赖于代理模型生成,存在代理模型过拟合的风险。
低秩适应(Low-Rank Adaptation,LoRA)通过可插拔的低秩矩阵更新密集神经网络层,是当前参数高效微调范式中表现最佳的方法之一。此外,它在跨任务泛化和隐私保护方面具有显著优势。
离开快手创业后,「李岩」悄悄拿到了快手联合创始人宿华、红点创投以及经纬创投的3200万美金种子轮融资。
具身智能是过去一年中和 LLM 一样受到市场高度关注的领域,通用机器人领域什么时候会出现「iPhone 时刻」?这是所有人都关注的问题。拾象团队在过去一年中也深度追踪通用机器人和机器人 foundation model 的进展。本篇文章是我们对机器人领域研究的开源。
AI 视频生成公司 HeyGen 最近完成了 6000 万美元的 A 轮融资,公司估值已达 5 亿美元。此次融资由 Benchmark 领投,Conviction、Thrive Capital 和 Bond Capital 参与。截至目前,HeyGen 已累计筹到 7400 万美元。
7月5日,PPTV创始人、PPIO派欧云联合创始人&CEO姚欣,与大家分享了AI世界相对确定的当下和充满想象力的远方,一同用前瞻性的眼光进行长期性规划,积极拥抱新技术。
无需训练或微调,在提示词指定的新场景中克隆参考视频的运动,无论是全局的相机运动还是局部的肢体运动都可以一键搞定。
当前的视觉语言模型(VLM)主要通过 QA 问答形式进行性能评测,而缺乏对模型基础理解能力的评测,例如 detail image caption 性能的可靠评测手段。
2022年,美图CEO吴欣鸿将年度总结的主题,从“居安思危”改成了“居危思危”。
740 TFLOPS!迄今最强 FlashAttention 来了。