不让视觉语言模型「盲猜」,性能竟直接提升一倍?
不让视觉语言模型「盲猜」,性能竟直接提升一倍?近日,卡内基梅隆大学与华盛顿大学的研究团队推出了 NaturalBench,这是一项发表于 NeurIPS'24 的以视觉为核心的 VQA 基准。它通过自然图像上的简单问题——即自然对抗样本(Natural Adversarial Samples)——对视觉语言模型发起严峻挑战。
近日,卡内基梅隆大学与华盛顿大学的研究团队推出了 NaturalBench,这是一项发表于 NeurIPS'24 的以视觉为核心的 VQA 基准。它通过自然图像上的简单问题——即自然对抗样本(Natural Adversarial Samples)——对视觉语言模型发起严峻挑战。
在互联网发展史上,域名交易一直是科技巨头布局的重要一环。今日凌晨,OpenAI 首席执行官 Sam Altman 一如既往地搞“深夜突袭”,在社交媒体平台 X 上发布了一条简短的推文:“chat.com”。随后用户发现,这个域名直接跳转到了 ChatGPT 官方网站。
Segment Anything Model 2(SAM 2)在传统视频目标分割任务大放异彩,引起了众多关注。然而,港中文和上海 AI Lab 的研究团队发现 SAM 2 的贪婪选择策略容易陷入「错误累积」的问题,即一次错误的分割掩码选择将影响后续帧的分割结果,导致整个视频分割性能的下降。这个问题在长视频分割任务中显得更加严重。
实时API将完全改变我们与人工智能互动的方式,定制化AI模型成为主流,并且通过模型蒸馏实现低延迟、低成本、高性能,使AI更易使用、更高质量。
Sam Altman认为,人类历史发展的技术进步,就是通过创造更好的工具、再利用这些工具取得更惊人的成就。
OpenAI 2024年开发者大会第二场(伦敦场)刚结束。 10月初在旧金山举办了第一场 OpenAI 开发者大会,但这次没有像上一场放出很多花活,这次开始走剧透局了!
今天这篇,是一个「失败者」的创业故事。 一个先注册了 open.ai 域名,比 Sam Altman 抢先开始 AGI 理念和创业的人,被 OpenAI 起诉,被大家当成了「勒索犯」和「骗子」的故事。
今天,Meta 分享了一系列研究和模型,这些研究和模型支撑 Meta 实现高级机器智能(AMI)目标,同时也致力于开放科学和可复现性。
OpenAI o1 的发布,再次给 AI 领域带来了一场地震。 o1 能像人类一样「思考」复杂问题,拥有优秀的通用推理能力。在未经专门训练的情况下,o1 能够直接拿下数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。
AI 在改变获取信息的方式 Google,硅谷的代言人,AI 界的巨擘,技术牛,论文多,做给消费者用的 AI 产品,却几乎没有出圈的。 不过,也有一个例外:NotebookLM,甚至连死对头 Sam Altman 也觉得它很酷。