看不清就乱答?多模态大模型的这个毛病终于有解了 | ICML 2026
看不清就乱答?多模态大模型的这个毛病终于有解了 | ICML 2026雨雪、雾霾、镜头噪点、压缩失真、夜间弱光……
搜索
雨雪、雾霾、镜头噪点、压缩失真、夜间弱光……
自动驾驶世界模型的研究目标已经从单纯预测未来视觉帧,扩展到构建可用于场景理解、空间定位和后续决策的世界表示。如果模型只能生成外观上合理的未来图像,却无法回答场景中有哪些目标、目标位于何处,以及不同视角下的空间结构如何变化,那么它仍然缺少对三维驾驶环境的显式建模能力。
刚刚,开发者Jamieson O'Reilly用泄露的系统级Prompt,硬核解锁了「轻量版」的Fable 5。仅仅一行代码的注入,就让Opus 4.8当场「开智」。在极限对照实验中,O'Reilly给到同一个指令——制作一个现代苹果风的网页。
今天,除了全球(非美)被禁的 Claude Fable 5,AI 社区还被一个开源模型刷屏了。有推特博主发现,一个由巴西里约热内卢市政府旗下 IT 公司开源的模型 Rio 3.5 397B,在多项基准测试中超越了 Qwen 3.7 Plus 等开源模型,而这个模型的基础模型还是 Qwen3.5-397B-A17B。
最新测试显示,模型抱团后实力明显升级:Opus 4.8+GPT-5.5>Fable 5;Kimi K2.6+ DeepSeek V4 Pro+Gemini 3 Flash=Fable 5。能力追上了,开销还减半。根据官方定价,相比Fable 5,Kimi K2.6+ DeepSeek V4 Pro+Gemini 3 Flash这套平价阵容,成本降幅接近80%。
Minerva 正式公开上线了他们的 AI 营销平台,同时宣布完成了这轮融资。投资方名单相当亮眼:The General Partnership、8VC、Lingotto Innovation、Topology Ventures,还有 NBA 官方投资部门 NBA Investments。与此同时,他们还公布了与 OpenAI 的深度合作关系,
刚刚,Anthropic开始退款,截止日期为6月20日!美国一纸禁令,最强AI模型Fable 5说没就没,虽说能退款很好,但大多数用户,还是最想让它回来。
随着 Harvey 和 Legora 完成八位数融资轮次,法律工具已被证明是人工智能初创公司中增长最快、竞争最激烈的垂直领域之一。但尽管这些工具专注于私人执业,一些初创公司认为法律市场中仍有大量需求未被满足。
The Information 周一报道称,Google 在数月测试这家芯片制造商的技术后,决定委托英特尔生产部分张量处理单元(TPU)。该媒体指出,由于台湾芯片制造商台积电的产能持续供不应求,英特尔正从 Google 等企业获得订单。
GLM-5.2 是智谱迄今能力最强的开源模型,支持真正可用的 1M 上下文,并在长程任务中继续保持领先。它也依旧是我们心中最强的国产 Coding 模型。