
异议!顶流AI决战「逆转裁判」:o1险胜Gemini 2.5登顶、Llama 4零分垫底
异议!顶流AI决战「逆转裁判」:o1险胜Gemini 2.5登顶、Llama 4零分垫底悬疑小说的最后一页,隐藏着罪犯的真相。《逆转裁判》的法庭上,真凶在谎言中露出破绽。UCSD研究团队以这款经典游戏为舞台,o1、Gemini 2.5 Pro等模型化身「侦探」,测试AI的推理极限。
悬疑小说的最后一页,隐藏着罪犯的真相。《逆转裁判》的法庭上,真凶在谎言中露出破绽。UCSD研究团队以这款经典游戏为舞台,o1、Gemini 2.5 Pro等模型化身「侦探」,测试AI的推理极限。
4月17日据《金融时报》周四报道,OpenAI和Oracle(ORCL.N)为其重要项目“星际之门”权衡英国未来投资,因为它正在探索海外地点以建立人工智能基础设施。
作为玩家基数庞大的60级显卡新品,RTX 5060 Ti带来了显著的性能飞跃。得益于强大的DLSS 4多帧生成黑科技,它不仅能在合理设置下以4K运行大型3A游戏,而且还能轻松跑通本地AI大模型。
2025年4月16日,Cohere 发布了其最新一代多模态搜索模型 Embed 4,在多模态数据处理、长文本建模和跨模态检索能力上实现了显著提升,进一步巩固了其在企业级 AI 搜索领域的领先地位。
视频人物抠像技术在电影、游戏、短视频制作和实时视频通讯中具有广泛的应用价值,但面对复杂背景和多目标干扰时,如何实现一套兼顾发丝级细节精度及分割级语义稳定的视频抠图系统,始终是个挑战。
英国伦敦,Kao Data 是一家专门为人工智能和高级计算而设计的数据中心的开发商和运营商,近期宣布在其哈洛园区推出 KLON-03——一个全新的 17.6MW 高性能AI液冷数据中心。
最近,人工智能研究人员开始认真关注赋予机器“接地性”(groundedness)——机器的表征与实际现实之间的可靠关系——以及记忆和对因果关系的理解等项目。新的技术方法正在促进人工智能这些能力的提升,毫无疑问,未来我们在这方面还将取得更多进展。
在生成式AI和多智能体系统迅速发展的当下,谁能率先解决“可信度”和“可控性”问题,谁就能真正把AI带入生产级别的商业落地。英国AI创业公司 Portia AI,正是在这个方向上突围的代表。
视频理解的CoT推理能力,怎么评?
AI趋势正在“中场休息”,在此之前训练>评估,在此之后评估>训练。
让推理模型不要思考,得到的结果反而更准确?
多模态生成技术持续突破内容创作的边界。
“DeepSeek,评价一下第三届中国AIGC产业峰会”:
2025,当大模型来到应用爆发之年,越来越多的垂直行业当中,开始涌现出AI落地的经典实践案例。
最近,来自大连理工和莫纳什大学的团队提出了物理真实的视频生成框架 VLIPP。通过利用视觉语言模型来将物理规律注入到视频扩散模型的方法来提升视频生成中的物理真实性。
“人工智能数据中心的能源成本迅速上升,占据了全球头条新闻,然而硬件生命周期中其他环节对环境造成的影响却鲜少被提及。人工智能硬件的制造过程是能源密集型的,并且具有很深的环境足迹。”Digiconomist创始人、绿色和平组织所发报告《芯片制造的关键节点:追踪芯片制造中的电力消耗与碳排放》(下称报告)作者之一的Alex de Vries说。
据《纽约时报》报道,特朗普政府正考虑对中国AI公司DeepSeek实施新的限制措施,包括禁止其采购英伟达AI芯片,并可能限制美国用户访问其AI服务。这一举措是特朗普政府加速人工智能领域中美竞争战略的一部分。自DeepSeek以破坏性创新震撼硅谷与华尔街以来,美国政府内部已开始权衡多种应对方案,旨在限制中国获取美国核心技术、以及进入美国消费者市场的能力。
高德地图正式宣布,推出全球首个基于地图的AI导航智能体(NaviAgent),应用创新技术理念和架构,推动导航这一历史悠久的服务,由传统出行工具,向“会思考、能预判、有温度”的智能出行伙伴蜕变。
“史上最强视觉生成模型”,现在属于快手。一基双子的可灵AI基础模型——文/图生图的可图、文/图生视频的可灵,都重磅升级到2.0版本。可图2.0,对比MidJourney 7.0,胜负比「(good+same) / (same+bad)」超300%,对比FLUX超过150%;
今天,字节发布了一整套 AI 全家桶,深度思考模型、视觉推理、文生图、AI Agent……几乎涵盖了最近 AI 圈关注度最高的产品。字节发布的产品和亮点有哪些:1. 豆包 1.5 · 深度思考模型,2. 文生图 3.0
不止GPT-4o可以制作吉卜力风格图像!更多工具都可以制作吉卜力风图像。甚至2分钟之内,还能用照片生成吉卜力风格动画:蒙娜丽莎给你说Hello。
线下难觅踪影,出海才是康庄大道?
顶会论文评审,AI立大功!ICLR 2025首次大规模引入AI参与审稿,最终有12222条建议被审稿人采纳,89%情况下提升了评审质量。详细30页报告,揭秘AI在顶会审稿的惊人潜力。
Transformer架构主导着生成式AI浪潮的当下,但它并非十全十美,也并非没有改写者。
多智能体系统分布式共识优化的一系列研究来了!
OpenAI新模型全网实测惊艳来袭!o3缩放图像被玩疯,o4-mini速解Project Euler,碾压人类。AI初创CEO说,OpenAI凭此一役已经重回榜首,甚至有经济学家直言AGI已经来临!
根据DeepSeek过往的产品更新周期来看,梁文锋的主场时间又快到了。
AI 外衣下的“血汗工厂”
凌晨3点,AI第8次把按钮写成button_1,我差点把电脑砸了...
这是一份142页的研究论文,本文深入解析了大型推理模型DeepSeek-R1如何通过"思考"解决问题。研究揭示了模型思维的结构化过程,以及每个问题都存在甜蜜点"最佳推理区间"的惊人发现。这标志着"思维学"这一新兴领域的诞生,为我们理解和优化AI推理能力提供了宝贵框架。