全球顶尖AI做物理,被人类按地摩擦?不懂推理大翻车,本科生碾压
全球顶尖AI做物理,被人类按地摩擦?不懂推理大翻车,本科生碾压最顶尖的AI模型,做起奥数题来已经和人类相当,那做物理题水平如何呢?港大等机构的研究发现:即使GPT-4o、Claude 3.7 Sonnet这样的最强模型,做物理题也翻车了,准确率直接被人类专家碾压!
最顶尖的AI模型,做起奥数题来已经和人类相当,那做物理题水平如何呢?港大等机构的研究发现:即使GPT-4o、Claude 3.7 Sonnet这样的最强模型,做物理题也翻车了,准确率直接被人类专家碾压!
本篇内容是「AGIX 投什么」系列的第 7 篇。AGIX 指数 从全球上千家科技上市公司中精选出的 40 家左右最能把握 AGI 价值整理的公司,AGIX 指数组合即是定位 AGI 进程的坐标,也能够为投资者捕捉 AI-alpha 提供价值工具。在「AGIX 投什么」板块,我们会对 AGIX Index 的组合公司进行深度分析,输出全面的 AI 投资参考。
表现最好的GPT-o4 mini,物理推理能力也远不及人类!
进入2025年以来, AI Agent的发展明显提速。5月6日,OpenAI宣布以30亿美元收购 Windsurf;编程工具Cursor的母公司Anysphere也获得了9亿美元的融资,估值高达90亿美元;号称中国第一个通用AI Agent的Manus在五月也获得了硅谷老牌风险投资公司Benchmark领投的7500万美元的融资;
今天有个爆炸性消息,OpenAI 以 65 亿美元收购了由 Sam Altman 与前苹果首席设计官 Jony Ive 联合创办的 AI 设备初创公司 io。Jony Ive 1992 年加入苹果,是全球最具影响力的工业设计大师之一,主导设计了 iMac、iPhone、iOS 7 等苹果标志性产品,也引领了全球消费电子的设计潮流。
苹果元老级人物、前首席设计官初创公司,OpenAI斥巨资收入囊中!
太震撼了,有开发者代码实证后发现,谷歌AlphaEvolve的矩阵乘法突破,被证明为真!Claude辅助下,他成功证明,它果然仅用了48次乘法,就正确完成了4×4矩阵的乘法运算。接下来,可以坐等AlphaEvolve更「奇点」的发现了。
本文由匹兹堡大学智能系统实验室(Intelligent Systems Laboratory)的研究团队完成。第一作者为匹兹堡大学的一年级博士生薛琪耀。
数学能力几乎和AlphaGo的围棋水平一样?!
太疯狂了,AlphaGo的「第37步」时刻,已经来临。谷歌的AlphaEvolve,让我们从此进入AI创造科学的时代,人类科研将彻底颠覆!背后的研究者也首次接受采访,揭秘研究过程中的一些惊人细节。