
官方承认系统「作弊」,世界首个「AI CUDA工程师」翻车?o3-mini 11秒发现bug
官方承认系统「作弊」,世界首个「AI CUDA工程师」翻车?o3-mini 11秒发现bug高调亮相的世界首个「AI CUDA工程师」,宣称能让模型训练速度飙升100倍,如今却上演了一场「作弊」闹剧。OpenAI研究员用o3-mini,11秒便发现了内核代码有bug!
高调亮相的世界首个「AI CUDA工程师」,宣称能让模型训练速度飙升100倍,如今却上演了一场「作弊」闹剧。OpenAI研究员用o3-mini,11秒便发现了内核代码有bug!
只刷逻辑益智题,竟能让 AI 数学竞赛水平大幅提升?
正如乔布斯所言:“仙童像成熟的蒲公英,创业精神的种子随风播撒。”如今,这句话放在OpenAI上可能再合适不过,最新成立的AI公司Thinking Machines有近2/3的员工,来自AI巨头OpenAI这棵蒲公英上。
Claude深夜重磅发布新模型——
知名 Chatbot 及各种 AI 工具箱产品 Monica 最近推出了国内版Monica.cn,基于 DeepSeek R1 与 V3模型,并且具备实时联网搜索与记忆能力。
中美之间的AI竞赛,正朝着一个神奇的方向走去。
就在刚刚,Anthropic祭出首个混合推理Claude 3.7 Sonnet,堪称扩展思考模式的最强模型。在最新编码测试中,新模型暴击o3-mini、DeepSeek R1,AI编码王者出世了。
DeepSeek-R1背后关键——多头潜在注意力机制(MLA),现在也能轻松移植到其他模型了!
本周一,阿里巴巴集团CEO吴泳铭抛出了炸弹——未来三年将投入超3800亿元建设云和AI硬件基础设施。这个金额,不仅创下了中国民营企业在该领域有史以来最大规模的投资纪录,更像一枚投入湖面的巨石,在中国科技产业激起层层涟漪。
猜想界的皇冠——黎曼猜想,离被证明的那一天不远了。Grok 3便是关键所在:暴力计算+验证器能让AI穷举所有解法,再加上AI辅助科学家打出的组合拳,下一个诺奖级突破近在咫尺。