Ralph + Codex CLI:我当老板,AI当监工,GPT-5.2当牛马的正确姿势
Ralph + Codex CLI:我当老板,AI当监工,GPT-5.2当牛马的正确姿势这两天都在研究 ralph,一个你睡觉时,都能不眠不休替你干需求、榨干任何 Coding Agent 的工具。
这两天都在研究 ralph,一个你睡觉时,都能不眠不休替你干需求、榨干任何 Coding Agent 的工具。
AI证明数学猜想,这次来真的了。
Michael Truell让Cursor中的GPT-5.2连续运行了整整一周。不是一小时,不是一天,而是不眠不休,昼夜不停,168小时持续写代码。结果?300万行代码。数千个文件。
刚刚,GPT-5.2刷新了一项新纪录!OpenAI联合创始人Greg Brockman发帖称使用GPT-5.2在ARC-AGI-2基准测试上,表现超过了人类基线水平。
在人类满分都罕见的普特南数赛上,AI直接12题全对拿满分。陶哲轩等大佬预言AI已经取得了重要里程碑,再加上GPT-5.2 Pro在数学上强到「离谱」的表现,那种「奇点将近」的直觉,真的压不住了。
业界都在讨论的AGI之争,陶哲轩是如何看待的?就在刚刚,陶哲轩po文明确了自己的态度——还不行。他认为,目前还无法实现AGI。
又一个中国新模型被推到聚光灯下,刷屏国内外科技圈。IQuest-Coder-V1模型系列,看起来真的很牛。在最新版SWE-Bench Verified榜单中,40B参数版本的IQuest-Coder取得了81.4%的成绩,这个成绩甚至超过了Claude Opus-4.5和GPT-5.2(这俩模型没有官方资料,但外界普遍猜测参数规模在千亿-万亿级)。
什么?决定 AI 上限的已不再是底座模型,而是外围的「推理编排」(Orchestration)。
英伟达让AI仅靠「看直播」就学会了通用游戏操作。虚拟世界已成为物理智能的黑客帝国,看4万小时直播学会几乎所有游戏!
OpenAI 的十周岁生日,过得不太体面。