三个月,一场必然失败的Tokenmaxxing
三个月,一场必然失败的Tokenmaxxing早在3月20日,纽约时报的凯文·罗斯就发现了在硅谷开发者中,出现了一种叫做 Tokenmaxxing的现象。这个现象最早出现在OpenAI、Anthropic等前沿模型开发公司。OpenAI 的工程师一周用了 2100 亿个token,大概是 33 个维基百科的量;Claude Code 的工程师则一个月单人可以烧15万美元token。
搜索
早在3月20日,纽约时报的凯文·罗斯就发现了在硅谷开发者中,出现了一种叫做 Tokenmaxxing的现象。这个现象最早出现在OpenAI、Anthropic等前沿模型开发公司。OpenAI 的工程师一周用了 2100 亿个token,大概是 33 个维基百科的量;Claude Code 的工程师则一个月单人可以烧15万美元token。
过去两年,关于 AI 的讨论几乎都绕着同一个词打转——失业。哪些岗位会消失,多少程序员会被取代,下一个被端掉饭碗的白领是谁。这个叙事好懂,也足够让人焦虑,所有人都能对号入座。
真正把灵动岛推上风口的,是 6 月以来接连发生的几件事。6 月 8 日的 WWDC 2026,苹果发布了全新的 Siri AI。Federighi 在台上的原话是,苹果要「带来下一代 Apple Intelligence,并推出 Siri AI,一个明显更聪明、更博学、也更能干的 Siri」。
来自博世中央研究院与清华大学的研究人员提出 FunctionEvolve 框架,在两大基准测试上大幅刷新了这项任务的结果。在 LLM-SRBench 的 129 个合成科学方程任务上,FunctionEvolve 最终给出的公式在 55.8% 的任务上与真实公式等价(SA@1 = 72/129),是此前最好结果的 3.6 倍;
香港大学李弘扬团队联合华为、上海创智学院及清华大学李升波教授团队,发表的最新论文World Engine: Towards the Era of Post-Training for Autonomous Driving给出了系统回答。
本研究由快手科技语言大模型团队完成,核心作者吕民轩、梅铁桦、杜坦隆等。快手科技与中国科学院大学联合提出 GoLongRL,一套完全开源的长上下文强化学习后训练方案,包含 23K 样本 RLVR 数据集
比预想的还要快!Cloudflare联创Matthew Prince甩出一张截图,宣告了互联网史上第一个真正拐点—— AI Agent的上网流量,第一次超过了人类。
据英国《金融时报》昨日报道,美国AI独角兽、世界模型创企Odyssey获得3.1亿美元(约合人民币20.96亿元)融资,本轮融资落地后,该公司投后估值将达14.5亿美元(约合人民币98.05亿元)。
新加坡AI Agent 峰会台上四个人,焦虑方向正好相反。
高中毕业, 也能进芯片研发部了。