她们估值840亿,刚发了第一个AI成果
她们估值840亿,刚发了第一个AI成果刚刚,0产出估值就已冲破120亿美元的Thinking Machines,终于发布首篇研究博客。
刚刚,0产出估值就已冲破120亿美元的Thinking Machines,终于发布首篇研究博客。
来自斯坦福的研究者们最近发布的一篇论文(https://arxiv.org/abs/2509.01684)直指RL强化学习在机器学习工程(Machine Learning Engineering)领域的两个关键问题,并克服了它们,最终仅通过Qwen2.5-3B便在MLE任务上超越了仅依赖提示(prompting)的、规模更大的静态语言模型Claude3.5。
就在今天,Xcode最流行的超强编程Copilot插件Alex,宣布被OpenAI收编,全员加入Codex开启新工作!这会为Codex在开发者更偏爱的Mac端的攻城略地带来哪些变数?
在长周期、多步骤的协作任务中,传统单智能体往往面临着任务成功率随步骤长度快速衰减,错误级联导致容错率极低等问题。
又一个AI学术大佬,有工业界身份了。 清华姚班校友、普林斯顿教授陈丹琦,跟Thinking Machines划上了关联。
陈丹琦加入 Thinking Machines Lab 了?这一猜测不是毫无根据,当我们打开她的 GitHub 主页,邮箱已经变为 thinkingmachines.ai。
Macaron(马卡龙)AI 最近挺火的。 8 月 15 日,他们以「世界上第一个 Personal Agent」的称号公开上线了,给扎克伯格想做的 Personal SuperIntelligence 打了个样。
近年来,以GPT-4o、Gemini 2.5 Pro为代表的多模态大模型,在各大基准测试(如MMMU)中捷报频传,纷纷刷榜成功。
论搞事情,还得是你马斯克。 这不,为了硬刚微软,老马直接成立了一家新公司——巨硬(Macrohard)。
硅谷各个模型公司在这个季度,开始分化到各个领域,除了 Google Gemini 和 OpenAI 还在做通用的模型;Anthropic 分化到 Coding、Agentic 的模型能力;Mira 的 Thinking Machines Lab 分化到多模态和下一代交互。