成立7个月首发声!百亿美金独角兽万字雄文:攻克LLM推理非确定性难题
成立7个月首发声!百亿美金独角兽万字雄文:攻克LLM推理非确定性难题Thinking Machines Lab成立7个月,估值120亿美元,首次公开研究成果:LLM每次回答不一样的真凶——kernel缺乏批处理不变性。Lilian Weng更是爆猛料:首代旗舰叫 Connection Machine,还有更多在路上。
Thinking Machines Lab成立7个月,估值120亿美元,首次公开研究成果:LLM每次回答不一样的真凶——kernel缺乏批处理不变性。Lilian Weng更是爆猛料:首代旗舰叫 Connection Machine,还有更多在路上。
刚刚,0产出估值就已冲破120亿美元的Thinking Machines,终于发布首篇研究博客。
来自斯坦福的研究者们最近发布的一篇论文(https://arxiv.org/abs/2509.01684)直指RL强化学习在机器学习工程(Machine Learning Engineering)领域的两个关键问题,并克服了它们,最终仅通过Qwen2.5-3B便在MLE任务上超越了仅依赖提示(prompting)的、规模更大的静态语言模型Claude3.5。
就在今天,Xcode最流行的超强编程Copilot插件Alex,宣布被OpenAI收编,全员加入Codex开启新工作!这会为Codex在开发者更偏爱的Mac端的攻城略地带来哪些变数?
在长周期、多步骤的协作任务中,传统单智能体往往面临着任务成功率随步骤长度快速衰减,错误级联导致容错率极低等问题。
又一个AI学术大佬,有工业界身份了。 清华姚班校友、普林斯顿教授陈丹琦,跟Thinking Machines划上了关联。
陈丹琦加入 Thinking Machines Lab 了?这一猜测不是毫无根据,当我们打开她的 GitHub 主页,邮箱已经变为 thinkingmachines.ai。
Macaron(马卡龙)AI 最近挺火的。 8 月 15 日,他们以「世界上第一个 Personal Agent」的称号公开上线了,给扎克伯格想做的 Personal SuperIntelligence 打了个样。
近年来,以GPT-4o、Gemini 2.5 Pro为代表的多模态大模型,在各大基准测试(如MMMU)中捷报频传,纷纷刷榜成功。
论搞事情,还得是你马斯克。 这不,为了硬刚微软,老马直接成立了一家新公司——巨硬(Macrohard)。