AI资讯新闻榜单内容搜索-翁荔

只要强化学习1/10成本！翁荔的Thinking Machines盯上了Qwen的黑科技

今天要讲的On-Policy Distillation（同策略/在线策略蒸馏）。这是一个Thinking Machines整的新活，这个新策略既有强化学习等在线策略方法的相关性和可靠性；又具备离线策略（Off-policy）方法的数据效率。

来自主题: AI资讯

8741 点击 2025-10-29 11:12

Murati翁荔陈丹琦公司发布首个产品，让大模型微调门槛暴降，要重新发明一个OpenAI

Thinking Machines Lab发布首个产品：Thinker，让模型微调变得像改Python代码一样简单。也算是终于摘掉了“0产品0收入估值840亿”的帽子。Tinker受到了业界的密切关注。AI基础设施公司Anyscale的CEO Robert Nishihara等beta测试者表示，尽管市面上有其他微调工具，但Tinker在“抽象化和可调性之间取得了卓越的平衡”

来自主题: AI资讯

9786 点击 2025-10-03 11:53

翁荔陈丹琦加盟的840亿AI公司，公开第二篇论文

明星创业公司Thinking Machines，第二篇研究论文热乎出炉！公司创始人、OpenAI前CTO Mira Murati依旧亲自站台，翁荔等一众大佬也纷纷转发支持：论文主题为“Modular Manifolds”，通过让整个网络的不同层/模块在统一框架下进行约束和优化，来提升训练的稳定性和效率。

来自主题: AI技术研报

9521 点击 2025-09-28 09:54

陈丹琦有了个公司邮箱，北大翁荔同款

又一个AI学术大佬，有工业界身份了。清华姚班校友、普林斯顿教授陈丹琦，跟Thinking Machines划上了关联。

来自主题: AI资讯

8493 点击 2025-08-29 12:52

前OpenAI高管新作力挺模型思考，哈佛却称AI越「想」越笨

AI是否真正在「思考」乃至产生意识，正成为科学和哲学交汇的核心议题。前OpenAI负责人翁荔认为，增加模型的「思考时间」有助突破复杂推理瓶颈；哈佛等机构则指出思维链可能导致「降智」；而生物学家Mallavarapu断言数字计算机永不可能拥有意识。

来自主题: AI技术研报

9463 点击 2025-05-26 10:43

翁荔最新万字长文：Why We Think

《Why We Think》。这就是北大校友、前OpenAI华人VP翁荔所发布的最新万字长文—— 围绕“测试时计算”（Test-time Compute）和“思维链”（Chain-of-Thought，CoT），讨论了如何通过这些技术显著提升模型性能。

来自主题: AI资讯

8596 点击 2025-05-19 13:15

最豪华大模型创业阵容！OpenAI前CTO组建，翁荔、Schulman等ChatGPT核心成员加盟

今天凌晨，一个创业消息引爆了整个 AI 社区：一家名为 Thinking Machines Lab 的新创业公司建立了，而其背后有一个堪称有史以来最豪华的大模型创业团队阵容。

来自主题: AI资讯

8529 点击 2025-02-19 09:30

她宣布做VC了

投资界获悉，备受关注的前OpenAI研究与安全副总裁翁荔（Lilian Weng）近日宣布，她正式加入硅谷早期投资机构Fellows Fund的Fellow团队，担任Distinguished Fellow，开启新一段征程。

来自主题: AI资讯

7539 点击 2024-12-09 09:21

独家｜前OpenAI华人副总裁Lilian Weng加盟Fellows Fund Fellow团队，助力AI探索与下一代创业者

据ZP独家报道，前OpenAI研究与安全副总裁Lilian Weng已加盟Fellows Fund，担任新的Distinguished Fellow。

来自主题: AI资讯

10056 点击 2024-12-05 09:42

翁荔离职OpenAI后第一个动作：万字长文探讨RLHF的漏洞，网友们抢着传看

之前领导OpenAI安全团队的北大校友翁荔（Lilian Weng），离职后第一个动作来了。当然是发～博～客。这次的博客一如既往万字干货，妥妥一篇研究综述，翁荔本人直言写起来不容易。主题围绕强化学习中奖励黑客（Reward Hacking）问题展开，即Agent利用奖励函数或环境中的漏洞来获取高奖励，而并未真正学习到预期行为。

来自主题: AI技术研报

8572 点击 2024-12-03 00:16