作为AI领域最有影响力的科学家之一,Thinking Machines 联合创始人、前OpenAI研究副总裁 Lilian Weng 的很多研究方向、研究思考和研究方法对今天的AI从业者带来很多启发。
10月18日,在离开OpenAI,联合创办Thinking Machines后,Lilian Weng在硅谷难得地参加了一场公开对话。在这场华源Hysta2025年年会的炉边对谈里,她和主持人、硅谷知名投资人Connie Chan聊了聊她自己的研究经历、研究习惯、在OpenAI的研究思考和Thinking Machines 的发展方向。
以下为现场实录。
图中左为Lilian,右为Connie
“数学竞赛让我知道我只是一个普通人”
Connie:大家好!今天的 fireside chat 嘉宾是 Lilian Weng。我相信她是许多人心目中的榜样。我先简单介绍一下她的背景,虽然我想在座的很多人已经很熟悉她了。Lilian Weng 是 Thinking Machines 的联合创始人,曾任 OpenAI 的研究副总裁。在 OpenAI 期间,她带领团队让机器人学会解决非常复杂的任务,比如让机械手解开魔方。她还创立了 Applied AI Research Team 和 AI Safety Team,建立了许多如今 ChatGPT 用户都在受益的行业标准。她毕业于北大,在印第安纳大学拿到博士学位。今天我特别期待能深入交流。通常我做 fireside chat 时,都会先了解嘉宾本人——所以我很好奇,你的朋友们会用哪些词形容你?
Lilian:谢谢 Connie 这么热情的介绍。希望今天可以多聊一些。
如果说性格,我的朋友会觉得我非常有条理、有耐心。我认为自己最重要的特质是“坚持”和“谦逊”。这是让我能不断学习新东西的唯一方式。因为在我们的领域里,永远没有一个“知道一切”的天花板——每天都有新知识出现,你必须不停追赶。
Connie:这种坚持学习的特质让人印象深刻。你的成长经历里,有没有什么时刻让你形成了这种心态?
Lilian:有时我也会反思这个问题,回想我的成长经历和童年。有一件事我认为对我的职业生涯产生了重要影响,那就是我从小就参加数学竞赛,一直持续到大学前……我很早就对数学产生了浓厚的兴趣。这段经历教会我的是,我因此认识了很多数学天才,并意识到无论我多努力,无论我在班级或学校里感觉多优秀,我与他们的天赋之间仍然存在巨大的鸿沟。我不得不承认,这个世界上总有比你更优秀的人,你必须拼尽全力,才能与他们并肩而立。这件事让我保持谦逊,让我觉得,是的,你只是个普通人,努力奋斗吧。
Connie:这个体会挺反直觉的——数学竞赛反而教会你自己其实是个“普通人”。
另外,你对学习的热爱是怎么开始的?你要跟上其他人,但同时你自己也要是充满好奇心的。
Lilian:小时候我家有一套百科全书,我特别喜欢读——各种主题都有。
Connie:你们(观众)有人是读百科全书长大的么?
Lilian:可能现在的孩子他们可以读wikipedia。
Connie:你都读哪些科目?
Lilian:我最爱的是天文学、生物学、数学,甚至占星学。我觉得学习新知识、拓展视野的感觉非常愉快。后来当我接触到深度学习(deep learning)时,这种感觉又回来了——我当时想:“天哪,这个领域太迷人了。”也正是这种好奇心让我加入了 OpenAI。
在OpenAI早期做研究,感受到的“现实扭曲场”时刻
Connie:你是在 2017 年加入 OpenAI 的,对吧?
Lilian:对,我是在 2017 年 11 月面试。当时 OpenAI 还是一个非营利组织,那时 AGI (通用人工智能)还不是个热门概念。当时最让我印象深刻的是那群人都充满热情,他们在研究一些极其前沿、甚至有点疯狂的想法,而且动机都不是为了钱,而是对知识的好奇与实验的乐趣。
Connie:当时团队有多少人?
Lilian:大概 60 人。
Connie:哇,太不可思议了。我想从你在 OpenAI 的第一个项目开始聊起,就是你用机器人解魔方的那个项目……跟我们讲讲当时机器人技术的发展状况是怎样的?你在做那个项目时有哪些“顿悟时刻”?当初为什么会想做这件事?
Lilian:那是我做过的最酷的项目之一,可能也是最难的。当时机器人领域已经开始拥抱深度学习模型。所以我们项目的初衷是探索我们是否能在纯模拟环境中训练一个策略模型来完全控制机器人,不使用任何真实世界的数据,去解决一个极其复杂和具有挑战性的机器人任务。在当时如果你去任何一个学术会议,讨论感知、导航和操控三大方向,人们总会说操控(manipulation)最难,因为几乎不可能精准模拟真实物理交互。我现在仍然认为我们不能100%准确的为此建模。
所以我们就选择了它。然后我们继续挑具体任务,同样是考虑什么是最复杂的,那就是解决一个任务,动用你所有的手指,这个可能是最难的我们就从这开始。这其实有点疯狂。
我必须说,在项目结束时,我仍然对我们做到了感到惊讶。
图源:OpenAI
编者注:
策略模型 (Policy Model): 在强化学习中,“策略”定义了智能体(Agent)在特定状态下应该采取什么行动。策略模型就是一个学习和代表这个策略的神经网络。
领域随机化 (Domain Randomization): 一种“模拟到现实”(Sim-to-Real)的迁移学习技术。它通过在模拟环境中生成大量具有不同物理和视觉属性(如光照、纹理、摩擦力)的训练样本,让模型学会在一个广泛的、不确定的环境中也能稳健地工作,从而更好地泛化到无法被完美建模的真实世界。
Connie:但你们还是坚持下来了——这也与好奇心有关。
Lilian:这也是一个团队项目。所以与团队一起工作,当你的队友拥有不同的才能时,你也相信这个项目。这会给你很多能量。
Connie:当机器人真的解开魔方时,你是什么感觉?
Lilian:当时,我其实在想人们用来描述史蒂夫·乔布斯最好的特质之一的词:现实扭曲场(Reality Distortion Field)。
人们描述史蒂夫·乔布斯时说,他周围有一个力场,如果他相信某件事,即使现实看起来不可能,他也能扭曲它并使之实现。我认为每个人都有类似的东西,尤其是在研究中。如果你相信某个方向,即使它看起来不可能,但如果你足够努力、足够聪明地去尝试,你会找到让它成功的方法。这基本上也就是我当时的感觉。
Connie:既然你确实拥有丰富的机器人技术经验,你对我们处于机器人发展曲线的哪个位置有什么看法?你看好吗?你现在花在机器人上的时间少了,但关于机器人技术,你有什么想分享的总体看法吗?
Lilian:我确实认为机器人领域正在通过引入语言模型作为大脑或更智能的规划器而获得新的活力。我其实记得当我们在OpenAI内部刚推出GPT-3时,我们做了一些小型试验性项目,试图看看能否将机器人技术和语言模型结合起来,但那时候GPT-3还是一个相当笨的模型。
而现在模型在解决复杂和推理问题上已经变得如此出色和智能,这对某些机器人任务来说非常重要。如果我们能结合硬件方面的一些新进展,我认为将会是很棒的东西。
Connie:所以你对机器人技术非常看好。(bullish on robotics)
Lilian:嗯...我还没有更多的了解。我算是乐观(optimistic)吧,但我认为我需要了解更多关于当前领域的情况,才能有信心。
OpenAI早期产品化尝试的经验——给社区提供一个API很重要
Connie:那么,在你从事机器人方面的工作之后,你实际上创立了OpenAI的应用人工智能研究团队(Applied AI Research Team)。那个团队负责一些最重要的事情,这些事影响了今天在座的每一个人。你们当时在探索GPT-3的产品化,探索模型如何用于日常任务工作。在这个过程中有哪些重大的经验。
Lilian:你可能知道,OpenAI API 是在 ChatGPT 之前推出的,那是 OpenAI 首次尝试将大型语言模型产品化。那是一段不错的经历。我很惊讶地发现,一些在当时看似随意(arbitrary)的决定,现在却成了行业标准。比如 API 的接口,我们当时叫它“补全端点”(completion endpoints),所有这些命名方式后来(却)成了标准,但当时这真的只是一场实验,我们当时举办黑客松来探讨如何将大型语言模型用于不同场景,因为我们其实并不知道使用它的最佳方式是什么。所以我们想,如果能提供一个 API,让大家去尝试,而且还能提供给大家这个工具,或许就能发现一些非常有创意和新颖的用例。这是当时的动机。
编者注:
补全端点 (Completion Endpoints): 这是早期 LLM API 的核心交互模式。用户提供一个文本开头(Prompt),API 则会“补全”接下来的内容。这种简单的模式极具通用性,可以被应用于问答、翻译、摘要、代码生成等多种任务。
Connie:你对这些产品后来的成功程度感到惊讶吗?
Lilian:(思考了许久)是的。
Connie:在你于OpenAI任职的后期,你领导着AI安全团队,一个超过80人的团队。所以你在OpenAI的任职期间,真正从一个独立贡献者,转变成为公司高管。但在我们讨论那个高管角色之前,你会如何定义AI安全对你而言是什么。
图源:OpenAI
Lilian:我可能会考虑两个方面。一个是模型行为应遵循一定的规则和道德标准。另一个是关于定制化,比如人们确实对什么是安全有不同的容忍度和不同的解释,或者不同地区的法律、法规是不同的,你如何建立这种程度的控制,以便人们可以根据他们的客户安全地部署它。
Connie:考虑到那个角色对全人类有多么重要,你是如何管理这种压力的。
Lilian:我肯定认为OpenAI是一家伟大的公司,但与此同时,我也看到这个公司一步步逐渐发展到那个水平。所以对我来说,真的只是以正确的方式做好我的日常工作,而不是过多考虑压迫感。
Connie:那么在那个安全团队里,给我们讲讲你曾经必须解决或思考的一些问题是什么。
Lilian:试图建立那种(对模型安全的)控制水平,或者定制不同的对错误表述行为模型的策略,其实都是相当多样化的。
你必须真正理解人们才能预测问题会是什么。同时,你需要将其与各种后训练技术联系起来,看看你是否能够实际处理许多非常模糊的任务。
离开OpenAI:因为学习曲线变缓了
Lilian和OpenAI前CTO Mira Murati等人一起创办了Thinking Machines Lab,是今天最受期待的AI初创公司之一
Connie:所以大约一年前,你做了一个重大的决定,那就是离开OpenAI,并成为Thinking Machines的联合创始人。跟我们说说那个决定。是什么让你决定创办一家公司。
Lilian:是的,我刚才跟朋友聊,说去年这时候我还是在OpenAI工作,我自己都感觉有些惊讶,现在就像是完全不同的人生阶段了。我实际上从未想过我会创办公司或成为企业家,尤其是我这个人,我只是喜欢学习新东西。所以只要我的工作能满足这一点,我就感觉很好。
我想说,在我于OpenAI任职的后期,我确实感觉到我的学习曲线开始放缓,开始感到有点饱和了。
Connie:所以听起来你并不是那种一直梦想着创办自己公司的人。更多的是因为你会在那里学到最多东西,而且这是一个千载难逢的机会。
Lilian:是的。而且这是一个我能与一群共事多年且尊敬的人一起开始,每天都一起工作的机会。我知道他们有多么出色和能干。
Connie:所以,即使Thinking Machines资源非常充足,但作为联合创始人,与作为公司高管是完全不同的级别。跟我们说说那种区别。在心理上,压力水平或你的日常工作是什么样的?作为联合创始人,你需要做哪些不同的任务?
Lilian:压力非常大。这比我在OpenAI的时候压力大得多,即使在我领导一个更大团队的时候也是如此。我想说主要的压力来自于责任感,你真的很想作为一个团队来成功。这样所有的人,比如所有在早期我们一无所有时加入我们的研究人员、伟大的工程师,我想确保每个人都能成功……
Connie:还有投资人,对吧?
Lilian:对。(笑)肯定。所有人,在我们还什么都没有的时候相信我们的所有人。
Connie:所以是更强的责任感。跟我们说说,在那个创始人的角色里,你不得不做的令人惊讶的事情是什么,比如设立办公室,组建初始团队?你有没有发现自己作为创始人的行为方式有所不同。
Lilian:我清晰的记得我们有了独立办公室的第一周。我们几位联合创始人当时,当我们走进办公室时,那里完全空荡荡的,只有桌椅。我们大家一起花了三天时间,就是每个人都盯着手机,在亚马逊上下单,在亚马逊上订购东西。然后我订购了一堆像是卫生纸、卫生棉条之类的东西。
Connie:所以这就是联合创始人做的事情。(笑)
Lilian:对,前三天。(笑)这也很有意思的经历。
Connie:你能告诉我们,在Thinking Machines有哪些让你们兴奋并试图解决的真实世界问题吗?最近有一个重要的发布。跟我们说说。
Lilian:我想说我们的使命或整体信念是我们相信 AI 应该是以人为本的。我们真正关心人类与 AI 的协作。我们认为 AI 是一种可以帮助人们、让我们的生活变得更美好的工具,而不是真要去取代人类。另一个重要的事情是我们相信开放科学,并且我们认为如果我们分享更多东西,许多科学进步可以更快地实现。所以当我[与研究人员交流时]看到的一个痛点。
与研究人员、教授交谈时,他们感到在语言模型领域进行新颖的研究非常受限制,因为存在很多基础设施问题,很难获得大量 GPU,而且他们必须做大量的基础工作才能在我们的模型上运行一些新颖的想法。你是怎么通过与人交谈发现这个问题的?是的,就是通过和他们交谈。所以我们最近测试版发布了 Tinker API。
它的目的就是提供一个非常灵活的基础的功能。比如前向-后向采样和优化,这样研究人员就可以在其上非常轻松地构建和试验新想法,而无需担心基础设施。在某种程度上,我认为这与早先讨论中 FairWorks 的动机非常吻合,这是他们的动力之一。
Connie:这次发布有让你感到惊讶吗?
Lilian:我想研究人员对此事的兴奋程度让我略感惊讶,因为我认为这确实会帮助他们的[研究]节点。所以我们需要做的是确保我们妥善地进行接下来的正式发布。
不用ChatGPT读论文,创始人也要看代码,这也是一种管理方法
Connie:我们的观众里,对于那些考虑成为创始人的人,或者那些非技术背景但想进入 AI 领域的人,你有什么建议?
Lilian:我认为有两种方式都很重要。第一,在日常生活中尝试使用不同的 AI 产品。你可能会发现意想不到的东西,比如 AI 如何提高你的生产力……第二,如果你对技术细节非常感兴趣……那就坚持阅读,读论文,亲自动手,想办法做实验,在实践中学习。
我对我身边程序员朋友开始使用 Cursor 或其他类型的编码、代码辅助工具时,生产力提升的程度印象非常深刻。尽管他们本身已经对这个领域了解很多。所以我真的认为我们应该在这方面保持开放的心态。另一点是,如果你非常热衷于该领域的技术细节,就坚持阅读资料,阅读论文,亲自动手实践,尝试寻找不同的方法来进行实验,亲手学习。
Connie:那么关于学习这部分,现在有非常多的初创公司,非常多的论文。有些论文真的很长。你有什么技巧和建议吗?我不知道。你如何获取最新的AI新闻?你如何决定读哪些论文?你如何决定试用哪些应用程序?你会用ChatGPT为你总结论文吗?
Lilian:(没说话)
Connie:不用?好吧。
Lilian:我不那样做是因为我有自己判断论文是否值得阅读的方法。如果你了解我,我维护了一个博客很多年,所以我基本上有一种方法,只需阅读标题和摘要。你就能感觉到读一篇论文需要花费多少时间。你可以花五分钟或者三个小时,你需要聪明地分配你的时间。还有就是通过与其他研究人员交流。他们会提到,哦,你读过那个谁的工作吗?你读过这个吗?通过交谈,你就会知道哪些是值得更多时间的。
Connie:所以不要害怕自己阅读研究论文,阅读摘要来决定读什么,关注Lilian的博客。不过她有一阵子没写了,但她文笔很好。
Lilian:我想说我把更多注意力转移到了我们公司的研究blog,它叫《连接主义》(Connectionism),这是团队努力的成果,所以质量会好得多。
Connie:好的,这些是很棒的阅读技巧。你谈到了要聪明地花费时间。尤其是现在作为联合创始人,你必须在这一点上非常聪明。给我们讲讲你是如何做的,你是否有关于优先级排序的框架,无论是工作任务、生活任务还是学习?我也知道你是一位非凡的领导者,你实际上仍然会亲力亲为,查看代码,而大多数在那个级别的人不会再这样做了。你如何优先安排你的时间?
Lilian:首先,我有一个结构非常全面的待办事项列表。它有层次结构。里面有很多项目。
Connie:是什么样的层次结构?
Lilian:更像技术规划这样的分类...抱歉再说就太多细节了哈哈。
Connie:总之就是不同的分类,然后在每个分类内有不同的排名。
Lilian:对。并且按优先级排序,而不是按原因或任务有多容易完成来排序,因为我确实看到人们有这种倾向,哦,来了件小事。我可以在15分钟内完成。我先做这个。要对抗这种倾向,而是当你有大块专注时间时,花在最紧迫、最重要的任务上,即使这意味着要花很多时间。并且要觉得把这10个小任务放在一边没关系,即使不得不延迟,也没关系。
Connie:所以这更像是一种无情的优先级排序。非常强调重要性。那么紧急性呢?
Lilian:这总是一个权衡,对吧?这真的取决于它是否真的紧急。如果它非常重要,比如公司发布有个重要截止日期,那当然(要处理)。但如果仅仅是因为别人现在问你(那就不同)。
是的。告诉我,Lillian 作为管理者是怎样的?你如何看待管理你的团队成员?你是否有管理人的普遍哲学?
Lilian:我非常相信建设性反馈。我经常和我的团队谈论这个,给予直接的反馈,因为在工作中没有什么是针对个人的,它真的关乎的是其他。
Connie:你也会征求反馈吗?
Lilian:当然,当然。这是我作为管理者能够学习的唯一途径,并且也要给予他们,特别是对于研究人员,给他们空间,允许他们从事他们热衷的事情,这样他们才能更高效。
Connie:你如何将这一点产品化/制度化?是不是有点像谷歌的 80-20 法则,你有一部分时间可以做任何你想做的事?
Lilian:在公司层面,你需要允许一些探索性的努力和一些更有计划性的研究计划,然后收集关于他们研究兴趣的信息,再将合适的人匹配到合适的项目。
Connie:所以你了解你所有的团队成员,以及他们的兴趣所在,这样你就能找出最适合他们的项目。
Lilian:我也会花时间,对于某些重要项目,花时间查看代码,阅读他们的拉取请求,和团队一起讨论。
Connie:作为公司的联合创始人,你花多少时间看代码?
Lilian:尽量挤出来每周安排一天。一整天都用来查看代码,没有任何会议。不开会,就是看代码,研究所有的技术细节。
Connie:这样做有什么好处?
Lilian:让你与下属的对话非常接地气(grounded)。让你的规划也脚踏实地。当你与下属交谈时,他们会觉得你真正理解他们的工作。有时我们可以就项目方向进行非常深入的头脑风暴。
Connie:你多久会遇到看不懂的代码?然后你如何处理这些情况?
Lilian:一直,一直都是。就是问,问他们(指同事),问聊天机器人,问写代码的人,在 Slack 上问。就是要经常提问。当我告诉别人我不懂某些东西时,我并不觉得脆弱。我认为这是件好事。我发现了我不懂的东西,然后我提问,我就学到了。
Connie:这是否也是从小培养的,让你不害怕提问?
Lilian:可能吧,你看,现在我们又回到数学竞赛了。(笑)
Connie:所以,始终保持提问,我觉得这是结合了你的好奇心和谦逊的核心部分,这帮助你在公司成为如此高效的领导者。再加上努力工作。但听起来,我看你的视频时总感觉到,你在工作中也很快乐。即使工作这么长时间,你是如何总能享受你所做的事情的?
Lilian:我确实认为,如果工作占据了一个人生命中的大部分时间,如果你能在工作中找到(乐趣),你基本上就是在以一种非常快乐、愉快的方式度过你的人生。
我感到非常幸运。我热爱我的工作。找到你的热情所在,你的快乐所在,这样你实际上就不会觉得花费那么多时间很痛苦。每天早晨我都期待着我的工作。我认为很多动力来自于我的好奇心,观察团队,支持他人,保持高效。我认为所有这些都很重要。
Connie:非常感谢。这就是今天的全部对话。谢谢。
文章来自于微信公众号 “硅星人Pro”,作者 “硅星人Pro”
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0