Transformer作者：DeepSeek才有搞头，OpenAI指望不上了

10610点击 2025-09-10 12:30

“闭源人工智能在阻碍我们探索真正的科学。”

说这句话的不是别人，是大名鼎鼎的Transformer发明者——Ashish Vaswani。

大佬之所以这么说，是因为他觉得OpenAI等闭源厂商被商业化冲昏了头脑，没心思做基础研究。

在Scaling Law碰壁后，独角兽们越来越搞不清技术方向。

迫于投资者压力，不得不亲自下场探索落地场景，更没精力去搞科研了。

为了填补这块空白，一路从Google到Adept再到Essential AI三次搬家的Vaswani，今年再度迎来巨大转折点——

All in基础研究，并且坚持要走开源路线。

Transformer作者：DeepSeek才有搞头，OpenAI指望不上了

万万没想到，大佬三迁，只为打造西方世界的DeepSeek。

“我们很乐意成为西方世界的DeepSeek”

2017年，还在Google Brain工作的Vaswani与团队共同写出了《Attention Is All You Need》，这篇论文在5年后开启了如今的GenAI大航海时代。

Transformer作者：DeepSeek才有搞头，OpenAI指望不上了

可惜的是，老东家不太给力，各种条条框框把人束缚得动弹不得，这让Vaswani心灰意冷。

2022年，他离家出走，与Niki Parmar（Transformer八子之一）和David Luan（当时的Adept CEO）创办了Adept AI。

可惜好景不长，据BloomBerg报道，Vaswani在Adept与某位联合创始人爆发了一次严重冲突。

这次争执让他意识到：

只有创立一个完全属于自己的公司，才能有绝对的自由。

于是2022年底，他再次挥手告别，拉起新团队创立了Essential AI。

Transformer作者：DeepSeek才有搞头，OpenAI指望不上了

最开始，Essential AI还走的是务实派路线——主要业务就是帮企业做财务分析自动化。

结果，就在今年年初，Vaswani突然对董事会宣布：

放弃公司现有业务，并将精力全部投入基础研究。

What！？

这不是把商业模式直接推翻重来吗？

Transformer作者：DeepSeek才有搞头，OpenAI指望不上了

要知道，对于一家原本服务于企业客户的初创公司来说，这可是一个风险性极高的Bet。

出乎意料的是，董事会和资方居然都在一定程度上对Vaswani表示了支持。

参与Essential AI上一轮融资的AMD在采访中表示：

这个路线确实有点不太寻常，但人工智能领域需要更开放的替代方案。

看来，三次迁居的努力没有白费，Vaswani终于如愿以偿，集结了一帮理念同频的大佬。

Transformer作者：DeepSeek才有搞头，OpenAI指望不上了

为商业化四处奔波的这么多年，与资本和客户打了无数次交道，Vaswani真的累了。

蓦然回首，在他的精神世界中，其实一直有一块能承载他一切美好期许的土地，这片伊甸园的名字叫做——开源。

他在Essential官网上写道：

在教育和医疗等领域，有真正的科学需要追求，我们不能让封闭的人工智能阻碍人类探索这些新方向。

是不是听着很耳熟，没错，Vaswani在与Economics Time的采访中直接承认了：

“短期内，我们想要成为西方世界的DeepSeek。”

Transformer作者：DeepSeek才有搞头，OpenAI指望不上了

Vaswani认为，要想推动AI的边界绝不能靠OpenAI、Anthropic等依靠闭源模式盈利的独角兽。

在他的设想里，AI不该只服务于商业，而是要真正进入教育、医疗等关乎大众的场景，让普通人也能享受到技术红利。

比如，一个偏远地区的孩子也能用开源AI上到最好的课；一个小诊所也能借助开源工具做出最准确的诊断。

更重要的是，Vaswani可不光是喊口号，Essential在转型后的确下了不少真功夫。

提出转型后的不久，2025年4月，Essential AI团队发表了一篇题为《Rethinking Reflection in Pre-Training》的论文。

这篇论文提出了一个颠覆性观点：

大型语言模型的反思能力其实在预训练阶段就开始萌芽。

简单来说，相较于用RL在后训练打补丁，他们在预训练中取得了突破，并且这个技术可能大幅降低训练成本。

要真能成，那对整个开源社区绝对是大利好。

Vaswani看到了什么？

为什么Vaswani说不能把希望寄托在独角兽公司身上？

Vaswani担心，这些模型性能最优异的独角兽正在阻碍人工智能进步。

Transformer作者：DeepSeek才有搞头，OpenAI指望不上了

有几家公司关闭了长期的研发工作，以便将所有资源用于商业化，这种现象在市场环境恶化时更加明显。

自Scaling Law迎来边际收益递减的拐点后，AI独角兽的产品化倾向已是众人皆知。

Anthropic做浏览器，OpenAI派出著名产品经理Kevin Weil…….各大模型厂商纷纷下场，亲自探索商业模式。

这折射出来的一个问题是创新者窘境。

Scaling Law兴起后，暴力美学的砝码使得AI研究的天平从学术机构几乎完全向企业实验室倾斜。

不过，产业界虽垄断了最稀缺的生产要素，他们真的可以All in创新吗？

绝大多数时候不能。因为那可能烧掉几个亿，而且不一定能看到回报。

关键在于，无论公司成立的初衷是什么，创始人最终都得优先对投资人负责。

因此，探索商业模式和利益最大化是闭源模型的最终归宿，这从一开始就注定了。

如今，这把热烈的商业化之火同样烧到了硅谷这批天之骄子身上。

今天等着小扎买买买，明天听说OpenAI搞收购，下个月又去创业。

Transformer作者：DeepSeek才有搞头，OpenAI指望不上了

△由AI生成

这种节奏很适合追热点，但科研不一样——要搞出突破性的成果，你得花几年甚至十几年死磕一个方向。

而频繁的流动，让团队很难静下心来。

Vaswani叹息道，这不是科学应有的进步方式。

那Vaswani想要怎么做？开源阵营能够拯救AI吗？

老生常谈的话题——人多力量大，知识共享才是推动AI技术发展的关键动力。

闭源公司虽手握顶级资源和技术成果，但为了维护投资人的利益，不得不把这些秘密藏起来，以阻碍竞争对手。

但如果有成千上万的研究者和开发者一起贡献代码，整个生态齐心协力，并行推进，也许能克服开源阵营资源匮乏的问题。

当然，开源最重要的问题在于资金来源，毕竟咱不能总靠“用爱发电”。

对此，Vaswani参考了互联网产品的解法：

交叉补贴大法好

什么是交叉补贴呢？

这是互联网时代很常见的一种商业模式，典型案例就是浏览器：Google搜索对用户完全免费，取得市场份额后依靠广告回血。

简单来说，就是一部分业务赚钱，用来补贴另一部分业务。

Transformer作者：DeepSeek才有搞头，OpenAI指望不上了

Vaswani对于Essential AI的计划是这样的：

先构建一个开源的垂直领域模型，这个基座本身不收钱。

但如果有客户想用这个基座搭建自己的AI，可以向Essential AI购买训练数据和相关产品。

通过这个途径赚来的钱，正好能用来反哺开源社区。

这样，既能保证技术开放，又能让公司活下去。

Transformer作者：DeepSeek才有搞头，OpenAI指望不上了

此外，Vaswani还指出闭源不一定代表更高的投资回报率。

虽然闭源模型看起来更容易变现，但实际上也面临巨大的成本压力。

实际上，如果按照之前科技互联网的发展来看，开源通常是更赚钱的一方，毕竟构建起了一整个生态。

One More Thing

最后，关于Ashish Vaswani，或许还有一点点可以多说的。

Transformer作者：DeepSeek才有搞头，OpenAI指望不上了

作为《Attention Is All You Need》论文的“一作”，他博士师承的两位导师，都是华人。

在2011年的南加州大学，有两名活跃在自然语言处理（NLP）前沿的教授——蒋伟（David Chiang）与黄亮（Liang Huang）。

他俩都是Ashish Vaswani的导师。

Transformer作者：DeepSeek才有搞头，OpenAI指望不上了

△图左为蒋伟教授，图右为黄亮教授

蒋伟教授的学士和硕士均就读于哈佛大学，后到宾夕法尼亚大学攻读博士，他提出的分层短语翻译模型曾被Google Translate采用。

黄亮教授本科毕业于上海交通大学计算机系，同样是在宾夕法尼亚大学进修的PhD，主要研究方向是开发高效算法来加速NLP任务，Vaswani是他指导的第一名博士生。

怎么说呢，虽然Transformer八子里没有华人作者，但“功劳簿”里，也并非全然没有华人贡献。

这实际也是另一个维度的开源之力。AI也好、深度学习也好，之所以可以站上浪潮之巅，根本上就在于始终有一个持续交流、开放互助的生态环境。

开源是一种选择，更是一种精神和信仰。

参考链接

[1]https://www.bloomberg.com/news/features/2025-09-03/the-ai-pioneer-trying-to-save-artificial-intelligence-from-big-tech

[2]https://www.communicationstoday.co.in/ashish-vaswani-the-mind-behind-the-transformer-that-powers-genai

[3]https://economictimes.indiatimes.com/tech/artificial-intelligence/we-would-like-to-be-deepseek-in-the-west-says-essential-ai-cofounder/articleshow/121891250.cms

[4]https://www.forbesindia.com/article/ai-special-2025/ashish-vaswanis-essential-ai-wants-to-use-powerful-ai-to-solve-humanitys-biggest-challenges/96148/1

[5]https://www.wired.com/story/eight-google-employees-invented-modern-ai-transformers-paper/

[6]https://www.essential.ai/

[7]https://viterbischool.usc.edu/news/2023/03/attention-is-all-you-need-usc-alumni-paved-path-for-chatgpt/

文章来自于“量子位”，作者“Jay”。

关键词: AI新闻 , deepseek , AI开源 , 人工智能