纽约,第九大道上奢华的三层星巴克臻选烘焙工坊。
Edwin Chen点了一杯绿茶,因为他觉得在这里点咖啡太浪费时间。
37岁的他,刚刚成了美国《福布斯400》榜单里最年轻的亿万富翁,身价高达180亿美元!
但Edwin Chen是个怪人——
这是一个用自己方式改写AI产业规则的人。
福布斯美国400富豪榜
Forbes 400(福布斯美国400富豪榜)是美国福布斯杂志(Forbes)每年发布的榜单。
专门列出美国境内最富有的400位个人,按其净资产(net worth)从高到低排名。
如果按照年龄排序,37岁的Edwin Chen是新晋的最年轻亿万富翁。
有意思的是,紧随Edwin Chen之后的Lukas Walton是沃尔玛创始人山姆·沃尔顿的孙子,2005年其父约翰·沃尔顿因飞机失事去世后,他继承了大笔遗产,在福布斯400榜单上,他的净资产为398亿美元。
而如果按照净资产的排序,排名前15的最年轻富豪是谷歌的两位创始人,拉里·佩奇和谢尔盖·布林(52岁),以及马斯克(54岁),但没有一个人是40岁以下,年龄最大是巴菲特(95岁)。
福布斯自己都认为,美国最富有的人群也往往是年纪最大的。
过去25年间,福布斯400富豪榜成员的平均年龄从61岁攀升至70岁,比39岁的美国人平均年龄整整大了三十岁。
在福布斯400最新的榜单中,Edwin Chen甚至还没有头像(目前)。
低调到「无人认识」的AI亿万富翁
Edwin Chen此前如此低调,以至于即使Scale AI的Alexander Wang被Meta重金收购时,他的名字也没有「浮现」在媒体中。
但随着Scale AI引发的对数据标注的关注度,Edwin Chen如今这位福布斯400富豪榜最年轻的成员,正准备走出幕后发出自己的声音。
福布斯的记者Phoebe Liu对Edwin Chen进行了一次专访,揭开了这家另类数据标注公司Surge背后的故事。
福布斯400最年轻成员
Edwin Chen曾在谷歌、脸书和推特(现在的X)任职,在AI革命的浪潮中悄然创立了数据标注公司Surge。
Phoebe Liu在纽约的星巴克对Edwin Chen进行了两个多小时的专访,以下是访谈全文,略作删改。
在曼哈顿公寓里用整个上午审阅数据集、研读论文并调试尖端AI模型后,Edwin Chen信步走向第九大道上的星巴克臻选烘焙工坊。
身着Vuori藏青色T恤,肩挎虎纹帆布托特包,Edwin Chen走下楼梯坐在暗角卡座。
这位数据标注与AI训练公司Surge AI的创始人兼CEO啜饮着小杯绿茶。
Edwin Chen聊天时连珠妙语:
从硅谷文化(他深恶痛绝)到竞争对手(全是人力外包作坊);再到若外星人造访地球时的人类交互方式,「他们不说英语,该如何沟通?如何破译其语言?或许能通过某种数学方式实现。」
这一困境也在他最喜欢的短篇小说——科幻作家特德·姜1998年的作品《你一生的故事》中有所探讨。
该小说后来成为电影《降临》的蓝本,讲述了一位语言学家通过识别外星人语言和文字中的模式与之交流的故事。
Edwin Chen表示,这也是他在2020年创立Surge的部分灵感来源,他希望自己的数据标注公司能够编码「人性的丰富性」。
对他而言,这意味着让最聪明的人类(包括斯坦福、普林斯顿和哈佛的教授)来训练AI,将他们的专业知识转化为支撑大语言模型的0和1代码。
除了这些常春藤联盟的精英,Edwin Chen还雇佣了来自全球50多个国家的超过百万名零工工作者,他们负责提出可能难倒AI的问题,评估模型的回答,并编写帮助AI生成完美回复的标准。
Edwin Chen说,「我真心认为我们所做的工作对所有AI模型都至关重要,没有我们,通用AI(AGI)就不可能实现」。
从未听说过的最成功的科技企业家
Edwin Chen,一位言辞冗长、才华横溢且性格古怪的人物,或许是你从未听说过的最成功的科技企业家。
这主要是因为他一直刻意保持低调。
即使是Surge AI的官网也是同样的低调,低调到主页只有一堆文字,没有酷炫的UI和精致的互动效果。
这位曾在推特、谷歌和脸书任职的数据科学家避开了传统的风险投资,七年前离开了硅谷这个「鱼缸」,选择用自己在大科技公司十年积累的「几百万」存款来资助Surge公司。
「我们自筹资金的原因之一是我一直讨厌硅谷的地位游戏,」Edwin Chen说道,他将典型的由风投支持的硅谷初创公司描述为「快速致富的计划」。
他也讨厌筹集大量资金然后不得不花掉的想法。
在他看来,这会导致大规模的超额招聘。
Surge仅有250名员工,包括全职、兼职和顾问。相比之下,其竞争对手Scale AI的员工数量是Surge的四倍,但收入却更少。
Surge自成立不到五年间,2024年营收已达12亿美元,客户涵盖谷歌、Meta、微软以及AI实验室Anthropic和Mistral。
Edwin Chen透露,公司几乎从创立首日就实现盈利!
基于当前业绩,其估值约达240亿美元。
Surge正以300亿美元估值进行10亿美元融资谈判,目前该轮融资尚未最终落定。
Edwin Chen决定使用「自有资金」支持Surge的决策获得了丰厚回报:他持有的约75%股份估值约180亿美元,这足以使他成为今年福布斯美国400富豪榜上最富有的新晋成员。
年仅37岁的他,也是该榜单上最年轻的成员。
独特的数据标注模式
Surge声称其方法不同于旧式的数据标注模式——后者往往雇佣全球欠发达国家的人员,以每小时几美分的报酬让他们坐在电脑前区分猫和狗。
相反,Edwin Chen的数据标注员(包括专业人士和教授)会遵循一套指令与在线聊天机器人互动。
他们可能被要求尝试诱导聊天机器人输出错误或有毒回复,然后撰写更好的回应;或者被要求比较不同AI对同一问题的回复,并解释为何某一回复更优。
按收入计算,Surge目前是该行业最大的企业!
但包括Scale AI(Meta于6月以140亿美元收购其49%股份)、Turing、Mercor和Invisible AI在内的竞争对手正在迅速崛起。
一直以来,Edwin Chen都在幕后默默建设他的公司并积累声誉。
一位现任Meta研究员表示,Surge只是不愿透露他们的任何工作细节。
但随着行业的发展,Edwin Chen不再满足于置身幕后。
他深切担忧当今的AI模型被错误的目标所优化,将用户引入幻觉兔子洞——这正如他曾在YouTube和Twitter工作时,那些平台的算法主要被优化来追求点击率。
他希望Surge能帮助引领AI行业的发展,这意味着他要将自己定位为更具影响力的思想领袖。
数学怪才
Edwin Chen在佛罗里达州的水晶河(人口3400人)长大,这座墨西哥湾沿岸城市以海牛和退休人士而非科技亿万富翁闻名。
他的父母从台湾移民到美国,经营着一家中泰美式餐厅,Edwin Chen少年时期曾在那里工作。
他真正的兴趣在于语言与数学之间的关联。
用他自己的话说:我一直对语言的数学基础很着迷。
小时候,他想学习大约20种语言,并且热爱拼字比赛。
数学对他来说很容易,但直到他开始注意到数字中独特的模式,数学才真正抓住他的想象力。
Edwin Chen在八年级就学习了微积分,他表示自己获得了精英寄宿学校乔特中学(位于康涅狄格州)最后两年全额奖学金,该校校友包括约翰·肯尼迪和伊万卡·特朗普。
在修完乔特所有数学课程后,他高三大部分时间都在耶鲁大学教授指导下研究任何自己感兴趣的课题。
随后他进入麻省理工学院,主修数学,共同创立了语言学社团,并实行多相睡眠计划——即将睡眠分割成多次短时休息,比如每六小时小睡30分钟,而非连续八小时的长眠。
在麻省理工学院就读三年后,Edwin Chen在彼得·蒂尔位于旧金山的对冲基金实习,并对此非常喜欢,以至于再也没有返校。
完成必修课程后,他申请了学位并于两年后获得。
随后,他先后在推特、谷歌和脸书工作,担任过涉及内容审核和推荐算法的多个职位。
在每一个职位上,Edwin Chen都遇到了同样的问题:难以大规模获取高质量的人工标注数据。
2020年,他离开推特,并于同年创立了Surge。
不想上市的创业者
Edwin Chen是一名素食主义者,他每天步行两万步,并称在纽约街头漫步时能迸发出最佳思考。
每周一两次,他会午夜漫步至时代广场。
「我热爱看到这浓缩的人间百态——百老汇演员、来自世界各地的游客、夜班工人、艺术家——被灯光、科技与基础设施环绕。」
「为什么有人会想上市呢?上市公司的一大问题在于它们总是不得不为短期利益而担忧。」
Edwin Chen厌倦了那些「完全是垃圾」的数据标注,这些标注要么来自报酬过低而不在乎的人,要么来自缺乏必要文化或政治知识以做出明智判断的人。
Surge希望雇佣那些理解语境并对语言有深刻理解的人。
他在业务的其他方面也采取了独特策略。
放弃传统的销售与营销手段,他最初通过自己广受欢迎的数据科学博客进行沟通——这个博客是他在十多年前业余时间创建的。
他表示,Surge的首批客户正是通过该博客获得,但拒绝透露具体名单。
已知早期客户包括爱彼迎、Twitch及其前雇主推特公司。
他尝试直接向科技公司的数据科学家进行推广,认为这些人能识别Surge数据质量并更愿意付费(据两名研究人员透露,Surge的收费比竞争对手高出50%至十倍)。
2023年5月的一个周六夜晚,一位谷歌研究员经同事推荐致电Edwin Chen。
当时谷歌的Gemini系列AI模型状况相当糟糕。
这通电话持续了两个多小时。
不久后,谷歌与Surge签订了年额超1亿美元的合同。
AI初创公司往往守口如瓶,但即便在同业中,Surge仍显得格外神秘。
其最大客户也不完全清楚其数据优势所在。
反过来,Surge及其竞争对手也难以追踪哪些数据最终用于训练Gemini、Claude或OpenAI的GPT模型。
Surge拒绝透露其项目人员匹配机制、数据收集方式及标注流程。
客户支付数百万美元后,获得的仅是一个数据集链接。
这使得Surge能够通过隐藏测试、由评分更高的标注员进行人工审核,以及优化表现且可能相当对抗性的机器学习算法,更密切地监控标注员的表现。
Edwin Chen坚持认为,Surge的质量控制和深厚的技术专长是其秘密武器。
AI不再依赖人类进行数据标注的那天
对于Surge这类企业而言,存在一个根本性问题:随着AI技术的进步,是否会有一天不再需要人类进行数据标注?
据Meta研究人员透露,今年四月发布的Llama4等模型已大量依赖AI自主生成和标注数据——即所谓的合成数据。
Surge采用了一种人机协同的变通方案:由AI生成数据并自行标注,但由人类评估其表现。
Edwin Chen坚信人类不可或缺。
他指出当人类与AI协同工作时,所能达到的成就远超任何单方的独立成果。
但即便人类保持参与,若行业更注重机器自我训练,仍将影响其盈利空间——因为训练成本将大幅降低。
参考资料:
https://www.forbes.com/sites/phoebeliu/2025/09/17/the-ai-billionaire-youve-never-heard-of/
文章来自于微信公众号 “新智元”,作者 “新智元”