不到 3 个月估值破 40 亿,Fal.ai CEO:模型越多,我们越值钱

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
不到 3 个月估值破 40 亿,Fal.ai CEO:模型越多,我们越值钱
6635点击    2025-10-27 11:02

不到 3 个月估值破 40 亿,Fal.ai CEO:模型越多,我们越值钱

(估值40亿美元后,Fal.ai创始人首次深度访谈片段)


2025 年 10 月 22 日,AI 基础设施公司 Fal.ai宣布完成新一轮 2.5 亿美元融资。据悉,凯鹏华盈与红杉资本领投此轮,公司估值超40亿美元。


距离上一轮 15 亿美元估值的 C 轮融资,还不到 3 个月。


这家不足 50 人的初创公司,没有训练任何自研大模型,也不追逐最强参数。


它只做一件事:让模型能调用、可商用


Fal.ai 联合创始人兼 CEO Gorkem Yurtseven 在随后的专访中这样定义自己:


不再比拼模型能力,而是让任何模型都能被开发者用起来。模型越多,我们的平台就越有价值。


18个月前,他们还在做数据基础设施工具,为大公司处理数据清洗与转换。


直到Stable Diffusion爆火,他们看到底层逻辑变了:过去是训练模型难,现在是模型太多,反而没人能用好。他们砍掉付费产品,把模型当原料,把推理变成流水线。


不到 3 个月估值破 40 亿,Fal.ai CEO:模型越多,我们越值钱

(来源TechCrunch :Fal.ai完成新一轮融资,估值超40亿美元)


今天,Fal平台托管 600 多个模型,服务超过 200 万开发者。 Adobe、Canva、Shopify、Perplexity 已将它作为生成式媒体的基础设施。


这家公司不讲“AGI对齐”,不靠“论文发布会”破圈。


但它抓住了一个关键问题:当模型爆炸后,谁来承接落地?


答案就在 Gorkem Yurtseven 这场访谈里。


第一节|不是做模型,做模型的“加油站”:Fal 押对了什么?


Fal 是怎么起步的?


2022 年,,他们还在做一个给数据团队用的工具,主要帮企业清洗数据、处理管道。有客户,有营收,有投资人支持。


但 Fal 创始人 Gorkem Yurtseven 说:我们决定放弃所有已有客户,全力转向模型推理。


这背后是一个清晰的判断:真正爆发的,不是模型训练,而是模型被调用。


Fal 做出转型时,正是 Stable Diffusion 爆红的时期。随后,OpenAI 的 ChatGPT、DALL·E 2、Sora 接连上线。


过去要用 AI,你得先训练模型,得有自己的大数据。现在不一样了,模型已经训练好了,你只要能接入,就能做出产品。


Gorkem 回忆,他们当时问自己一个关键问题:


哪个方向能让我们最快做到 100 万美金收入?哪个能最快到 1000 万?


他们的回答: 不是做一个新模型,而是做一个能让任何模型直接上线的平台。


市场信号很明显:


  • 每当一个新模型发布,就有很多人想用;
  • 但这些人要么缺 GPU,要么不知道怎么部署;
  • 模型作者也不知道怎么做 API 或运维。


Fal 做的就是让模型从实验室到产品之间那一步,变得特别快。


他们最早支持的,是 Stable Diffusion。后来是 Flux 视频模型。 再后来,几乎所有主流开源多模态模型,他们都能做到发布当天就接入。


Gorkem 这样形容:


“每个人都想一遍又一遍地做差不多的事情,那我们就把最常见的用法做好,让人一用就能上手。”


今天,Fal 已经成了多模态模型发布的首发平台之一。只要一个模型能生成图片、视频或音频,就能在 Fal 上被调用、被试用、被接入企业产品。


不是造引擎,而是造“加油站”。


这个判断,是他们三轮融资、估值翻倍的第一步。


第二节|没有GPU优势,如何跑出速度优势?


Fal 最出圈的不是融资新闻,而是在硅谷的两顶帽子。


一顶印着“GPU 富人”,另一顶印着“GPU 穷人”。结果,“GPU 穷人”那顶最先被抢光了。


这是玩笑,也是真实写照。Gorkem 说:当时 GPU 抢不到,我们就开始疯狂优化每一次模型调用的速度。我们不是资源多,而是用得省、调得快。


他说,他们的核心目标只有一个:


让每一次模型调用,尽可能快、尽可能稳、尽可能便宜。


这不是简单压成本,而是把整个模型运行过程,当作一条“产线”去调试。


Fal 最早优化的是 Stable Diffusion 模型。他们有个只有两人的工程小组,一人擅长写底层代码,一人精通 GPU 指令。他们每天就做一件事:找哪里还能省时间,哪里还能提速。


Gorkem 说:我们不研究模型怎么更聪明,而是研究怎样运行的更快。


他们做到了:同样一张图片生成,从几十秒缩短到几秒以内;视频模型的推理时间也压到了行业最低。


怎么做到的?


  • 模型冷启动慢?那就提前缓存;
  • GPU 分配混乱?那就按模型热度智能调度;
  • 多个模型抢资源?那就建 28 个节点,把流量分开。


Fal 不是堆硬件,而是把模型当作工序管理起来,像流水线一样高效调配。


Gorkem 强调,这一切的关键,是他们坚持自己部署模型、自己控制 API,不让客户“上传自己的代码”:我们不做开放式平台,而是把常用的功能打包成一套通用接口,做到即插即用、快速响应。


Fal的产品逻辑很清晰:不是让你自由搭建,而是可以直接调用。


他们的模型平台像一个中控室,600 多个图像、视频、音频模型随时待命。客户发起请求后,系统会在最合适的节点、用最少的时间给出结果。


凭借这一点,他们后来服务了上百万开发者,支持了Adobe、Shopify等大企业。


第三节|技术不是壁垒,入口才是


Fal 一开始的客户,大多是个人开发者。没预算、没团队,甚至没有 GPU。


但这些人,一上线就愿意花钱。


Gorkem 回忆:


我们看到一些用户每天在平台上花几千甚至几万美元。那时候我们就知道,这不是玩具。


这些客户不是为了测试模型,而是要上线产品。哪怕模型本身是开源的,他们也不想花时间自己部署。


他们只想要一个API,可以直接调用、稳定输出、不掉链子。


这就是 Fal 的切入点:不是提供最强模型,而是把最常用的模型封装成一键可用的工具。


  • 用 Stable Diffusion 生成图片,Fal 提供的是已经打包好的推理接口;
  • 想用 Flux 视频模型,也不需要下载模型、配置环境,只需要接一个 API;
  • 平台会自动调配 GPU、提前加载模型,确保你发请求后能立即拿到结果。


Gorkem 明确表示:


“我们不是做一个大家都能自定义的托管服务,而是做一套响应快、能落地、能商用的推理平台。”


不给太多自由,而是把最复杂的部分替你做好。


客户不关心模型是谁训练的,只关心能不能准时返回结果、价格可不可控、接入后会不会出问题。


一旦接入了,就懒得换。


Fal 不靠单个模型绑定用户,而是靠平台的整体体验:快速上线、接口统一、模型自动更新、稳定可靠。


就像 AWS 的S3,关键不是技术最复杂,而是让开发者用得省事、用得放心。


Fal 把模型变成服务,把模型的“入口体验”变成了自己的产品。每次有新模型发布,Fal 的第一反应不是看论文,而是:怎么把它接入平台,三小时内上线?


Gorkem 说得非常具体:


“我们会开一个 Slack 群通话,七八个人一起在线调模型。有人调代码,有人分享屏幕,有人在测接口。我们甚至把这个过程直播过。”


这就是 Fal 独有的节奏。


不是把模型做得多复杂,而是谁能最快让别人用起来。


第四节|多模态越来越碎片,平台反而更值钱


过去几年,AI 领域有个主旋律:谁训练模型,谁掌握未来。


但到了 2025 年,多模态模型的玩法变了。


Gorkem Yurtseven 的判断是:现在每周都有三五个模型发布,开发者已经跟不上了。


这一波爆发,不是靠一个超级模型,而是大量开源、多样化、用途细分的模型一起涌现。


  • 有的专门生成图片;
  • 有的只做 4 秒视频;
  • 有的专攻 3D 动作捕捉;
  • 还有的是声音合成、配乐生成…


它们都很好用,但格式不一样、调用方式不同,速度也参差不齐。从架构到接口,每个模型功能都差不多。结果就是:


  • 研究院做出了好东西,没人能用;
  • 开发者想用新模型,却不知道去哪找、怎么部署;
  • 企业想买服务,但缺少一个靠谱的平台去对接。


而 Fal 抓住了这个机会。


Gorkem 的思路很清晰:


模型越多、越分散、越碎片化,我们就越值钱。因为只有平台才能把它们整合、优化、让人用起来。


Fal 做的事情,可以理解成:


  • 帮开发者一口气接入 600 个模型,不用来回换接口;
  • 帮企业绕开兼容难题,直接用一套方案统一接入;
  • 帮模型作者在平台上发布和上线,无需自己建服务器。


就像当年浏览器统一了网站入口、电商平台统一了商品入口,Fal 正在统一模型入口。


更重要的是,这是长期趋势。


Gorkem 指出: “模型不会只有一个官方版本。只要能被修改和复制,就会出现无数个针对不同场景的优化版本。”


这意味着:


  • 大模型的“唯一权威”地位正在弱化;
  • 开源社区、创业公司、研究院都会发布自己的版本;
  • 市场将变成百花齐放、版本混杂的局面。


这时候,基础设施比模型本身更值钱。


这正是Fal能在三个月内估值暴涨的关键。当 Sora 等视频应用爆火时,Fal 作为底层基础设施,自然成为最大的受益者之一。


第五节|45人,1亿美金:小团队如何跑出大效率?


Fal 的团队规模,一直让人意外。


2025 年,他们年营收超过 1 亿美元,客户包括 Adobe、Shopify、Perplexity 等大企业。


但整个公司不到 50 个人。


Gorkem 说得特别实在:我们没有工程经理,全员写代码,连领导也自己上手干。他们没有层级、没有流程汇报,也不搞例会。他们更愿意拉个三四人的小群,直接在线上把事情解决。


他们的做法是:有问题就拉个三四人的小群,直接在线上解决。


看起来松散,但效率极高。


在Fal,团队不追求计划精细,而是盯住模型热度,随时准备快速上线。


Gorkem 形容他们:新模型只要有潜力,就全员动手,像战备状态。这套机制的关键,不是人多,而是方向聚焦。


他说:


“我们只有一个核心目标:收入增长。只要对这件事有帮助,其他都靠后”


在早期,Fal 连销售团队都没有,只有创始人亲自谈客户。很多企业用户都是从平台自然转化来的。


举个例子:


  • 开发者在平台上用API做应用,月支出到了几千美元;
  • 系统监测到活跃度,自动提醒销售;
  • 销售介入,提供年合约、价格优惠、定制支持。


这不是传统 SaaS 公司那套销售流程,而是靠平台本身的自然增长。


他们内部有个简单指标:日支出超过 300 美元的客户,就自动进入销售转化池。


这让他们能用极少的销售人手,完成大体量的客户覆盖。到今天,销售和客户支持团队也只有十来个人。


Fal 的高效,不只是业务策略,更是文化基因。


他们对招聘极度谨慎。


“我们不会因为有钱就招人,也不会为了快扩张就上项目。”


Gorkem 坦言,他们早期招的很多人,都来自老同事、朋友、活跃在社区的开发者。有的在硅谷大厂,有的还在土耳其,但都愿意动手、愿意深入调模型。


  • 模型还没火,就已经准备上线;
  • 客户还没找上门,就已经在平台消费;
  • 团队还没扩张,产品已经做到最前线。


不是靠大预算堆出来的,而是把每一分人力、技术和资源都花在最关键的地方。


结语|模型只是原料,平台才是出口


Fal.ai 没有训练自己的大模型,没有开源权重,也没有发布任何技术论文。


但它成为了估值超40亿美元的公司。


原因只有一个:当模型越来越多,真正稀缺的是谁能让它们被用起来。


Gorkem说过一句话: "别人讲 AGI,我们做的是 API。"


几乎同时,据媒体报道,国内 AI 应用公司 LiblibAI 完成 1.3 亿美元 B 轮融资。


应用层 AI 公司在爆发,基础设施层在狂奔。


接下来的竞争不再是谁的模型更强,而是谁能成为所有模型的首发平台、所有开发者的必选入口。


多模态商业化的下半场,刚刚开始。


文章来自于“AI 深度研究员”,作者“AI 深度研究员”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

2
Flux

【部分开源免费】FLUX是由Black Forest Labs开发的一个文生图和图生图的AI绘图项目,该团队为前SD成员构成。该项目是目前效果最好的文生图开源项目,效果堪比midjourney。

项目地址:https://github.com/black-forest-labs/flux

在线使用:https://fluximg.com/zh

3
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales