独家|阿里投资的硅基流动联合创始人杨攀已离职,AI Infra创业定位愈加尴尬

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
独家|阿里投资的硅基流动联合创始人杨攀已离职,AI Infra创业定位愈加尴尬
8742点击    2026-04-28 00:25

独家|阿里投资的硅基流动联合创始人杨攀已离职,AI Infra创业定位愈加尴尬


4月27日消息,智能纪元AGI独家获悉,阿里云和美团联合创始人王慧文投资的AI Infra公司硅基流动联合创始人、增长业务副总裁杨攀近期从硅基流动离职,正考虑再次创业。


目前该消息暂未对外官宣。


不过,目前杨攀的个人微信号名字上面还有#硅基流动 字样,或将等到硅基流动下月新一轮融资落地后正式官宣——一般来说,投资机构会与被投企业在联合创始人等高管稳定层面有协议,要等新一轮融资或股改后才可以对外正式卸任。


独家|阿里投资的硅基流动联合创始人杨攀已离职,AI Infra创业定位愈加尴尬


据智能纪元AGI独家获悉,当前硅基流动正接近完成新一轮融资。


事实上,不止杨攀,高管流动最近已经成AI和具身智能行业的普遍现象了。比如,星海图联合创始人许华哲离职后创业做破壳机器人,DeepSeek核心作者郭达雅到字节Seed团队等。


但杨攀的重要性在于做硅基流动用户“增长”,而且今年AI龙虾热潮中,他频频代表硅基流动活跃和发声。所以,他的离职对于硅基流动下一步发展来说可能有一定影响。


公开信息显示,杨攀写代码32年,主要做即时通讯,做过微软MSN、中国移动飞信,杨攀曾任极客邦科技副总裁、TGO鲲鹏会总经理;涛思数据(TDengine)战略合作与开发者关系副总裁。2014年,杨攀联合创立融云并任CTO,从零到一构建全球即时通讯云服务。


2023年8月,前微软亚洲研究院研究员、OneFlow创始人袁进辉创立了硅基流动(SiliconFlow),聚焦AI Infra赛道,搭上了DeepSeek V3/R1热潮与华为合作提供服务。2024年下半年左右,杨攀加入了硅基流动,负责增长业务。


如今,硅基流动已获得阿里云、华为哈勃、智谱AI、奇绩创坛等机构,以及美团联合创始人王慧文等人的支持。


但过去一年AI Infra市场发生了巨大变化。


随着OpenClaw和DeepSeek-V4发布,国内大厂、模型层、国产芯片层、AI应用侧企业都拥有Infra技术和团队,这让所谓担任“中间层”的AI Infra赛道变得尴尬,或许是杨攀离职的原因之一。


另一方面,硅基流动以及其重要对手之一的无问芯穹,最近已宣布转型做卖Tokens算力公司。


但无问芯穹已完成股改、冲刺IPO,反观硅基流动、清程极智等同类AI Infra企业,仍长期停留在初创发展阶段。


总的来说,AI Infra独立创业赛道地位已经越来越尴尬,如今企业不得不选择讲新故事,被迫转型、寻求全新发展路径。


算力“中间层”竞争加剧


4月24日,期待已久的DeepSeek-V4-Pro和V4-Flash系列模型正式开源并发布。


在架构、底层算力、训练、后训练、数据、推演、安全沙箱等全维度完成迭代升级。


其中在AI算力和Infra层面,DeepSeek把Agent训练当成解决Infra问题,引进了DSec沙箱、混合注意力、分布式推理、工具调用链路等技术,本质上就是压缩算力成本、提升资源利用效率,以此全面强化大模型综合能力。


事实上,对于AI算力和模型技术来说,其最大的“不可能三角”困境在于——模型性能、训练成本、硬件规模这三者难以兼得。面对这一困境,许多公司要么选择轻量化模型牺牲性能,要么在沉重的算力开支重压下艰难前行,最终耗尽资金。


而DeepSeek让AI infra成为了模型训练和推理发展的关键要素,让模型性能、训练成本、硬件规模得到一个平衡。


这就是AI Infra。


简单来说,Infra全称是Infrastructure——AI基础设施,支撑大模型全生命周期的算力+软件+服务底层,介于芯片与AI应用之间,核心解决“算力不够、太贵、用不起”问题,让模型具备更大的性价比。


在美国,AI模型和算力研发基本来自于微软、谷歌、Meta等大厂,本身依赖于英伟达和自身ASIC硬件团队的Infra能力,所以美国AI Infra公司极其稀少,创业者最爱谈的案例是Together AI,目前估值75亿美元。


但是,Together AI做的并非仅是Infra,其出租英伟达芯片服务器做超算云租赁、而且还研发开源模型、考虑做AI芯片设计等,所以并不单纯属于AI Infra公司。而其他Infra公司都被收购、整合或减少规模,比如贾扬清创立的Lepton AI被英伟达收购等。


而国内在2023年,由于ChatGPT热潮引发很多模型创业公司下场,但下层还有国产云端AI芯片、云服务以及智算中心等产业链,中间存在一定的Gap。


算力券一来,AI算力行业亟需成熟的中间服务商补全产业链缺口,彼时模型厂商也尚未充分意识到推理算力的长期增长需求。


对于很多CEO来说,Infra创业无疑是重要机会之一。


因此,2023年前后,国内诞生了无问芯穹、硅基流动、硅基对门的清程极智、趋境科技、潞晨科技等多家清华系AI Infra公司。


独家|阿里投资的硅基流动联合创始人杨攀已离职,AI Infra创业定位愈加尴尬


2023年底的奇绩创坛路演日上,袁进辉首次对外透露创立了硅基流动这家公司,并宣布完成5000万元天使轮融资,由创新工场、耀途资本、奇绩创坛等机构联合投资,初步构建起模型云服务平台SiliconCloud等。


当时袁进辉表示,大模型最大的障碍就是推理和部署成本太高。就像微软 Copilot虽然拥有100多万付费用户,但在最后用户认为上面仍然是亏本,OpenAI的业务扩展也正受到GPU服务能力的限制,所以Infra解决大模型推理成本。


袁进辉首先思考的是,硅基流动瞄准海外或出海的AI模型和算力公司获得收入,最后上线了如今名为BizyAir的在线创作平台,国内则与一些模型公司做合作、拿算力券等,所以海外层面和潞晨科技等Infra公司在市场上形成竞争关系。


2025年初,DeepSeek V3和R1引发全球关注,硅基流动成为最早一批适配模型的厂商,并且通过低价等方式获取用户,实现infra层的APi调用,引发广泛关注。


独家|阿里投资的硅基流动联合创始人杨攀已离职,AI Infra创业定位愈加尴尬


但不久之后,硅基流动和潞晨之间就正面交锋了。


2025年3月,潞晨科技创始人尤洋公开发文质疑硅基流动,直指其绑上国产芯片和DeepSeek API容易激起国人兴趣的“敏感点”,通过邀请人送代金券的“传销方式”吸引用户关注,而今又开始限制用户每天的调用量,“而且API速度跟蜗牛一样慢,感觉很坑”。“真不觉得硅基流动的API性能好,因为我不太相信硅基流动工程师的水平高于英伟达和SGLang/vLLM的顶尖工程师。”


随后,硅基流动创始人、CEO袁进辉在朋友圈公开回应称,“无语,我们团队愿意拼搏抓一个机会有什么错? 邀请用户送点免费券有什么错?很多应用都这么做,海外也有;春节那几天,全民都想访问DeepSeek而不得时,我们提供了仅有的一个稳定的服务,用户愿意过来有什么错?(因为)来的人太多,网站被挤爆了,付费用户也用不了了,只好辟出一块资源做Pro版给付费用户,保障付费用户体验。我们免费版现在体验也改善了,Pro版一直是业内最稳定的服务之一。”


袁进辉还指出,硅基流动工程师在几年前OneFlow时就开源过一批比英伟达官方实现还要快的算子,“还被潞晨科技抄袭,只是为了给对方留个面子没有公开,现在竟然这样诋毁我们。”


据了解,最后是投资人和中间人士调停,尤洋删了文章,这场行业舆论争议就此平息。


最近半年多,硅基流动转向了国内市场,而且发展很快。一方面,硅基流动搭上了智谱、华为、阿里、字节的合作订单,推出企业级私有化部署方案SiliconBrain,并且盯着模型迭代做更多优化。


目前硅急流动的投资方包括智谱、华为、阿里、字节等机构。


硅基流动曾在2025年底透露一组用户数据:获得超900万用户,并服务了超10000家企业用户,平台日均Token生成量超过1000亿tokens。


袁进辉还披露,硅基流动日均出口Token约500亿,价值约2万美元(我不清楚这个价值怎么判定)。


此外,我还了解到,硅基流动营收大概在亿元级规模。


尴尬的中间层,难啃的商业化


如今,对于整个AI Infra行业来说,一个问题在于:


所有人都看到了AI推理算力和异构算力infra需求,但Infra技术本身的技术天花板明显,像Anthropic、OpenAI这些模型公司都在做Infra,且企业级AI MaaS的收入没想象当中那么高,市场内卷加剧。


如今,无论是阿里、腾讯、百度、字节、智谱等大厂和模型层企业,还是摩尔、沐曦、商汤、壁仞等芯片算力和智算中心设施层,都在做infra算力技术和模型适配,独立的Infra的商业空间越来越窄。


比如,百度的百舸·AI计算平台(AI Heterogeneous Compute,简称AIHC)是面向大规模深度学习的高性能云原生AI计算平台,也就是百度的Infra团队,负责智算中心和推理模型的infra加速。


独家|阿里投资的硅基流动联合创始人杨攀已离职,AI Infra创业定位愈加尴尬


百度透露,其万卡单任务有效训练时长可达98%以上,大幅提升算力使用效率。


阿里云则是有专门的服务器和基础设施部门,做磐久AI Infra服务器工作,硬件、软件、互联和液冷都做了一整套的物理AI算力技术方案。


独家|阿里投资的硅基流动联合创始人杨攀已离职,AI Infra创业定位愈加尴尬


腾讯云则在去年12月姚顺雨入职后,终于分拆成立了AI Infra部门、AIdata部门和数据计算平台部门,之前内部还有包括自研“水杉”“银杉”的智能网卡以及DPU业务、IaaS部门做infra等。


腾讯云最近透露了一组数据:用了自研的AI Infra,模型启动提速17倍,大规模服务扩容时间从10分钟缩短至34秒;多模态推理加速4倍,自研推理引擎覆盖生文、生图、生视频等模型;通过内存优化与通讯协议升级等创新,显著降低计算开销。


而字节跳动的AI Infra能力被业内公认为国内领先水平,散落在Seed、火山引擎、抖音等大的事业群当中,其Infra和基础设施团队规模预计超过千人


此前字节拆分AML相关业务,独立组建Seed底层算力研发团队。


目前字节模型研发层的Seed-Infrastructures团队,负责大模型的分布式训练、强化学习框架、高性能推理、异构硬件编译器等工作,整体负责字节训练infra大团队管理。


而字节豆包大模型推理层面的Infra在火山引擎,之前将IaaS、服务器等多个技术部门合并到了基础设施部门当中,由字节老兵项亮等人负责,为火山引擎和豆包大模型提供infra服务。


此外,字节还有Web Infra、机器学习中台Infra、抖音的infra团队等等,基础设施层的团队人员非常多。


在行业人士看来,目前国内AI Infra水平层面:


第一梯队:DeepSeek、Seed、阿里通义、阿里云PAI


第二梯队:百度(文心、paddle、百舸)、昆仑芯软件infra团队、腾讯(混元infra)、美团、快手、字节(AML+火山引擎)、阿里夸克、阿里控股、小红书、华为(盘古、MindSpore、原华为云infra团队)、蚂蚁 Asys/Areal团队、阶跃星辰、月之暗面、MiniMax等。


因此,对于无问芯穹、硅基流动等独立AI Infra创业公司来说,其市场空间越来越窄。


无问芯穹的汪玉就曾在去年一场活动上说过,最近两年AI公司在To B和ToG方向上越来越难赚钱。


因此,很多AI Infra公司从开始拿地方的算力券和很多垂直模型和AI应用企业合作,后来不断发展后,AI infra企业的商业化方向有很多“分流”。


其中,无问芯穹开始在智算中心订单中提供服务;硅基流动则是寻找华为等国产AI大厂合作;而更多Infra公司寻找的是海外市场,或者是中小开发者群体,形成一定的小规模运行。


但随着DeepSeek V4发布,模型层已经做好了Infra技术,算力公司也跳过Infra公司直接和模型公司更密切合作——如摩尔线程和智谱、DeepSeek和华为昇腾、阶跃和壁仞华为燧原等。


AI Infra的市场会越来越窄。


壁仞科技创始人张文去年7月也表示,毕竟国产GPU芯片需要提前2年设计,之后才会流片量产,而模型迭代几乎是以周为期。因此,模型层与GPU芯片公司应该要越来越密切合作。


总结


最近很多人都问过我:AI Infra的作用到底是什么?


此前,我可能认为,Infra可以给数据中心、模型层面做算力加速,做算力云,并且让英伟达、AMD卡与摩尔、沐曦等30多种国产计算卡做异构计算和芯片软件栈平台“解耦”,从而让这些国产芯片提高利用率,能够更大程度发挥关键作用。


但如今,我已经不这么认为了。


推理算力需求增加,CPU和存储成本变高,国内智算中心建设放缓或基本停滞,底层AI芯片公司开始与模型层合作,AI Infra公司发展空间变得越来越小。


以无问芯穹为例。他们从一家专门做AI infra和超算云公司,后来想做LPU这类端侧AI算力厂商。去年下半年,无问芯穹的故事变成了做Agent Infra公司,再到如今做tokens工厂的算力公司。


今年中关村论坛上,无问芯穹联合创始人兼CEO夏立雪表示,1月底开始,无问芯穹基本上每两周Token量就翻一番,到现在基本上已经翻了十倍。上次见到这个增速,还是3G时代看手机流量的时候。


夏立雪表示,面向Agent时代,需要打造Agentic Infra、打造更智能的Token工厂。“在Made in China时代,中国凭借制造优势将好的商品输出到了全球。当下,中国可以凭借能源优势,通过高能效的Token工厂,将优质的Token输出到全球,来实现AI-Made in China,成为世界的Token工厂。”


而袁进辉也开始将硅基流动的“故事”转型为tokens工厂。


袁进辉在今年中关村论坛期间表示:硅基流动是一家全球美食自助餐厅。它支持的模型数量是全网最多的。无论用户想要哪个第三方的大模型,它都能瞬间通过“管道”把Token送过来。它不关心这水是哪个“品牌”产的,它只关心用户想喝什么,它就能提供什么。


“硅基流动能在Token工厂这条赛道站稳,核心能力就是让Token便宜、好用、不挑食,无论用户想用什么模型、无论底层是什么芯片、无论算力来自哪里,硅基流动都能把它们消化掉,统一输出成高质量的Token。”


怎么评价这些呢。


我只能说,CEO们都想做黄仁勋,希望复刻行业龙头的发展路径,但人家已经是五万亿美元的公司CEO,你就是个小公司CEO,二者体量与行业地位差距悬殊。


然而,站在行业观察者视角来看,现在AI Infra创业公司要么被大厂收购,要么就赶紧找退出渠道,否则只会陷入「技术领先但盈利困难」的长期发展困境。


现在AI领域创业的很多CEO,在表面上认为“自己技术这么牛、商业化也是行业前茅”、“舆论一定要做到领先领先再领先”,但实际上,他心里非常清楚自身的地位,尤其是初创赛道的龙头公司。


简单来说,就是CEO“飘了”。


我认为无论是稀疏计算技术,还是AI推理算力加速、研发算子库和底层设施,或者说有商业渠道,这些只是Infra公司活下去的理由之一,但这些并非是真正的“护城河”。


我并不是不看好AI infra公司发展,只是觉得AI infra公司需要转型、需要找好自身定位,否则将持续面临大厂的全面挤压与降维竞争。


毕竟,ChatGPT热潮持续了三年,除了三大顶刊的其他科技媒体们,其实都没在AI热潮中赚到钱,更不用说创业公司了。


中国的AI公司想要商业化赚钱,真的太难太难了。


文章来自于微信公众号 "智能纪元AGI",作者 "智能纪元AGI"

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
逆向大模型

【开源免费】kimi-free-api是一个提供长文本大模型逆向API的开渔免费技术。它支持高速流式输出、智能体对话、联网搜索、长文档解读、图像OCR、多轮对话,零配置部署,多路token支持,自动清理会话痕迹等原大模型支持的相关功能。

项目地址:https://github.com/LLM-Red-Team/kimi-free-api?tab=readme-ov-file