来源:智能纪元 AGI
4 月 27 日消息,智能纪元 AGI 独家获悉,阿里云和美团联合创始人王慧文投资的 AI Infra 公司硅基流动联合创始人、增长业务副总裁杨攀近期从硅基流动离职,正考虑再次创业。
目前该消息暂未对外官宣。
不过,目前杨攀的个人微信号名字上面还有 # 硅基流动 字样,或将等到硅基流动下月新一轮融资落地后正式官宣——一般来说,投资机构会与被投企业在联合创始人等高管稳定层面有协议,要等新一轮融资或股改后才可以对外正式卸任。
据智能纪元 AGI 独家获悉,当前硅基流动正接近完成新一轮融资。
事实上,不止杨攀,高管流动最近已经成 AI 和具身智能行业的普遍现象了。比如,星海图联合创始人许华哲离职后创业做破壳机器人,DeepSeek 核心作者郭达雅到字节 Seed 团队等。
但杨攀的重要性在于做硅基流动用户 " 增长 ",而且今年 AI 龙虾热潮中,他频频代表硅基流动活跃和发声。所以,他的离职对于硅基流动下一步发展来说可能有一定影响。
公开信息显示,杨攀写代码 32 年,主要做即时通讯,做过微软 MSN、中国移动飞信,杨攀曾任极客邦科技副总裁、TGO 鲲鹏会总经理;涛思数据(TDengine)战略合作与开发者关系副总裁。2014 年,杨攀联合创立融云并任 CTO,从零到一构建全球即时通讯云服务。
2023 年 8 月,前微软亚洲研究院研究员、OneFlow 创始人袁进辉找上杨攀,联合创立了硅基流动(SiliconFlow),聚焦 AI Infra 赛道,搭上了 DeepSeek V3/R1 热潮与华为合作提供服务。
如今,硅基流动已获得阿里云、华为哈勃、智谱 AI、奇绩创坛等机构,以及美团联合创始人王慧文等人的支持。
但过去一年 AI Infra 市场发生了巨大变化。
随着 OpenClaw 和 DeepSeek-V4 发布,国内大厂、模型层、国产芯片层、AI 应用侧企业都拥有 Infra 技术和团队,这让所谓担任 " 中间层 " 的 AI Infra 赛道变得尴尬,或许是杨攀离职的原因之一。
另一方面,硅基流动以及其重要对手之一的无问芯穹,最近已宣布转型做卖 Tokens 算力公司。
但无问芯穹已完成股改、冲刺 IPO,反观硅基流动、清程极智等同类 AI Infra 企业,仍长期停留在初创发展阶段。
总的来说,AI Infra 独立创业赛道地位已经越来越尴尬,如今企业不得不选择讲新故事,被迫转型、寻求全新发展路径。
算力 " 中间层 " 竞争加剧
4 月 24 日,期待已久的 DeepSeek-V4-Pro 和 V4-Flash 系列模型正式开源并发布。
在架构、底层算力、训练、后训练、数据、推演、安全沙箱等全维度完成迭代升级。
其中在 AI 算力和 Infra 层面,DeepSeek 把 Agent 训练当成解决 Infra 问题,引进了 DSec 沙箱、混合注意力、分布式推理、工具调用链路等技术,本质上就是压缩算力成本、提升资源利用效率,以此全面强化大模型综合能力。
事实上,对于 AI 算力和模型技术来说,其最大的 " 不可能三角 " 困境在于——模型性能、训练成本、硬件规模这三者难以兼得。面对这一困境,许多公司要么选择轻量化模型牺牲性能,要么在沉重的算力开支重压下艰难前行,最终耗尽资金。
而 DeepSeek 让 AI infra 成为了模型训练和推理发展的关键要素,让模型性能、训练成本、硬件规模得到一个平衡。
这就是 AI Infra。
简单来说,Infra 全称是 Infrastructure —— AI 基础设施,支撑大模型全生命周期的算力 + 软件 + 服务底层,介于芯片与 AI 应用之间,核心解决 " 算力不够、太贵、用不起 " 问题,让模型具备更大的性价比。
在美国,AI 模型和算力研发基本来自于微软、谷歌、Meta 等大厂,本身依赖于英伟达和自身 ASIC 硬件团队的 Infra 能力,所以美国 AI Infra 公司极其稀少,创业者最爱谈的案例是 Together AI,目前估值 75 亿美元。
但是,Together AI 做的并非仅是 Infra,其出租英伟达芯片服务器做超算云租赁、而且还研发开源模型、考虑做 AI 芯片设计等,所以并不单纯属于 AI Infra 公司。而其他 Infra 公司都被收购、整合或减少规模,比如贾扬清创立的 Lepton AI 被英伟达收购等。
而国内在 2023 年,由于 ChatGPT 热潮引发很多模型创业公司下场,但下层还有国产云端 AI 芯片、云服务以及智算中心等产业链,中间存在一定的 Gap。
算力券一来,AI 算力行业亟需成熟的中间服务商补全产业链缺口,彼时模型厂商也尚未充分意识到推理算力的长期增长需求。
对于很多 CEO 来说,Infra 创业无疑是重要机会之一。
因此,2023 年前后,国内诞生了无问芯穹、硅基流动、硅基对门的清程极智、趋境科技、潞晨科技等多家清华系 AI Infra 公司。
2023 年底的奇绩创坛路演日上,袁进辉首次对外透露创立了硅基流动这家公司,并宣布完成 5000 万元天使轮融资,由创新工场、耀途资本、奇绩创坛等机构联合投资,初步构建起模型云服务平台 SiliconCloud 等。
当时袁进辉表示,大模型最大的障碍就是推理和部署成本太高。就像微软 Copilot 虽然拥有 100 多万付费用户,但在最后用户认为上面仍然是亏本,OpenAI 的业务扩展也正受到 GPU 服务能力的限制,所以 Infra 解决大模型推理成本。
袁进辉首先思考的是,硅基流动瞄准海外或出海的 AI 模型和算力公司获得收入,最后上线了如今名为 BizyAir 的在线创作平台,国内则与一些模型公司做合作、拿算力券等,所以海外层面和潞晨科技等 Infra 公司在市场上形成竞争关系。
2025 年初,DeepSeek V3 和 R1 引发全球关注,硅基流动成为最早一批适配模型的厂商,并且通过低价等方式获取用户,实现 infra 层的 APi 调用,引发广泛关注。
但不久之后,硅基流动和潞晨之间就正面交锋了。
2025 年 3 月,潞晨科技创始人尤洋公开发文质疑硅基流动,直指其绑上国产芯片和 DeepSeek API 容易激起国人兴趣的 " 敏感点 ",通过邀请人送代金券的 " 传销方式 " 吸引用户关注,而今又开始限制用户每天的调用量," 而且 API 速度跟蜗牛一样慢,感觉很坑 "。" 真不觉得硅基流动的 API 性能好,因为我不太相信硅基流动工程师的水平高于英伟达和 SGLang/vLLM 的顶尖工程师。"
随后,硅基流动创始人、CEO 袁进辉在朋友圈公开回应称," 无语,我们团队愿意拼搏抓一个机会有什么错? 邀请用户送点免费券有什么错?很多应用都这么做,海外也有;春节那几天,全民都想访问 DeepSeek 而不得时,我们提供了仅有的一个稳定的服务,用户愿意过来有什么错?(因为)来的人太多,网站被挤爆了,付费用户也用不了了,只好辟出一块资源做 Pro 版给付费用户,保障付费用户体验。我们免费版现在体验也改善了,Pro 版一直是业内最稳定的服务之一。"
袁进辉还指出,硅基流动工程师在几年前 OneFlow 时就开源过一批比英伟达官方实现还要快的算子," 还被潞晨科技抄袭,只是为了给对方留个面子没有公开,现在竟然这样诋毁我们。"
据了解,最后是投资人和中间人士调停,尤洋删了文章,这场行业舆论争议就此平息。
最近半年多,硅基流动转向了国内市场,而且发展很快。一方面,硅基流动搭上了智谱、华为、阿里、字节的合作订单,推出企业级私有化部署方案 SiliconBrain,并且盯着模型迭代做更多优化。
目前硅急流动的投资方包括智谱、华为、阿里、字节等机构。
硅基流动曾在 2025 年底透露一组用户数据:获得超 900 万用户,并服务了超 10000 家企业用户,平台日均 Token 生成量超过 1000 亿 tokens。
袁进辉还披露,硅基流动日均出口 Token 约 500 亿,价值约 2 万美元(我不清楚这个价值怎么判定)。
此外,我还了解到,硅基流动营收大概在亿元级规模。
尴尬的中间层,难啃的商业化
如今,对于整个 AI Infra 行业来说,一个问题在于:
所有人都看到了 AI 推理算力和异构算力 infra 需求,但 Infra 技术本身的技术天花板明显,像 Anthropic、OpenAI 这些模型公司都在做 Infra,且企业级 AI MaaS 的收入没想象当中那么高,市场内卷加剧。
如今,无论是阿里、腾讯、百度、字节、智谱等大厂和模型层企业,还是摩尔、沐曦、商汤、壁仞等芯片算力和智算中心设施层,都在做 infra 算力技术和模型适配,独立的 Infra 的商业空间越来越窄。
比如,百度的百舸 · AI 计算平台(AI Heterogeneous Compute,简称 AIHC)是面向大规模深度学习的高性能云原生 AI 计算平台,也就是百度的 Infra 团队,负责智算中心和推理模型的 infra 加速。
百度透露,其万卡单任务有效训练时长可达 98% 以上,大幅提升算力使用效率。
阿里云则是有专门的服务器和基础设施部门,做磐久 AI Infra 服务器工作,硬件、软件、互联和液冷都做了一整套的物理 AI 算力技术方案。
腾讯云则在去年 12 月姚顺雨入职后,终于分拆成立了 AI Infra 部门、AIdata 部门和数据计算平台部门,之前内部还有包括自研 " 水杉 "" 银杉 " 的智能网卡以及 DPU 业务、IaaS 部门做 infra 等。
腾讯云最近透露了一组数据:用了自研的 AI Infra,模型启动提速 17 倍,大规模服务扩容时间从 10 分钟缩短至 34 秒;多模态推理加速 4 倍,自研推理引擎覆盖生文、生图、生视频等模型;通过内存优化与通讯协议升级等创新,显著降低计算开销。
而字节跳动的 AI Infra 能力被业内公认为国内领先水平,散落在 Seed、火山引擎、抖音等大的事业群当中,其 Infra 和基础设施团队规模预计超过千人。
此前字节拆分 AML 相关业务,独立组建 Seed 底层算力研发团队。
目前字节模型研发层的 Seed-Infrastructures 团队,负责大模型的分布式训练、强化学习框架、高性能推理、异构硬件编译器等工作,整体负责字节训练 infra 大团队管理。
而字节豆包大模型推理层面的 Infra 在火山引擎,之前将 IaaS、服务器等多个技术部门合并到了基础设施部门当中,由字节老兵项亮等人负责,为火山引擎和豆包大模型提供 infra 服务。
此外,字节还有 Web Infra、机器学习中台 Infra、抖音的 infra 团队等等,基础设施层的团队人员非常多。
在行业人士看来,目前国内 AI Infra 水平层面:
第一梯队:DeepSeek、Seed、阿里通义、阿里云 PAI
第二梯队:百度(文心、paddle、百舸)、昆仑芯软件 infra 团队、腾讯(混元 infra)、美团、快手、字节(AML+ 火山引擎)、阿里夸克、阿里控股、小红书、华为(盘古、MindSpore、原华为云 infra 团队)、蚂蚁 Asys/Areal 团队、阶跃星辰、月之暗面、MiniMax 等。
因此,对于无问芯穹、硅基流动等独立 AI Infra 创业公司来说,其市场空间越来越窄。
无问芯穹的汪玉就曾在去年一场活动上说过,最近两年 AI 公司在 To B 和 ToG 方向上越来越难赚钱。
因此,很多 AI Infra 公司从开始拿地方的算力券和很多垂直模型和 AI 应用企业合作,后来不断发展后,AI infra 企业的商业化方向有很多 " 分流 "。
其中,无问芯穹开始在智算中心订单中提供服务;硅基流动则是寻找华为等国产 AI 大厂合作;而更多 Infra 公司寻找的是海外市场,或者是中小开发者群体,形成一定的小规模运行。
但随着 DeepSeek V4 发布,模型层已经做好了 Infra 技术,算力公司也跳过 Infra 公司直接和模型公司更密切合作——如摩尔线程和智谱、DeepSeek 和华为昇腾、阶跃和壁仞华为燧原等。
AI Infra 的市场会越来越窄。
壁仞科技创始人张文去年 7 月也表示,毕竟国产 GPU 芯片需要提前 2 年设计,之后才会流片量产,而模型迭代几乎是以周为期。因此,模型层与 GPU 芯片公司应该要越来越密切合作。
总结
最近很多人都问过我:AI Infra 的作用到底是什么?
此前,我可能认为,Infra 可以给数据中心、模型层面做算力加速,做算力云,并且让英伟达、AMD 卡与摩尔、沐曦等 30 多种国产计算卡做异构计算和芯片软件栈平台 " 解耦 ",从而让这些国产芯片提高利用率,能够更大程度发挥关键作用。
但如今,我已经不这么认为了。
推理算力需求增加,CPU 和存储成本变高,国内智算中心建设放缓或基本停滞,底层 AI 芯片公司开始与模型层合作,AI Infra 公司发展空间变得越来越小。
以无问芯穹为例。他们从一家专门做 AI infra 和超算云公司,后来想做 LPU 这类端侧 AI 算力厂商。去年下半年,无问芯穹的故事变成了做 Agent Infra 公司,再到如今做 tokens 工厂的算力公司。
今年中关村论坛上,无问芯穹联合创始人兼 CEO 夏立雪表示,1 月底开始,无问芯穹基本上每两周 Token 量就翻一番,到现在基本上已经翻了十倍。上次见到这个增速,还是 3G 时代看手机流量的时候。
夏立雪表示,面向 Agent 时代,需要打造 Agentic Infra、打造更智能的 Token 工厂。" 在 Made in China 时代,中国凭借制造优势将好的商品输出到了全球。当下,中国可以凭借能源优势,通过高能效的 Token 工厂,将优质的 Token 输出到全球,来实现 AI-Made in China,成为世界的 Token 工厂。"
而袁进辉也开始将硅基流动的 " 故事 " 转型为 tokens 工厂。
袁进辉在今年中关村论坛期间表示:硅基流动是一家全球美食自助餐厅。它支持的模型数量是全网最多的。无论用户想要哪个第三方的大模型,它都能瞬间通过 " 管道 " 把 Token 送过来。它不关心这水是哪个 " 品牌 " 产的,它只关心用户想喝什么,它就能提供什么。
" 硅基流动能在 Token 工厂这条赛道站稳,核心能力就是让 Token 便宜、好用、不挑食,无论用户想用什么模型、无论底层是什么芯片、无论算力来自哪里,硅基流动都能把它们消化掉,统一输出成高质量的 Token。"
怎么评价这些呢。
我只能说,CEO 们想做黄仁勋,希望复刻行业龙头的发展路径,但人家已经是五万亿美元的公司 CEO,你就是个小公司 CEO,二者体量与行业地位差距悬殊。
然而,站在行业观察者视角来看,现在 AI Infra 创业公司要么被大厂收购,要么就赶紧找退出渠道,否则只会陷入‘技术领先但盈利困难’的长期发展困境。
现在 AI 领域创业的很多 CEO,在表面上认为 " 自己技术这么牛、商业化也是行业前茅 "、" 舆论一定要做到领先领先再领先 ",但实际上,他心里非常清楚自身的地位,尤其是初创赛道的龙头公司。
简单来说,就是 CEO" 飘了 "。
我认为无论是稀疏计算技术,还是 AI 推理算力加速、研发算子库和底层设施,或者说有商业渠道,这些只是 Infra 公司活下去的理由之一,但这些并非是真正的 " 护城河 "。
我并不是不看好 AI infra 公司发展,只是觉得 AI infra 公司需要转型、需要找好自身定位,否则将持续面临大厂的全面挤压与降维竞争。
毕竟,ChatGPT 热潮持续了三年,除了三大顶刊的其他科技媒体们,其实都没在 AI 热潮中赚到钱,更不用说创业公司了。
中国的 AI 公司想要商业化赚钱,真的太难太难了。