关于ZAKER 合作
雷锋网 1小时前

GPU 贸易警示录:从暴利到薄利,智算赛道门槛浮出水面

作者 | 赵之齐

编辑 | 胡敏

林宇至今仍记得,2023 年算力市场的那场疯狂:

即便是半夜两三点,微信也还在不断弹出客户对接需求的新消息。那时人们怕的不是贵,而是缺货,大家顾不上纠结价格高低、也来不及担心合作有坑,一天之内签单打款的情况,时有发生。

那是属于 GPU 的黄金时代:一台机器的利润动辄五六万,极端情况甚至能到上百万,每个科技群都在追问算力货源,人人都想分一杯羹。

刘庆就是在那股热潮的吸引下,一头扎进这个领域。此前他在二线云大厂工作了 4 年,带过 15 个销售,做出年业绩近 3 个亿的亮眼成绩,但业绩蹭蹭上涨的同时,薪水却没有多大改观。

不甘于此的他,转身投向 GPU 贸易,起初靠 " 倒卖 " 算力卡和整机赚差价,后来开始搭建算力池。

但黄金时期就像一场短梦。如今,成单周期逐渐拉长,GPU 贸易商正在经历残酷洗牌,活跃在算力群里的 " 有 GPU 资源 " 头像一个个消失。今年年初入行的销售陈立,直到九月才开出第一单,且仅仅是配件。(算力厂商真实生存情况到底如何?欢迎添加作者微信 Ericazhao23 交流。)

" 今年做 GPU 贸易生意的,恐怕 90% 都会死掉 ",刘庆感慨。

当热潮退去,门槛才显形。这几年涌入智算赛道的人,谁是真玩家?谁是跟风者?又是谁能活下来?

入局者众,各有神通

许多跨界做智算的人,手里大多攥着至少一张 " 入场券 ":要么是能打通资源的关系网,要么是能重投入的真金白银。

入场条件一:强绑定的关系网

在算力行业," 有货 " 是第一要义,谁有拿到核心货源的好渠道,谁就抢占了先机。

深圳一家算力公司老板,曾在通信行业深耕多年,积累了原厂资源。转行做智算后,他平日里至少四分之三的时间待在海外,一边跑通供应链渠道,一边维护原厂关系。靠着这份投入,公司成立才一年多,就已进入了英伟达的白名单,甚至能订到最新的 GB300 期货。

类似的故事并不少见:有上市公司成为大厂 B200 集群的重要交付方,背后离不开老板与英伟达的深厚关系;有些算力创业公司则是脱胎于大厂,背后依托英伟达关系网,以独立主体身份来承接原东家的订单。(类似算力厂商具体情况如何?欢迎添加作者微信 Ericazhao23 了解。)

如果说渠道关系决定 " 有没有货 ",那客户关系就决定 " 货能不能卖出去 "。

智算大单的完成,通常不是在销售的会议室里,而是在老板们的饭桌上,伴随某些权益置换。

算力从业者周毅所在的公司,凭借其老板早年在科技、媒体等领域积累的丰厚人脉,2022 年入局算力时,就拿下了 " 大模型四小龙 " 客户,还通过投资加深绑定。即便后来团队独立创业,这些客户仍是稳定的大单来源。

而普通销售的关系突破口则在 " 大倒爷 " 身上——他们同时对接多个主体,有源源不断的需求订单。曾有与 " 大倒爷 " 打好关系的销售,在两个月能卖出 80 台 H100,一个季度的工资加提成近乎上百万。

相比下来,那些没资源、没人脉的算力销售,常常会发出这样的困惑:" 现在市面上到底是谁有需求啊?"

入场条件二:雄厚资金底气

资金,也能直接砸出算力的入场路径。

一些传统领域的公司瞄准智算赛道的热度,选择用资金 " 抄近路 ":收购现成的算力厂商,或斥资建设算力中心,以此快速贴上 "AI" 标签。

比起低调拿单,他们更热衷于在平台 " 流出 " 订单消息,以撬动二级市场股价。

但高投入意味着高风险。2023 年前后,陈立的朋友也拉他一起卖算力,出于谨慎,他做了个模型,按照 A100、H100、A800 降价 20%,以及 4090 降价 30% 的幅度计算,账面上勉强能盈利。

但实际情况是,这两年服务器价格的跌幅是他当时预估的两三倍。在服务器价格最高点买入的人,很长时间都难以解套。

关系 + 资金 = 大厂客户?

当 " 关系网 " 与 " 资金 " 条件共同叠加,才有机会触达智算市场的核心:大厂订单。

大厂订单极具隐蔽性,需求大多会依赖自己内部供应链体系,供应商公司 " 几天就会换一个名字 " ——即便知道了他们是谁,可能一个月后公司就消失了。

而大厂筛选外部供应商也格外严苛,通常倾向选择大企业或上市公司,并要求采购货源路径证明和资金证明。确定合作后,他们会通过壳公司签约,对接人多为 P6、P7 的级别,中间层层主体阻隔,以确保大厂的信息安全——但硬币的另一面就是,这会让签约厂商的合作 " 安全感 " 大打折扣。

不过,与大厂合作就像与白鲸共舞:小公司可能借此一跃而起,也可能连人带船被其庞大身躯掀翻。

行业人士观察到,有大厂签单初期常常广撒网,四处签 " 框架协议 ",让大家拿着协议去攒局;还有大厂做算力出海前,会在国内广纳集成商,再根据具体方案选人。他们的需求往往会拆分成多个单,有大厂去年的 H100 就分为 5-10 个单,每个订单一两千台,抢订单者众,厂商 " 陪跑 " 是常态。(更多大厂算力订单现状,欢迎添加作者微信 Ericazhao23 互通有无。)

即便签下订单,与大厂的合作也并非就 " 一劳永逸 ",他们对保密性和交付质量的要求极高。过去,泄露订单信息导致大厂退单、或机器送到机房后发现组不成集群导致合作破裂的情况,并不少见。如果交付不如预期,大厂还会毫不犹豫地发警示函,甚至起诉。

今年以来,阿里等大厂已经开始清退不达标的供应商,宁愿罚则赔钱,也要保证接下来的供应圈子 " 小而精 "。

这条曾被视为 " 低门槛高盈利 " 的 GPU 销售赛道,在两三年内涌入大量参与者,人满为患。算力价格战苗头已现的当下,从业者正面对怎样的生存挑战?

转型之路,荆棘丛生

入场智算容易,活下去却很难。

设备门道深,外行易翻车

" 去年行业里,90% 的人可能连机器长啥样都没见过 ",澜启智算的业务负责人郑万利发现,很多所谓渠道方,只要听到 " 见个面 " 或 " 去仓库看货 " 等请求,就会人间蒸发。

前几年便转型做智算的林宇,曾碰到过一个堪称离谱的设备 " 坑 ":当时有企业手里压着一套 256 台 H200 的算力集群,为了尽快盘活资产,已经把租金压到极低,可即便如此,也租不出去。

他们百思不得其解——直到林宇看到设备详细配置,原来,团队选型时完全没考虑组网结构和成本因素,导致设备变成了 " 四不像 ":例如,主流 CPU 配置是 8558,但这套集群配的是性能更低的 8358;内存规格也大幅缩水,从 192GB 降到 64GB。

这样的 " 非主流 " 配置难以满足大集群客户的需求,但若改配,一台机器的两颗 CPU 就可能需要十几万;且服务器更新换代飞快,一旦压货,风险更高。没搞懂基础设备信息,就相当于在智算行业 " 裸奔 "

从房地产转行 SaaS、再跨界到智算的郑万利,对此也深有体会,于是,他下决心恶补设备知识。

事实上,比起大多数转行的人,他已是幸运:所在公司背后有持卡超三万张的集团撑腰,不必从零开始积攒算力资源。但即便如此,起初的学习曲线依然陡峭——

前三个月里,郑万利每天对着电脑或手机屏幕,艰难地啃下设备型号、性能参数、组网结构、投资回报测算等知识。可英文底子薄的他,面对英伟达官网、AI 领域论文等英文材料,时不时就要打开翻译,十几分钟可能才读下来几行," 脑袋都要爆炸了 "。

第一次和老板去复旦大学拜访 MOSS 模型的研发负责人时,整整一小时的交流里,他插话不超过三句," 因为完全不懂 "。

终于把理论啃下来后,真正到了实践环节,新的困难又来了。

客户穿不透,高层壁垒难破

刚转型时,郑万利在智算领域毫无资源,只能疯狂跑客户:出差十几天,每天见三四个客户,累到晚上吃不下饭,是常态。

可智算项目金额动辄百万,往往需要更高层、甚至一把手决策。缺少高层资源铺路,跑客户的努力可能白费。

" 我是个很骄傲的人,业务能力很强,但我从没试过几个月没开单 ",郑万利反复用 " 痛苦 " 一词,形容初转型做智算的那半年。事实上,入职半年左右才开单,对跨界销售而言并不罕见。

同样在智算业务里碰壁的还有林宇。他之前和大公司谈合作时遇过一个项目,要开三个会进行决策,理论上一周内就能完成,可偏偏每个环节都要上报领导审核,一层等一层,硬生生拖了三个星期。

" 等他们走完流程、上报到一二把手后,我手头的货都没了。"

更棘手的是业内人口中的 " 刺激消纳 " 陷阱:有公司会承诺高额的总消纳量,但实际却层层转手到上市公司、算力公司、AI 公司,链条拉得很长,最后真出问题," 官司都不知道找谁打 "。

终端难以穿透,有时几个销售跟进各自的倒货方许久,最后才发现他们的终端是同一个客户——到手的鸭子飞了,前期投入的时间和精力全部白费。

吃过亏的从业者,现在谈合作前都会多一道心眼:反复确认最终的用户方。

大厂压价、小厂白蹭,盈利仍难

计划打成本差价的张彬,去年在东南亚捕捉到一个看似可行的机会:

当时他了解到,从东南亚原厂采购 H100,单台成本约 233 万元,对比国内市场价大概 235 万元,一台有 2 万元左右的利润空间。看准时机,他果断入手囤了一批货。

可现实很快给了他一记重击:囤货后,大厂方却只愿意以 231 万元的单价收购。

卖了就会亏,但若是不卖,重新寻找需求量大、且交货信用有保障的客户,又不知要猴年马月。反复挣扎后,他只能硬着头皮接下订单。

更离谱的是,还有大厂会让厂商承诺十年、二十年的长期优惠,优惠年限远超项目负责人的任期,后续承诺根本难以保证。

而有些小公司则会打 " 免费测试 " 的算盘——小模型训练耗时不长,有时东蹭一点、西蹭一点,借着测试的名义,就完成了一个小模型的训练。无奈之下,有的厂商只能把收费门槛前移,在测试环节便开始收费。

就算一切谈妥,服务器市场价格波动一旦超过 20%,便可能触发违约风险。张彬曾和某云厂子公司签了五年兜底合同,报价已经压到成本价,甚至贴了电费,结果机器准备好,眼看离交付只剩四天时,客户跑了。

不过,行业的迷雾,不只弥漫于厂商侧。

很多客户只是想要设备,对自己的核心需求,例如网络、平台软件、存储配置的匹配要求,都不甚了解——要知道,在训练任务中,任一环节存在短板,就可能卡死整个效能。

更有甚者,认为 " 买算力 = 买机器 "。在他们眼中,组网、光模块、交换机、存储、业务管理网搭建等复杂配套,全是算力方该默默扛下的 " 隐形劳动 "。

林宇初入智算行业时也战战兢兢,总怕客户会识破自己是新手,然而,独自跑了几趟客户后,他有些哭笑不得:" 客户其实没比我懂多少,这个行业里特别专业的人,没那么多"。

淘汰赛生存法则

两年前,算力利润还高到令人咂舌,林宇拿下 " 一天签单 " 的记录后,一度有些难以置信:" 算力生意这么好做吗?"

但热潮很快退去。随着越来越多玩家涌入,客户变得精明,成单逐渐回归 ToB 常态周期的同时," 终止算力合同 "" 放弃算力收购 " 的新闻频频曝出。例如,服装企业安奈儿放弃收购算力服务商深圳创新科;味精企业莲花控股叫停新华三 318 台 GPU 服务器的交付,寄予厚望的算力第二增长曲线已经放缓。

竞争愈发激烈,林宇明显感觉订单难拿了。他心里渐渐犯起嘀咕:自己手里是囤了机器,但真要论核心竞争力,好像没什么拿得出手的优势,再这样下去,算力怕是要砸在自己手中,变成让人头疼的烫手山芋。

如何突围,成了跨界者的共同难题。(更多算力厂商破局妙计,欢迎添加作者微信 Ericazhao23 探讨。)

郑万利的能力短板,是在和云厂商谈合作时暴露的。" 一开始大厂给出来的技术参数要求,我连看都看不懂 ",后来,他渐渐意识到,大厂真正在意的远不止设备本身:配套设施是否完善、电力与网络保障是否稳定、运维响应速度有多快、应急处理能力是否达标……这些和后续服务质量绑定的细节,才是决定合作能否落地的重要因素。

为了啃下大厂订单,他和团队开始强化运维和运营能力的建设。也是在这过程中,他发现算力行业和商业地产有着惊人的相似之处:

住宅是 ToC 生意,基本 " 建好就能卖 ",但商业地产需要品牌组合、业态规划和强大的运营能力做支撑。如果用建住宅的逻辑去做商业地产,就很可能导致项目烂尾。

算力行业也是如此:起初,大家以为只要把设备买回来、组网,就能出租赚钱;可真正接触业务后才发现,大客户更看重运营运维能力。郑万利也深有感触:" 如果客户只在乎那点价格,就说明不是优质客户,因为他们的业务朝不保夕。"

但多位业内人士都向雷峰网坦言," 运营运维 " 恰恰是最难的部分:运维涵盖 IDC、硬件、网络、云端软件与安全层,运营则更关注产品与资源的整体管理,这些都需要至少三年以上经验的团队来支撑。这也是为什么,很多公司兴冲冲自建了机房,最后却跑不起来。

除了打磨运营能力,大家摸索出的第二项生意经,是学会押注潜力客户

林宇转型做智算后,比跑通算时多了个动作:深度对接各类 AI 孵化器。

在他看来,AI 时代里下一匹黑马会从何诞生,难以预料。他希望尽快识别出有潜力的客户,甚至还会用 VC 视角,对评估后业务价值高的初创,给予算力上的合作优惠。毕竟,押中有潜力的小公司,就相当于给未来的自己养超级客户

而在国内价格战厮杀下," 算力出海 " 也成了不少厂商眼里的新出路

" 很多头部 IDC 厂商的人现在都出海创业,因为这行门槛不高,有渠道、有钱基本就能起步 ",有算力业内人士说道。

外部条件上,东南亚、中东等地几年前算力基建发展还较弱,张彬所在的公司,就计划在海外建设数据中心,大家统计发现:两年前东南亚算力规模总体加起来还不到 100 兆瓦,而中东超过十兆瓦的数据中心不超过三个。

这样算下来,目前在中东建数据中心的利润率可以接近 20%;甚至,他在东南亚的朋友,根据泰国的气候优化主板和存储后,在当地 H200 机房月入曾达五万美元。

而国内厂商的 " 高性价比 " 与 " 极致服务态度 ",也是在海外的有力招牌。据了解,国人出海创业的其中一个趋势,便是把数据中心集装箱化、预制化,运到当地后,在一两个月内搭建完成,大大缩短项目周期。

但风险也同样存在。" 先建设、后销售 " 的模式,依然会让数据中心面临消纳的不确定性,据了解,有些扬言已出海的 IDC 厂商,只是在当地建设了个空机房、迟迟不敢安置设备。保险起见,目前许多算力厂商还是绑定大厂客户出海。

这也并非易事。一方面,要打通产业园开发商、政府人士等相关人脉资源;另一方面,与大厂谈海外项目时,也要与当地的机房租赁运营商同台竞争;而为了满足部分海外地区(如日本)的合规要求,厂商还可能需要在当地临时成立 " 快闪公司 "。

相比之下,张彬的团队显得从容:他们早就在中东提前准备好土建、水电资源,还获得了当地离岸数据传输的审批资质,帮助客户把数据传输回国;加上美国今年决定落地 " 中东版星际之门 " 以及当地 " 大模型追赶 " 的热潮,他们对未来中东市场的发展充满信心。

结语

事实上,做算力生意的信心,也大体来源于此——提前储备资源,加上长久耕耘的耐心。毕竟,重资产赛道没有奇迹,只有 " 提前量 "。

多位从业者都观察到,那些缺乏核心能力、只想赚快钱的玩家已逐渐被算力市场边缘化,如今能站稳脚跟的,大多是踏实肯干的人。而面对利润已渐趋常规的服务器市场,业内人士对当前准备入局的人提出的建议是:尽量入局最前沿高端的服务器,才能保证之后更高的残值。

往后,在具身智能和推理算力完全爆发的前夜,谁能先迭代基础设施、提升技术能力,以接住未来这波 " 流量 ",将是下一波竞争的决胜关键。

今年 3 月,郑万利去上海拜访一位斯坦福大学计算机专业、专攻人工智能方向的博士。那天他和对方交谈四十分钟,发现彼此在业务方向判断和认知上达成共识,还 " 做成了一点小生意 "。那一刻,他感觉自己终于可以算是 " 业内人 " 了。

尽管如此,回到酒店后,他还是雷打不动地打开电脑,了解芯片、服务器相关的最新资讯。这个行业的设备、价格、需求千变万化,想长久地扎根在这个行业里,任何静态的预测都无意义——

" 要跟着行业往前走才能知道,我们只能等待答案出现。"

作者持续关注算力、AI 等相关领域,更多信息可添加作者微信 Ericazhao23 交流。

注,文中刘庆、林宇、张彬、周毅、陈立都是化名。

雷峰网雷峰网

雷峰网

雷峰网

读懂智能&未来

订阅

觉得文章不错,微信扫描分享好友

扫码分享