关于ZAKER 合作
全天候科技 5小时前

对话金山云刘涛:切走智算下半场最厚的蛋糕

作者 | 周智宇

当全球市场在亚马逊与谷歌的财务余震中,反复拷问 AI 投入是否 " 见顶 " 以及自由现金流何时回归,这场军备竞赛正进入冷峻的淘汰赛。

这场竞赛里注定赢家寥寥,唯有在产出比的生死线上建立商业闭环,方能得到投资者青睐。

经历了 "V 型反转 " 的金山云对此感受颇深。从 2024 年 9 月低点时的每股 2 美元,到高点时超 22 美元 / 股,金山云的价值正在被市场重估。

2025 年四季度,金山云交出了一份关键成绩单:营收 27.6 亿元再创历史新高,智算云收入 9.3 亿元再次攀升且占公有云收入比例已达 49%;四季度,金山云再次实现调整后经营利润转正,相较于曾经动辄数亿元的亏损,这标志着公司在经历了长达三年的阵痛转型后,终于在 " 智算时代 " 叩响了盈利的大门。

金山云高级副总裁刘涛,这位在云行业深耕十余年的老将,在近期与华尔街见闻的独家对话中,复盘了这段惊险转型历程。

" 我们经历过从最高峰股价掉下来的极度痛苦。" 刘涛直言。

从 2020 年末峰值时每股近 75 美元,到 2022 年 10 月低点的 1.77 美元,金山云手中持有的现金价值甚至一度高于市值。资本市场给出的结论冷酷且决绝:市场预判他们会快速耗尽资金。

这并非金山云一家的困境,而是整个中国云行业在过去十年集体陷入的 " 规模陷阱 "。在那个时代,估值的驱动力来自流量和营收规模,厂商们在 CDN(内容分发网络)等基础设施红海里刺刀见红。金山云也曾一度陷入 " 投得越多,亏得越多 " 的恶性循环。

" 这种逻辑曾是行业挥之不去的阴影。" 刘涛直言,但公司的本质是要给股东挣钱,这种旧的发展模式也在 2022 年走向终点。

刘涛透露,他在 2022 年初接手公有云团队时的使命极其纯粹:不做亏钱生意。

他上任第一年,便清退了所有毛利为负的客户,这导致公有云业务营收和毛利都出现较大波动。但到了 2025 年,金山云公有云业务已实现节节攀升。

金山云的变革故事中,最关键的一章是关于 " 信仰 " 的博弈。面对 ChatGPT 引发的算力海啸,2023 年 4 月,刘涛与管理层面临一个足以决定公司生死的决策:是否要在现金流极其紧张的情况下,投入数亿元组建大规模智算集群?

" 这是一个可能把公司拖入绝境的决定," 刘涛回忆道,因为一旦交付失败,巨额折旧是当时公司也难以承受的。但 CEO 邹涛的一句话定下了基调:" 要对 AI 有信仰,这就像蒸汽机时代来临。" 最终,金山云在完全没有前人经验的领域,硬生生啃下了大规模集群组网这块工程硬骨头。

从现在来看,金山云管理层做了一个正确的决定。

眼下,中美科技巨头们仍在持续为算力开出巨额支票,但苛刻的投资者们却也开始用 ROI 来衡量每一笔支出的效果。

这也意味着,在算力军备赛持续的同时,智算云正逐步转向以 " 运营效率 " 为核心的下半场。

在金山云的视角里,智算云不再是简单的资源买卖,而是一场极限工程挑战。大规模智算集群极度脆弱,光模块故障率高达 2 ‰,机器故障率达 1%-2%,对于大规模集群而言,任何单点波动都可能引发连锁反应,导致整体训练任务中断。

为了应对这种损耗,金山云通过一系列硬核工程手段重塑了稳定性。

金山云构建了故障感知驱动的自愈系统,依托容器化调度和热备切换机制,将训练任务恢复时长压缩至 20 分钟以内,保障集群实际运行 SLA 稳定在 99.9% 以上;通过 PD 分离(预填充和解码分离)与 KV Cache 复用技术,在办公场景服务中实现了优于原厂方案的响应延时稳定性,有效提升推理侧的利润空间;将资源管理模式升级为 " 任务交付 " 导向,解决了智算时代训练任务易中断的痛点,显著提升了底层硬件的有效利用率。

展望 2026 年,刘涛认为真正的分水岭在于 " 应用 "。相比于前途未卜的通用大模型混战,机器人与自动驾驶提供了更清晰的场景 ROI。视频生成的实用化、VLA 模型在机器人端的泛化,将让推理需求呈现指数级增长。

刘涛敏锐地察觉到,机器人公司大多擅长身体指令,但在云端工程、安全防护和数据闭环上几乎是赤手空拳。

金山云的策略是成为这个万亿赛道底层的 " 循环系统 ":为头部公司提供从数据生产、存储到模型训练、仿真的全生命周期闭环;针对机器人可能被黑客控制的极端风险,构建端到端的安全防御,防止 AI" 大脑 " 被恶意劫持;通过极致的推理优化,让机器人端的响应像生物直觉一样快速准确。

" 抢占了机器人场景的高地,就意味着拿到了重塑物理世界智能规则的终极船票。" 刘涛预判,未来三到五年,机器人将从简单的捡袜子、捡毛巾的动作起步,逐步渗透进千家万户,而金山云要做的,是从这些企业出生开始,就成为它们原生依赖的云底座。

" 不做大模型 " 是金山云在智算大潮中保持冷静的战略底线。

正因为不参与模型端的竞争,金山云得以在生态上保持极度的开放与纯粹。无论是 " 模型新贵 ",还是生态内的大模型,都稳健地生长在金山云的智算底座之上。

刘涛认为,随着推理侧需求的指数级爆发,Token 将成为类似水电的普惠资源,而云厂商的胜负手在于谁能以最低的工程代价输出最稳定的服务。

智算云的红利期不会永远持续,只有那些能解决极限工程难题、打通行业数据闭环的厂商,才能在潮水退去后依然立于潮头。

从股价 1.7 美元的谷底,到今天智算业务占比超过三分之一并带动全公司走向盈亏平衡,金山云的 "V 型反转 " 并非偶然。它本质上是一家成熟企业在深刻理解产业纵深后,对运营效率与商业本色的坚决回归。

这场关乎生产力主导权的竞赛,才刚刚进入最残酷、也最精彩的深水区。

刘涛和金山云正试图证明:一家云服务商如果足够尊重财务规律、愿意深耕工程细节,同时对技术趋势保持判断力,就有机会在 AI 浪潮中,完成从资源集成到价值共生的转变。

如何走出谷底

华尔街见闻:你在金山云十年了,云厂商也经历了从移动互联网到 PC 再到 AI 时代的演进。对你个人来说印象最深、或者最煎熬的一段时间是什么情况?

刘涛:最难忘也最痛苦的,其实就是 "V 字反转 " 的过程。2020 年金山云上市,股价最高冲到 75 美元,估值一度达到 170 多亿美金。雷总(雷军)当时非常高兴,大家也觉得公司前途无量。

到了 2021、2022 年,资本市场不再以 PS(市销率)来看待云公司,而是看 PE(市盈率)和损益情况。我们的股价从 75 美金跌到了 1.7 美金。当时资本市场的评价非常刺耳,甚至出现 " 团队能力不足 "、" 现金价值高于市值 "、" 或将快速耗尽资金 " 等负面评价。

当时 CDN 业务处于负毛利状态,相当于公司为了维持规模,实际是在贴钱做业务。这种极度不健康的经营模式,让我们不得不痛定思痛,启动全面转型。

华尔街见闻:过去两年里,有没有哪个时刻或会议,让你觉得 AI 确实正在重构整个公司的逻辑?

刘涛:2021 年,一家大模型初创客户对高性能算力的需求,比一些头部客户还要多。这让我们意识到,大模型公司对算力的需求,是截然不同的量级。后来,客户提出搭建大规模集群的需求,涉及金额巨大,对公司现金流构成了严峻考验。

我本身是技术出身,做事是很理性的。我问邹总(邹涛):" 干这个事儿 , 搞不好会把公司拖垮,咱干还是不干?"

邹涛当时的决定是:" 熬夜干!" 邹涛说:" 你们要对 AI 有信仰,这是蒸汽机时代来了,未来的空间是无法想象的 "。事实也证明了这个判断的前瞻性。

华尔街见闻:一线团队最直接的感受和心态变化是什么?大家讨论最聚焦的点在哪里?

刘涛:销售和技术团队的心态已经从 " 跟随 " 转向了 " 领先 " 的自信。

销售团队越打越有劲头,因为这种客户标杆效应是不断叠加的。要知道,在通算时代,我们和友商差距明显,一直处于被动跟随状态。

可进入 AI 时代,市场需求聚焦在智算网和存储领域,这正好是我们深耕且具备优势的赛道。

该抛弃对云的偏见了

华尔街见闻:投资人觉得云业务不是好生意,这种观点是否过时了?

刘涛:我认为这种观点存在误区,特别是在中国市场。

相比其他 To B 业务,云是极少数具备高可持续性的赛道。中国客户虽不习惯为纯软件付费,但愿意为硬件能力与技术服务买单。云的核心价值是用技术服务最大化释放硬件能力。

当前客户普遍强调成本控制,企业已不愿意承担自建基建团队的高昂成本。比如客户将设备托管在我们这里,我们只收一定比例的服务费,成本远低于企业自建运维。

当然,如果陷入无穷无尽的定制化项目,云业务确实难成好生意。但聚焦标准化、可规模化的运营型项目,云就是极具价值的优质赛道。

华尔街见闻:相比规模较大的友商,金山云最大的特色和竞争策略是什么?

刘涛:我们走的是 " 田忌赛马 " 的竞争策略。

作为规模较小的公司,我们不拼体量、不搞同质化竞争,而是以 " 性价比 " 和 " 贴身服务 " 打造差异化优势,提供更具竞争力的价格和更好的服务。就拿机器人赛道来说,面对客户需求,我会陪着 SA、售后一起上门对接,全程跟进。客户只要提出合理需求,我们就会全力以赴地解决。

这个赛道的客户,工程能力普遍偏弱,而强大的工程交付能力正是我们的长板,刚好能精准匹配他们的痛点。

这种 " 贴身肉搏 " 的深度服务,让我们在机器人赛道赢得了许多头部客户的认可和信赖,这一点连规模更大的友商都非常羡慕。

挖掘细分机遇

华尔街见闻:在选择客户时,都有哪些考虑?

刘涛:我们的选择逻辑非常清晰:聚焦能带来增量的赛道和客户。

传统云客户的预算逐年缩减,能持平就算不错。

智算领域的增长主要来自大模型,但仅靠这一个赛道还不够。因此,我们重点锁定了自动驾驶、机器人、AI for Science(科学智能)。

其中,自动驾驶是成熟赛道,我们的核心打法就是保持耐心,守机会。

机器人则是全新赛道。这里的公司多为科学家创业,擅长算法但缺少工程落地概念,这正是我们的机会。

科学智能领域,比如生物医药相关企业,这类公司本身发展很成熟,与他们合作,核心是比拼性价比,用更具优势的方案赢得认可。

华尔街见闻:自动驾驶和机器人客户在算力调度和工程落地中,你们解决了哪些具体的痛点?

刘涛:核心是解决算力调度与工程落地中的稳定性和数据闭环。

对于万卡集群而言,硬件故障难以避免。我们通过搭建故障感知机制、部署热备机技术,实现了节点故障后的快速自愈。一旦出现节点故障,20 分钟内就能自动恢复训练任务,确保集群实际运行 SLA 稳定在 99.9% 以上。

针对办公场景,我们与集团共研了 PD 分离(预填充和解码分离)技术,显著降低了首字延迟(TTFT)。

同时,通过优化 KV Cache 的命中率和预充能力,即便在高并发场景下,也能保证推理稳定丝滑。

华尔街见闻:自动驾驶也在从 VLA 转向到大世界模型,数据吞吐压力非常大,这块是否有技术压力?

刘涛:压力确实非常大,核心痛点集中在数据的存储、处理与流转全流程。

自动驾驶领域的数据采集门槛低、增量惊人,轻松就能达到 EB 级。

为此,我们与客户深度协同打磨出了一套全流程数据闭环平台,涵盖数据脱敏、视频与点云融合处理、3D 高斯建模等核心功能。

此外,车端算力受限于功耗瓶颈,未来可能会出现 " 端侧负责实时决策,云端运行宏观世界模型 " 的架构,这会带来巨大的云端推理需求。

华尔街见闻:机器人赛道的数据维度更多元,处理压力更大,我们在这个过程中能做好的核心服务是什么?

刘涛:我们的目标是 " 辅助客户聚焦核心算法,其余所有工程化、数据化相关的繁琐工作,全部交给我们 "。

在数据采集与处理闭环上,我们提供从本地数据同步、云端标注、数据清洗到最终模型训练的全流程一体化平台。

虽然我们不直接开展数据标注业务,但我们会做好桥梁,整合并集成一系列高质量的数据定制和标注供应商。

这种 " 技术基座 + 生态整合 " 的模式,让我们能够像 AWS 一样实现上层服务的轻资产运营,同时牢牢锁定底层算力服务的粘性。

接下来几场硬仗

华尔街见闻:展望 2026 全年," 核心战役 " 是什么?

刘涛:核心聚焦于 " 大客户、深赛道、Token 化 " 三大方向。

我们有三场关键战役:一是筑牢技术根基,确保在新一代硬件迭代背景下,大集群的可靠性和稳定性保持业界领先水平;二是深化赛道渗透,在机器人等垂直赛道持续强化全流程闭环服务能力,不仅满足现有客户需求,更主动挖掘并解决如系统安全漏洞等潜在痛点;三是激活增长新动能,深度运营 Token 业务。

华尔街见闻:除了 Token 业务,你还觉得哪些赛道有爆发潜力?

刘涛:我有两个比较看好的前瞻方向。

AI 原生游戏,比如 " 指挥官模式 ",玩家只指挥,剩下的 AI 队友听你的;或者具备情绪价值的 AI 陪玩。

代码生成 SaaS 是最确定的增量。企业因为隐私要求,不会用公版大模型,我们需要提供企业级的私有化代码生成服务,我们内部也已经在深度使用了。

华尔街见闻:小米金山生态在金山云收入占比持续提升,如何看待 " 独立第三方 " 的标签?

刘涛:生态是我们的优势之一,但不是我们的全部竞争力。

虽然小米金山生态的智算投入持续提升,但外部客户的订单增速更快,目前生态外客户的业务占比依然保持稳健。

从行业格局来看,云行业内 Top 3 到 Top 5 的企业都能实现良性发展,我们的核心优势在于,立足智算这一独特赛道,且已抢占先发先机,有望实现更快发展。

华尔街见闻:接下来金山云营收和利润的增长点在哪?

刘涛:这是一个分层贡献的结构。

一方面,通过为最优质的客户提供大集群供给,拉动营收和总利润额的绝对值增长,该板块虽然毛利率偏低,但业务根基稳健;另一方面,机器人赛道业务、中型客户以及 AI Agent 应用相关业务,是高利润率板块。此外,Token 业务是未来的爆发点,目前其绝对规模虽然尚小,但增长速度迅猛,有望成为增长引擎。

2026 年,我们将继续朝着 " 经营利润转正 " 的目标前进。

最新评论

没有更多评论了
全天候科技

全天候科技

提供专业快速完整的科技商业资讯

订阅

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容