关于ZAKER 合作
钛媒体 16小时前

黄仁勋能否玩转“ Agent 经济学”?

黄仁勋,图片来源:Getty Images

没有什么能当下新旧交替的景象,更适合论证黄仁勋的 Agentic AI" 拐点论 " 了:OpenClaw 横空出世掀起智能体创业热潮Anthropic 的 Agent 让软件股接连遭遇重击

这必然已经引起黄仁勋本人的关注。在 2 月 26 日财报发布后的电话会议上,他提到,

"Anthropic 的 Claude Cowork 代理平台具有革命性,为企业采用 AI 打开了闸门。Claude Cowork 和 OpenClaw 出现后,计算需求正飞跃式增长。Agentic AI 的 ChatGPT 时刻已经到来。"

作为 AI 需求最坚定的多头、"AI 泡沫论 " 最大的反对者,他也将这股浪潮视为 "AI 不存在泡沫,激增的资本支出合理且将持续 " 的论据。

就在去年差不多同一时间,2025 年 3 月的 GTC 大会上,黄仁勋首次提出了他经典的 " 人工智能演进四段论 ",他将 Agentic AI 形容为 " 具有自主性 "" 能够感知并理解自身所处情境 "" 除了通过逻辑推理来确定如何回答或解决一个问题外,还能制定行动方案、规划任务、调用工具并采取行动 " 的人工智能。

在他看来,过去 2 到 3 个月间,Agentic AI(代理 AI)已经迎来了实际转折,而英伟达提前 6 个月就捕捉到了信号。

截图来自英伟达 2025GTC 大会视频

从 "Token 经济学 " 到 "Agent 经济学 "

英伟达 2025 年第四季度收入同比增长 73% 达到 681 亿美元,财年同比增长 65% 至 2159 亿美元的表现,已经证实 AI 需求仍然足够旺盛。

英伟达业绩破纪录、超预期已是常态,去年 11 月其发布的 Q3 业绩同样亮眼,但市场却质疑 "AI 泡沫 " 因此加剧,并以股价下跌回应。此次 " 炸裂 " 财报公布后,英伟达盘后股价先涨后跌,远不如业绩表现得好。

不过,作者发现,另一项指标——毛利率的变化,比较适合作为评估英伟达状况的的切口,也与黄仁勋对 "Agentic AI 拐点 " 的判断息息相关。

从全年来看,英伟达的毛利率是核心指标中唯一 " 退步 " 的,从去年的 75% 降到了今年的 71.1%。

原因是,除了美国此前限制对华出口 H20 导致的库存减值外,主要是公司将主力产品从 Hopper 迭代到 Blackwell 后,在商业模式上也由 " 卖主板 " 向价值链更上层的 " 卖机架 " 进军,但制造和系统集成的成本也因此大增,产品定价的涨幅却未保持同频,毛利率因此走低。

但值得注意的是,公司 Q4 毛利率已再度回到 75% 的水平,为全年最高,同比亦有所提升。公司还预期能在新财年将毛利率继续维持在 75% 左右的水平。这意味着,英伟达已在 Blackwell 定价权上再次掌握了主动。

就在今年 1 月,黄仁勋还在达沃斯世界经济论坛上提到,公司 GPU 供不应求,现货价格持续上涨

英伟达近三年季度毛利率走势(采用 GAAP 标准),作者根据英伟达财报数据制表

其背后原因,很大程度上如黄仁勋在财报电话会上所言,源于行业愈发意识到 " 在 Agent 时代,算力和推理就是收入 ",这引发了与 "AI 泡沫担忧 " 背道而驰的 " 抢购潮 " 和 " 资本开支潮 ",因此,推理性能大幅提升的 Blackwell 系列产品大受欢迎。

黄仁勋在电话会上不下四次专门论述了这一话题,体现出极大热情。

综合他的最新观点来看,几乎可以总结出一套由 "Token 经济学 "(Tokenomics)升级而成的 "Agent 经济学 "。

其主旨是,Agentic AI 想要实现及时反应、自主运行,就需要更大规模的算力和更快速度的推理,这将导致 token 数量指数级增长。

随着企业 " 智能体 " 经济效益、实用价值的凸显,相关需求已被释放,拐点之后的新世界中,每一个 token 都将被 " 美元化 ",直接转化为收入。

所以,算力等于收入,每一个云厂商、模型厂商、软件厂商都需要投资算力。与此同时,推理性能(即单位电力下每个 token 的转化效率)则决定了利润,而芯片架构则决定着 token 的转化率。换言之,每瓦性能最佳的架构将会胜出。

当然,黄仁勋眼中的胜出者始终是英伟达。

不过,美银证券分析师维维克 · 艾利亚(Vivek Arya)提出,云计算巨头资本支出已达到 7000 亿美元的前所未有的高点,后续恐怕难以为继,同时现金流可能承压,多米诺骨牌或将轰然倒塌。

黄仁勋直接 " 反击 ",称对此毫不担心,因为 Agentic AI 已展示出其实用性,生成 token 变得有利可图," 事情很简单,计算的范式已经改变,今后,算力增长就意味着收入增长 "。

此前,黄仁勋还曾作出过 "2030 年数据中心资本支出可能达到 3 万亿至 4 万亿美元 " 的判断。此次电话会结束时,他再次强调这一预估并不激进,因为未来每个软件都将依赖 AI,而每家公司都将生产 token。如此看来,目前的资本支出还只能算是前奏。

Agent 时代,英伟达的护城河还能守多久?

通过这套 "Agent 经济学 ",也能够更好地理解英伟达近年来的一系列技术、产品迭代方向和投资决策。

目前来看,英伟达在芯片(硬件)、网络(连接)和软件层面都根据 Agentic AI 的特点进行了针对性布局。

在硬件端," 智能体 " 需要长期稳定运行,且快速及时动作,并能胜任复杂任务,这对内存容量和带宽的要求都更高。

正如前文所述,英伟达早已不再只满足于 " 造主板 ",而是在 Blackwell 系列迭代时选择了更加复杂的 " 造机架 " 模式,这为在整体上构建更强性能、更低延迟、更优效率的服务器,跨过 " 智能体 " 门槛提供了可能。

2025 年下半年,英伟达已正式向市场推出了针对 Agent、推理乃至 Physic AI 进行专门优化的 Blackwell Ultra 平台,官方称其能够高效支持 " 智能体 " 所需的低延迟、长上下文窗口和多步骤推理工作流。

最新财报电话会还透露,最新一代的 Vera Rubin 产品也即将走向市场,英伟达表示已于本周向客户发送了首批样品,按计划将在下半年开始量产发货。届时会形成 Blackwell+Rubin 双线并行的局面。

此前,黄仁勋曾在 CES 等场合介绍过,这款产品采用更先进的制程,集成更高速的 HBM4 内存,并通过 Rubin CPX 专门优化了 " 智能体 " 在理解复杂指令和环境等方面的能力,能够提升推理密度并降低总体拥有成本(TCO)。

预计将拿到英伟达 100 亿美元投资的 Anthropic,会成为率先在 Vera Rubin 系统上训练其 Agent 功能的厂商。

英伟达 AI 算力产品路线图,截图来自申万宏源研究

除了主力产品的迭代,英伟达还有两个硬件端的新趋势尤其值得关注。

一是,被视为市场新卖点的 " 超节点 " 架构。

" 超节点 " 即超级计算节点,主要是通过高速互联技术,在单台服务器内集成大量 AI 芯片。

相较于 Generative AI 时代,大模型训练奉为圭臬,这项技术被认为更能够在 Agentic AI 时代大展拳脚。

Agentic AI 能够进行复杂、快速的推理至关重要," 超节点 " 单机器的架构,能够显著降低推理过程的通信延迟和能耗,也有利于消除传统分布式计算中大量的通信开销和内存壁垒,让 " 智能体 " 能够在一个巨大、连贯的 " 记忆体 " 中规划和完成任务。

目前,英伟达力推的 GB200 NVL72,就是将 72 个 Blackwell GPU,通过 NVLink 和 NVSwitch,无缝连接成一个逻辑统一的巨型计算单元的 " 最强超节点 "。

摩根士丹利在去年 8 月发布的一份报告中指出,GB200 NVL72 提供的 TB 级共享统一内存,让同时协调数百个 " 智能体 " 成为可能,考虑到性能提升幅度和 TCO 优势,即使相关产品造价数百万美元,也仍是大型 AI 实验室和云服务商在构建 Agentic AI 时的最佳选择。

截图来自摩根士丹利

另一个重要趋势,是英伟达在 2025 年末与 Groq 达成的 200 亿美元非独家许可协议。

一位曾在 EDA 大厂工作的业内人士对作者表示,Groq 走的 LPU 路线,明显区别于英伟达的 GPU,这一技术历来以兼具高精准度和低延迟度的推理能力闻名,对于 GPU 在推理性能方面的相对短板来说,是很好的补充。而正如前文所述,推理堪称 Agentic AI 的头等大事。

市场对英伟达如何利用 Groq 的资产猜测已久,目前看,整合进自身架构的可能性远大于推出单品。

" 此前都说软件吞噬一切,现在又流行 AI 吞噬软件的叙事。英伟达也有相似之处,可以说是‘架构吞噬一切’,就像黄仁勋提到的 Mellanox 收购案,英伟达应该会将 Groq 完全整合进其新的架构之中。" 上述业内人士说。

在他看来,就像 2020 年英伟达收购 Mellanox,并以此为基础整合高速网络技术,为从芯片设计厂商进阶到 AI 基建巨头打下基础,Groq 预计也将在英伟达发展 Agentic AI 的过程中成为重要一块拼图。

黄仁勋已在最新财报电话会议上预告,将在 3 月中旬的 GTC 大会上公布英伟达与 Groq 合作的具体内容。

在硬件之后,英伟达在网络业务中也有不少针对 Agentic AI 的布局。其中最关键的是 NVLink 交换机,该技术也被用于超节点中。最新财报介绍称,该交换机让其产品能够以比上一代高 50 倍的每单位能量性能生成 token。这也有望成为 " 智能体 " 协同交互的关键。

CUDA 也一直被视为英伟达的 " 最强护城河 "。就目前来看,在 Agentic AI 时代,CUDA 仍将继续扮演英伟达的 " 杀手锏 " 角色,但也会迎来更大的挑战。

在传统路径上,CUDA 早就为 AI 开发者提供了从底层硬件访问到高层框架加速的全套工具。从目前 OpenClaw 激发的开发者创业激情、" 一人公司 " 热潮来看,继续使用这个成熟、高性能的平台进行开发,降低复杂性,快速推出产品仍是最佳选择。

不过,值得注意的是," 智能体 " 的特性决定了其工作内容较生成式 AI 复杂度倍增,运行时还需频繁调用外部工具,在 CPU、GPU 和内存间进行复杂的数据调度。但 CUDA 生态以往被认为是相对封闭、以 GPU 为中心的平台。在 OpenAI Triton 等新兴开源编译器和跨硬件框架同步涌现之际,CUDA 的核心地位仍可能受到冲击。

以既往观点来看,GPU 和 CUDA 都不以极致推理性能见长,所谓 " 智能体革命 "" 推理革命 " 一直作为风险叙事萦绕在英伟达周身。

但正如黄仁勋所言,"AI 不会倒退 ",既然 Agentic AI 拐点已至,英伟达也只能再次力求,证明自己能够称霸属于 "Agent 经济学 " 的新时代。(作者|胡珈萌,编辑|李程程)

相关标签

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容