
没有什么能当下新旧交替的景象,更适合论证黄仁勋的 Agentic AI" 拐点论 " 了:OpenClaw 横空出世掀起智能体创业热潮,Anthropic 的 Agent 让软件股接连遭遇重击。
这必然已经引起黄仁勋本人的关注。在 2 月 26 日财报发布后的电话会议上,他提到,
"Anthropic 的 Claude Cowork 代理平台具有革命性,为企业采用 AI 打开了闸门。Claude Cowork 和 OpenClaw 出现后,计算需求正飞跃式增长。Agentic AI 的 ChatGPT 时刻已经到来。"
作为 AI 需求最坚定的多头、"AI 泡沫论 " 最大的反对者,他也将这股浪潮视为 "AI 不存在泡沫,激增的资本支出合理且将持续 " 的论据。
就在去年差不多同一时间,2025 年 3 月的 GTC 大会上,黄仁勋首次提出了他经典的 " 人工智能演进四段论 ",他将 Agentic AI 形容为 " 具有自主性 "" 能够感知并理解自身所处情境 "" 除了通过逻辑推理来确定如何回答或解决一个问题外,还能制定行动方案、规划任务、调用工具并采取行动 " 的人工智能。
在他看来,过去 2 到 3 个月间,Agentic AI(代理 AI)已经迎来了实际转折,而英伟达提前 6 个月就捕捉到了信号。

从 "Token 经济学 " 到 "Agent 经济学 "
英伟达 2025 年第四季度收入同比增长 73% 达到 681 亿美元,财年同比增长 65% 至 2159 亿美元的表现,已经证实 AI 需求仍然足够旺盛。
英伟达业绩破纪录、超预期已是常态,去年 11 月其发布的 Q3 业绩同样亮眼,但市场却质疑 "AI 泡沫 " 因此加剧,并以股价下跌回应。此次 " 炸裂 " 财报公布后,英伟达盘后股价先涨后跌,远不如业绩表现得好。
不过,作者发现,另一项指标——毛利率的变化,比较适合作为评估英伟达状况的的切口,也与黄仁勋对 "Agentic AI 拐点 " 的判断息息相关。
从全年来看,英伟达的毛利率是核心指标中唯一 " 退步 " 的,从去年的 75% 降到了今年的 71.1%。
原因是,除了美国此前限制对华出口 H20 导致的库存减值外,主要是公司将主力产品从 Hopper 迭代到 Blackwell 后,在商业模式上也由 " 卖主板 " 向价值链更上层的 " 卖机架 " 进军,但制造和系统集成的成本也因此大增,产品定价的涨幅却未保持同频,毛利率因此走低。
但值得注意的是,公司 Q4 毛利率已再度回到 75% 的水平,为全年最高,同比亦有所提升。公司还预期能在新财年将毛利率继续维持在 75% 左右的水平。这意味着,英伟达已在 Blackwell 定价权上再次掌握了主动。
就在今年 1 月,黄仁勋还在达沃斯世界经济论坛上提到,公司 GPU 供不应求,现货价格持续上涨。

其背后原因,很大程度上如黄仁勋在财报电话会上所言,源于行业愈发意识到 " 在 Agent 时代,算力和推理就是收入 ",这引发了与 "AI 泡沫担忧 " 背道而驰的 " 抢购潮 " 和 " 资本开支潮 ",因此,推理性能大幅提升的 Blackwell 系列产品大受欢迎。
黄仁勋在电话会上不下四次专门论述了这一话题,体现出极大热情。
综合他的最新观点来看,几乎可以总结出一套由 "Token 经济学 "(Tokenomics)升级而成的 "Agent 经济学 "。
其主旨是,Agentic AI 想要实现及时反应、自主运行,就需要更大规模的算力和更快速度的推理,这将导致 token 数量指数级增长。
随着企业 " 智能体 " 经济效益、实用价值的凸显,相关需求已被释放,拐点之后的新世界中,每一个 token 都将被 " 美元化 ",直接转化为收入。
所以,算力等于收入,每一个云厂商、模型厂商、软件厂商都需要投资算力。与此同时,推理性能(即单位电力下每个 token 的转化效率)则决定了利润,而芯片架构则决定着 token 的转化率。换言之,每瓦性能最佳的架构将会胜出。
当然,黄仁勋眼中的胜出者始终是英伟达。
不过,美银证券分析师维维克 · 艾利亚(Vivek Arya)提出,云计算巨头资本支出已达到 7000 亿美元的前所未有的高点,后续恐怕难以为继,同时现金流可能承压,多米诺骨牌或将轰然倒塌。
黄仁勋直接 " 反击 ",称对此毫不担心,因为 Agentic AI 已展示出其实用性,生成 token 变得有利可图," 事情很简单,计算的范式已经改变,今后,算力增长就意味着收入增长 "。
此前,黄仁勋还曾作出过 "2030 年数据中心资本支出可能达到 3 万亿至 4 万亿美元 " 的判断。此次电话会结束时,他再次强调这一预估并不激进,因为未来每个软件都将依赖 AI,而每家公司都将生产 token。如此看来,目前的资本支出还只能算是前奏。
Agent 时代,英伟达的护城河还能守多久?
通过这套 "Agent 经济学 ",也能够更好地理解英伟达近年来的一系列技术、产品迭代方向和投资决策。
目前来看,英伟达在芯片(硬件)、网络(连接)和软件层面都根据 Agentic AI 的特点进行了针对性布局。
在硬件端," 智能体 " 需要长期稳定运行,且快速及时动作,并能胜任复杂任务,这对内存容量和带宽的要求都更高。
正如前文所述,英伟达早已不再只满足于 " 造主板 ",而是在 Blackwell 系列迭代时选择了更加复杂的 " 造机架 " 模式,这为在整体上构建更强性能、更低延迟、更优效率的服务器,跨过 " 智能体 " 门槛提供了可能。
2025 年下半年,英伟达已正式向市场推出了针对 Agent、推理乃至 Physic AI 进行专门优化的 Blackwell Ultra 平台,官方称其能够高效支持 " 智能体 " 所需的低延迟、长上下文窗口和多步骤推理工作流。
最新财报电话会还透露,最新一代的 Vera Rubin 产品也即将走向市场,英伟达表示已于本周向客户发送了首批样品,按计划将在下半年开始量产发货。届时会形成 Blackwell+Rubin 双线并行的局面。
此前,黄仁勋曾在 CES 等场合介绍过,这款产品采用更先进的制程,集成更高速的 HBM4 内存,并通过 Rubin CPX 专门优化了 " 智能体 " 在理解复杂指令和环境等方面的能力,能够提升推理密度并降低总体拥有成本(TCO)。
预计将拿到英伟达 100 亿美元投资的 Anthropic,会成为率先在 Vera Rubin 系统上训练其 Agent 功能的厂商。

除了主力产品的迭代,英伟达还有两个硬件端的新趋势尤其值得关注。
一是,被视为市场新卖点的 " 超节点 " 架构。
" 超节点 " 即超级计算节点,主要是通过高速互联技术,在单台服务器内集成大量 AI 芯片。
相较于 Generative AI 时代,大模型训练奉为圭臬,这项技术被认为更能够在 Agentic AI 时代大展拳脚。
Agentic AI 能够进行复杂、快速的推理至关重要," 超节点 " 单机器的架构,能够显著降低推理过程的通信延迟和能耗,也有利于消除传统分布式计算中大量的通信开销和内存壁垒,让 " 智能体 " 能够在一个巨大、连贯的 " 记忆体 " 中规划和完成任务。
目前,英伟达力推的 GB200 NVL72,就是将 72 个 Blackwell GPU,通过 NVLink 和 NVSwitch,无缝连接成一个逻辑统一的巨型计算单元的 " 最强超节点 "。
摩根士丹利在去年 8 月发布的一份报告中指出,GB200 NVL72 提供的 TB 级共享统一内存,让同时协调数百个 " 智能体 " 成为可能,考虑到性能提升幅度和 TCO 优势,即使相关产品造价数百万美元,也仍是大型 AI 实验室和云服务商在构建 Agentic AI 时的最佳选择。

另一个重要趋势,是英伟达在 2025 年末与 Groq 达成的 200 亿美元非独家许可协议。
一位曾在 EDA 大厂工作的业内人士对作者表示,Groq 走的 LPU 路线,明显区别于英伟达的 GPU,这一技术历来以兼具高精准度和低延迟度的推理能力闻名,对于 GPU 在推理性能方面的相对短板来说,是很好的补充。而正如前文所述,推理堪称 Agentic AI 的头等大事。
市场对英伟达如何利用 Groq 的资产猜测已久,目前看,整合进自身架构的可能性远大于推出单品。
" 此前都说软件吞噬一切,现在又流行 AI 吞噬软件的叙事。英伟达也有相似之处,可以说是‘架构吞噬一切’,就像黄仁勋提到的 Mellanox 收购案,英伟达应该会将 Groq 完全整合进其新的架构之中。" 上述业内人士说。
在他看来,就像 2020 年英伟达收购 Mellanox,并以此为基础整合高速网络技术,为从芯片设计厂商进阶到 AI 基建巨头打下基础,Groq 预计也将在英伟达发展 Agentic AI 的过程中成为重要一块拼图。
黄仁勋已在最新财报电话会议上预告,将在 3 月中旬的 GTC 大会上公布英伟达与 Groq 合作的具体内容。
在硬件之后,英伟达在网络业务中也有不少针对 Agentic AI 的布局。其中最关键的是 NVLink 交换机,该技术也被用于超节点中。最新财报介绍称,该交换机让其产品能够以比上一代高 50 倍的每单位能量性能生成 token。这也有望成为 " 智能体 " 协同交互的关键。
CUDA 也一直被视为英伟达的 " 最强护城河 "。就目前来看,在 Agentic AI 时代,CUDA 仍将继续扮演英伟达的 " 杀手锏 " 角色,但也会迎来更大的挑战。
在传统路径上,CUDA 早就为 AI 开发者提供了从底层硬件访问到高层框架加速的全套工具。从目前 OpenClaw 激发的开发者创业激情、" 一人公司 " 热潮来看,继续使用这个成熟、高性能的平台进行开发,降低复杂性,快速推出产品仍是最佳选择。
不过,值得注意的是," 智能体 " 的特性决定了其工作内容较生成式 AI 复杂度倍增,运行时还需频繁调用外部工具,在 CPU、GPU 和内存间进行复杂的数据调度。但 CUDA 生态以往被认为是相对封闭、以 GPU 为中心的平台。在 OpenAI Triton 等新兴开源编译器和跨硬件框架同步涌现之际,CUDA 的核心地位仍可能受到冲击。
以既往观点来看,GPU 和 CUDA 都不以极致推理性能见长,所谓 " 智能体革命 "" 推理革命 " 一直作为风险叙事萦绕在英伟达周身。
但正如黄仁勋所言,"AI 不会倒退 ",既然 Agentic AI 拐点已至,英伟达也只能再次力求,证明自己能够称霸属于 "Agent 经济学 " 的新时代。(作者|胡珈萌,编辑|李程程)