AI 产业的价值重心正在发生结构性转移。
过去两年间,英伟达、内存厂商及能源供应商主导了 AI 投资回报的分配,但随着智能体 AI(Agentic AI)商业化加速,模型层的利润空间正以前所未有的速度扩张,而掌控算力供应端的英伟达与台积电,却尚未将这一趋势充分反映于定价之中。
Anthropic 是这一转变的最直接注脚。据 SemiAnalysis 最新研究,Anthropic 的年化营收(ARR)已从年初的 90 亿美元飙升至 440 亿美元以上,其推理基础设施的毛利率同期从 38% 跃升至逾 70%。与此同时,代币(token)生产成本因硬件迭代和软件优化大幅压缩,价值与成本之间的剪刀差持续扩大,推动模型厂商进入利润率快速抬升的新阶段。
在供应端,英伟达和台积电坐拥最稀缺的资源,却尚未对当前的需求盛况作出充分的价格响应。SemiAnalysis 认为,这一定价滞后构成了一个重要的市场错位:以 Vera Rubin(VR NVL72)为代表的下一代系统具备显著的价格上调空间,而谁能在这场价值重新分配中抢占先机,将深刻影响 AI 产业链各环节的投资逻辑。
AI 价值池的三年迁移路径
2023 年至 2025 年间,AI 投资的超额回报主要集中在基础设施层。
英伟达于 2023 年 5 月首次发布爆款财报,单日盘后大涨 25%,正式开启 AI 投资浪潮。2024 年,Vistra 和 GE Vernova 分别上涨 265% 和 146%,跻身标普 500 表现最强个股,能源瓶颈成为市场焦点。2025 年,内存板块接棒领涨,SanDisk、Western Digital、Seagate 和 Micron 等均录得全年逾 200% 的涨幅,存储供需失衡成为驱动定价的核心变量。
与此同时,模型厂商和推理服务商的毛利率长期承压。彼时 AI 的实际效用被批评者认为不过是 " 更好的谷歌搜索 " 加上聊天界面,与数万亿美元的预期资本开支严重背离。
这一格局在 2025 年底出现了根本性的转变。
智能体 AI:重塑代币经济学的拐点
SemiAnalysis 将 2025 年 12 月视为 AI 商业化的真正拐点——智能体 AI 开始稳定运行,并在企业工作流中大规模落地。这一变化的核心意义,在于它从根本上改变了代币的经济价值。
以 SemiAnalysis 自身为例,其年化代币支出已相当于员工薪酬总额的约 30%,每名员工每月消耗代币量超过 50 亿个,是 Meta 内部人均水平的 5 倍以上。研究团队列举了多个真实案例:原本需要初级分析师数小时完成的财务建模、图表制作和盈利分析等工作,现在通过智能体以极低的代币成本即可完成,而同等人力成本曾高达数百至数千美元。
与此同时,代币的生产成本正在急剧下降。SemiAnalysis 估算,在智能体任务场景下,运行 Opus 4.7 的实际混合价格约为每百万代币 0.99 美元,远低于 5 美元 /25 美元的官方标价——原因在于智能体工作负载具有极高的输入输出比(约 300:1)和超过 90% 的缓存命中率,大量代币落入最低价格档位。
硬件层面的加速同样显著。相较于一年前的 H100,Blackwell 系列在前沿工作负载下每秒可生成的代币数量提升约 30 倍。进一步对比显示,最优化配置下的 GB300 NVL72 相较最优化 H100 在 FP8 精度下吞吐量提升约 17 倍,切换至 FP4 后这一差距扩大至 32 倍,而总拥有成本(TCO)仅高出约 70%。

模型层定价权:为何不会被竞争蚕食
面对模型厂商利润率的快速扩张,市场最常见的质疑是:竞争最终会压低价格。SemiAnalysis 对此持保留意见,并给出两点支撑。
其一,前沿闭源模型的定价权依然稳固。尽管开源模型的基准测试成绩不断刷新,但在真实的知识工作场景中,其表现仍明显弱于闭源前沿模型。以 Kimi K2.6(定价 0.95 美元 /4 美元)为例,其对 Anthropic Opus 定价的下行压力十分有限。
其二,算力约束意味着没有任何一家前沿实验室能够独自满足整个市场的需求。Anthropic 已开始通过将 Claude Code 锁定在每月 100 美元以上订阅门槛背后、限制第三方接入等方式主动管理需求,代币需求在可预见的未来将持续超过供给。这一结构性稀缺赋予了前沿模型厂商按价值而非成本定价的底气。
Anthropic 已通过产品线策略兑现这一逻辑:Opus fast 定价是普通 Opus 的 6 倍,即将推出的 Mythos 定价为 25 美元 /125 美元,是普通 Opus 的 5 倍,而头部企业客户仍愿意为这些高价 SKU 买单。SemiAnalysis 表示,若 Anthropic 将 Mythos fast 定价至 150 美元 /750 美元,其本身也会是付费用户。
英伟达与台积电:稀缺资源的定价滞后
然而,掌握最核心稀缺资源的两家公司——英伟达与台积电——却并未充分跟上这一波价值重估。
台积电的 N3 先进制程产能已成为整个 AI 算力扩张最紧张的瓶颈。英伟达、博通、Annapurna、联发科和 AMD 均在争夺有限的 N3 晶圆配额,而 N3 产能利用率预计将在 2026 年下半年突破 100%。DRAM 晶圆厂利用率已超过 90%,内存整体供应偏紧,但定价却相对保守。
SemiAnalysis 认为,台积电完全有条件大幅提价,且客户不仅会接受,部分客户甚至会欢迎——英伟达就是典型案例:若 TSMC 提价意味着竞争对手获得更少产能配额,英伟达支付更高晶圆价格反而有利于巩固其市场地位。英伟达 CEO 黄仁勋 2024 年曾公开表示台积电应该提高晶圆价格,其背后逻辑正在于此。

Rubin 系统:量化 Nvidia 的定价空间
以即将于 2026 年下半年发布的 Vera Rubin(VR NVL72)为参照,SemiAnalysis 构建了一套 " 一图定乾坤 "(One Chart to Rule Them All)的定价分析框架,从成本端与价值端分别锚定租金定价的地板与天花板。

价值端(天花板):以 GB300 当前 5 年期合约租金约每 PFLOP 0.70 美元为锚点,VR NVL72 对应的租金上限约为每 GPU 每小时 12.25 美元。

SOCAMM 内存定价是另一个关键变量。VR NVL72 采用插槽式 LPDDR5X 内存模组(SOCAMM),可与计算单元独立定价。SemiAnalysis 估算,英伟达在 2026 年一季度支付的 SOCAMM 合同价约为每 GB 8 美元,较上季度有显著跳升;预计至 2026 年底,SOCAMM 价格可能超过每 GB 13 美元。在此背景下,英伟达若在 SOCAMM 上实现 60% 的毛利率,逻辑上具备合理性:一方面内存供应受限、英伟达掌握最大份额优势;另一方面,VR NVL72 在 TCO 层面的性能领先地位使客户缺乏替代选择。
价值归宿:谁在赢,谁在等
SemiAnalysis 的框架揭示出当前 AI 价值分配的核心矛盾:代币经济学的改善正在迅速推高模型厂商、推理服务商及 Neocloud 的利润,但作为算力供给端最稀缺资源的掌控者,英伟达和台积电的定价行为与其供给稀缺性之间存在明显错位。
这一错位的持续,本质上是一种主动选择——英伟达正在扮演类似 "AI 中央银行 " 的角色,通过软件效率提升向下游输送价值,以维持生态系统的长期扩张动力,同时规避反垄断监管压力。台积电则延续了历史上 " 稳定生态、不吃尽上行红利 " 的定价哲学。
然而随着推理 ROI 日益清晰、价值定价逻辑在市场中普及,这两家公司向价值定价框架切换的压力将持续上升。一旦切换发生,AI 产业链的价值分配格局将再度重塑——届时,算力供给端的议价权将在更大程度上向硬件层回归。