财联社 4 月 3 日讯(编辑 史正丞)随着新年以来 Anthropic、字节跳动等 AI 巨头不断发布爆款应用,叠加 " 龙虾 " 热潮推动开源大模型的调用激增,英伟达的 H100 芯片在租赁市场迎来身价 "V 型 " 反转的高光时刻。
要知道,这款芯片是黄仁勋在2022 年 3 月 GTC 上发布,同年秋季开始出货的产品。
据半导体研究机构 SemiAnalysis 周四推出的 "H100 一年期租赁合约价格指数 ",这款 " 老芯片 " 的租赁合约价格从 2025 年 10 月触及每小时 1.7 美元后,已经在今年 3 月飙升至每小时每块 GPU 2.35 美元,飙升近 40%。

该指数基于对 100 多家云服务提供商、算力资源的买家和卖家进行的直接调查数据构建,每月采集一次。
最新报告指出,按需租用的 GPU 算力在所有类型 GPU 中都已售罄——即便近期价格上涨,那些已经锁定按需实例的客户也不愿把这些算力释放回资源池。该机构也比喻称,在 2026 年初寻找 GPU 算力,就像试图预订 " 最后一班离开航班 " 的机票一样:价格高昂,而且几乎没有可用资源。
研究人员补充称:" 客户正争相以每块 GPU 每小时 14 美元的价格抢购亚马逊云服务的 p6-b200 竞价实例,一些新兴云服务巨头(Neocloud Giants)甚至已经不再提供单节点销售;部分英伟达 H100 GPU 仍按 2 — 3 年前签订时的原价续约,甚至有些 H100 合同直接续签到 2028 年。"
至于架构更先进的 Blackwell 芯片?研究人员表示,由于对开放权重模型的强劲需求以及推理需求的持续激增,新部署 Blackwell 的交付周期现在正延长至 6 到 7 个月。
在 2025 年晚些时候,市场一度预期随着性能更强、算力成本更低的 Blackwell 芯片加速部署,Hopper 芯片(H100、H200)的租赁价格可能会出现大幅下降。但最新的情况恰恰相反,现在市场对 H100 的需求不仅保持坚挺,在许多情况下甚至还在增强。
SemiAnalysis 在报告中指出,今年初算力需求的重要驱动因素之一来自原生媒体生成。例如,字节跳动的 Seedance(即梦)和谷歌 Nano Banana 驱动用户大量生成和优化视频 / 图像期间,推动词元(token)吞吐量大幅上升。更显著的需求来源是多智能体(multi-agent)工作负载的兴起,推动词元使用量和算力消耗呈抛物线式增长。
SemiAnalysis 表示,光是他们自己 " 在过去一周里就消耗数十亿词元 ",每百万词元成本在 5 美元左右。不过公司也心满意足地表示,由此节省的时间以及工作流程与能力的扩展,带来的回报远超算力成本。
报告也指出,算力供应收紧且价格上涨的动态,与广泛的市场情绪存在脱节。CoreWeave、Nebius 等新兴云服务商的股价正处于过去 6 到 12 个月区间的低端。分析指出,目前市场仍然锚定在 " 终将出现供给过剩与算力商品化 " 的叙事框架上。但现实的情况却是,在激进的供给紧张环境下,几乎所有类型的算力资源都会保持旺盛需求——无论其相对性能差异如何。
展望未来,研究人员给出三个关键观察点来判断 GPU 租赁价格是否仍会维持高位。
首先,随着 GB300 集群在整个 2026 年逐步放量,市场将关注新增供给究竟能否缓解当前的算力紧张局面。其次,需要关注持续中的芯片短缺是否进一步恶化。最后,还要观察各大 AI 巨头的年度经常性收入(ARR)扩张情况,以及 AI 应用的普及速度和词元消耗规模的持续增长节奏。