关于ZAKER Skills 合作
财联社-深度 12分钟前

小摩:Token 用量、GPU 租赁和 DRAM 价格齐升 AI 基建需求仍获支撑

财联社 7 月 3 日讯(编辑 夏军雄)摩根大通在其最新《数据中心观察》报告中指出,大模型调用量仍在快速扩张,Token 支出重新加速,非超大规模云厂商市场的 GPU 租赁价格继续上行,DRAM 现货价格维持强势。

该行认为,模型价格下降并未削弱 AI 需求,反而正在通过更低门槛和更广使用场景,推动推理需求进一步扩张。

Token 价格下降,但 AI 使用量正在更快扩张

摩根大通跟踪的 OpenRouter 数据显示,6 月 LLM Token 总量环比增长 70%,显著高于 5 月的 33% 和 4 月的 5%;同比增速达到 20 倍,高于 5 月的 12 倍和 4 月的 15 倍。Token 支出也同步回升,6 月环比增长 70%,同比增长 16 倍,结束了此前两个月增速放缓的状态。

(OpenRouter 数据显示,6 月全球周度 Token 用量跃升至约 45 万亿,其中非美国模型增速显著快于美国模型)

从商业逻辑看,这意味着模型价格下降并未导致市场收入缩减。平均 Token 价格在 6 月环比上涨 7%,但同比仍下降 5%;不过同比降幅已明显小于 5 月的 21% 和 4 月的 24%。换言之,行业仍处于长期单位价格下行阶段,但价格下滑速度正在收窄,而使用量的增长速度远快于价格调整速度。

(平均 Token 价格走势)

这也是 AI 商业化能否成立的关键。大模型服务本质上具有典型的软件和云服务特征:单次调用价格下降,可能降低客户使用门槛,并刺激更多开发者、企业和消费者将模型嵌入搜索、客服、编程、办公、广告和智能体应用中。只要调用量增长持续快于价格下降,模型供应商的总收入池仍然可以扩大。

摩根大通据此判断,在其样本和简化假设下,即使采用较保守的 Token 价格,模型提供商的单位经济性仍呈改善趋势。这并不代表所有模型公司已经实现稳定盈利,但至少说明市场需求端尚未出现 " 价格战压垮商业模式 " 的迹象。

美国模型份额下降,但仍掌握主要收入池

值得注意的是,Token 使用量与收入贡献之间出现了明显分化。

6 月,美国模型,包括 OpenAI、Anthropic、谷歌和 xAI 等,占 OpenRouter 总 Token 量的 35%,低于 5 月的 46% 和 4 月的 56%。其 Token 量环比增长 30%、同比增长 8 倍,增速依然很快,但弱于整体市场。

这意味着以 DeepSeek、MiniMax、MiMo、GLM 等为代表的中国模型和低成本模型,正在开发者、初创企业、代理式编程等对成本高度敏感的场景中,快速扩大使用份额。

按 Token 用量计算,6 月排名前五的模型分别为 DeepSeek V4 Flash、MiMo-V2.5、MiniMax M3、Hy3 preview 和 Claude Opus 4.7,合计占总 Token 量的 45%。

(Token 用量排名前 20 的大模型)

但如果看支出端,美国模型仍占据明显优势。美国模型贡献了 85% 以上的 Token 支出,6 月相关支出环比增长 65%、同比增长 14 倍。按 Token 支出计算,排名前五的模型依次为 Claude Opus 4.7、Claude Opus 4.8、GPT-5.5、Claude Sonnet 4.6 和 GLM 5.2,合计占总支出的 75%。

其中,Claude Opus 4.7 是唯一同时进入 Token 使用量和支出前五的模型。这一现象反映出市场正在形成双层结构:低成本、开源或中国模型更擅长扩大调用规模;高性能、闭源和企业级模型则仍掌握更多高价值应用和付费需求。

GPU 租赁价格上涨,非云巨头市场仍然缺算力

摩根大通跟踪的彭博数据表明,6 月非超大规模云厂商市场的 GPU 租赁价格继续上涨。A100 平均租赁价格为每 GPU 小时 1.63 美元,环比上涨 6.3%,已连续第五个月上涨;H100 平均价格为 2.72 美元,环比上涨 3.7%,连续第七个月上涨;B200 平均价格为 5.33 美元,环比上涨 2.7%。

三类 GPU 同步涨价的意义在于,AI 算力需求并未只集中于微软、亚马逊、谷歌和 Meta 等超大规模云厂商。大量模型初创公司、企业客户、GPU 云服务商和区域性数据中心,仍在争夺有限的高端计算资源

从价格结构看,A100 租价上涨最快,说明上一代 GPU 并未因新产品推出而迅速失去市场。对于大量推理任务、轻量训练任务和成本敏感型应用而言,A100 仍具有较高性价比。H100 则因其在大模型训练和推理中的通用性,需求持续坚挺。

不过,高端 GPU 之间的价格溢价正在收窄。H100 对 A100 的价格比从 4 月的 1.77 倍下降至 6 月的 1.67 倍;B200 对 H100 的价格比从 4 月的 2.04 倍下降至 1.96 倍,较 2025 年 9 月指数推出时的 2.58 倍明显回落。

这可能意味着,市场对最新一代 GPU 的绝对需求依然旺盛,但随着供给逐步增加、替代产品扩散,以及客户更多根据单位算力成本选择设备,B200 的稀缺溢价正在趋于理性。对英伟达而言,这并不必然意味着需求减弱,更多可能反映 AI 算力市场正从 " 只要最新产品 " 逐步走向更精细的性能和成本优化。

DRAM 继续飙升,NAND 先行进入分化阶段

6 月 DDR5 16Gb 现货价格升至 43.14 美元,环比上涨 10%,较去年同期的 5.13 美元上涨 740%,并且已连续第三个月上升。相比之下,NAND 1Tb 现货价格为 27.03 美元,环比仅下降 0.3%,但已经连续第三个月小幅回调;尽管如此,其价格仍较去年同期的 5.28 美元上涨 412%。

DRAM 和 NAND 走势分化,反映 AI 基础设施对不同存储品类的拉动并不均衡。

DRAM,尤其是高端 DDR 和 HBM 相关产品,直接受益于 AI 服务器配置升级。大模型训练和推理需要处理更大的参数量、更长的上下文窗口和更高的并发请求,对内存容量、带宽和稳定性的要求明显高于传统服务器。因此,AI 服务器对高端 DRAM 的需求增长,不仅提升了内存使用量,也挤压了部分常规 DRAM 供应

NAND 则更多关联企业级 SSD、数据存储和传统终端需求。虽然 AI 数据中心同样需要大量 SSD,但 NAND 产能弹性、库存调整和终端需求变化通常更快,因此其价格更容易在短期内出现波动。连续三个月小幅下跌,意味着 NAND 市场的紧张程度可能正在缓解,但同比超过 5 倍的价格涨幅仍表明行业并未回到供给宽松状态。

对于美光、SK 海力士、三星等 DRAM 和 HBM 供应商而言,DRAM 价格强势有利于盈利能力和产品结构改善;对西部数据、闪迪、希捷等存储相关公司而言,NAND 价格仍处于高位,但未来利润弹性可能弱于 DRAM。

对于服务器整机厂、云服务商和模型公司来说,内存成本上涨则意味着 AI 基础设施投资成本仍有上行压力。

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容