今天巴克莱一篇对比谷歌和微软在推理流量上 token 消耗的对比,非常有意思,甚至有些出乎投资者意料外的内容。" 免费 " 带来需求暴增,而且推理成本比预期的低不少。
Alphabet 在 1Q25 共推理≈ 634 万亿(634T)tokens,而 Microsoft 约 100T;到 2025 年 4 月,月度推理量已升至 480T,较一年前的 9.7T 激增 50 倍,显示 Google 在 AI 推理流量上具备 6 倍于 Azure/ChatGPT 的规模优势。
推理量暴涨主要来自 Search 的 AIOverviews 等免费场景;GoogleSearch 用户基数约为 ChatGPT 的 5 – 6 倍,免费 AItoken 增速(50 ×)远超付费大模型收入增速(3 – 4 ×),凸显 Google 先以用户与数据壁垒为先、后续再寻求变现。
按 Gemini2.5 费率估算,1Q25 推理成本约 7.5 亿美元,仅占搜索收入的≈ 1%(占 COGS+Opex1.6%);即便 token 按 4 倍速度继续攀升,也仍低于搜索核心基础设施成本(≈ 18% 收入),缓解市场对利润率下滑的担忧。
4. 资本开支结构:训练为主,推理仅用≈ 10%
GoogleAI 计算 CAPEX 中约 90% 仍投向训练与新模型,推理对应的芯片 CAPEX 在 1Q25 仅 6.2%(≈ 6 亿美元)。若按 480T 月度 run-rate 估算,2Q25 推理 CAPEX 也仅升至≈ 14%,显示资金仍主要押注长期模型演进。
采用 50/50Pro 与 Flash 模型、15%ActiveParameters 假设,Google 仅用≈ 270kTPUv6(ASP ≈ 4,500 美元)即可覆盖 1Q25 推理负荷,体现自研加速器在功耗与成本端的优势。
尚未全面放量的通用 AI 助手(ProjectAstra)、浏览器代理(Mariner)和视频生成模型(Veo)预计将进一步推高 token 基数,Google 已提前把 Compute CAPEX 提升到总 CAPEX 的>50%,为 2026 年后 AI 需求埋下增量弹性。