AI 云业务普涨的时代,利润率成了真正的分水岭。AWS 凭借一套将 Claude token 需求转化为经营杠杆的独特结构,正在与 Azure、Google Cloud 拉开差距。
最新数据显示,AWS 在 2026 年一季度 EBIT 利润率环比提升 213 个基点,而同期 Azure 利润率走弱,Google Cloud 利润率改善有限且存在会计口径差异。亚马逊是唯一一家将代币即服务 ( TokenaaS ) 作为其人工智能业务主要组成部分的云服务提供商 ( CSP ) 。

关键信号在于:Bedrock 目前约为 55 亿美元 run-rate 规模,仅占 AWS 总收入约 4%,却贡献了 AWS 同比新增毛利额的 30%。只要 Anthropic 需求持续爆发,这一杠杆效应将继续放大。
结构差异:AI 占比低,利润率反而更高
云厂商都在吃 AI 需求,但分化发生在利润率,而非收入增速。
从 AI 收入占总收入比例来看,AWS 并不领先。测算显示,AWS 的 AI 收入占比从 2024 年一季度的 2% 升至 2026 年一季度的 10%,而同期 GCP 和 Azure 分别达到 36% 和 27%。

这解释了一个表面矛盾—— AWS 的 AI 收入占比远低于竞争对手,利润率却跑出来了。问题不在 "AI 多不多 ",而在 "AI 收入是哪一种 "。
Bedrock 模式:从卖算力到拿分销权益
Bedrock 是 AWS 的模型调用平台,客户可通过统一账单、安全合规框架接入 Claude 等前沿大模型。它的竞争对手包括 Microsoft Foundry、Google Gemini Enterprise Agent Platform,以及 TogetherAI、Fireworks 等偏开源模型的平台。
这类平台的核心差异不在模型数量或延迟指标,而在能否接入前沿模型。前沿大模型贡献了 AI API 行业的大部分收入,AWS、微软、谷歌相较其他 endpoint 平台的优势,正在于此。
但接入模型只是第一步。Bedrock 对 AWS 利润率的真正意义,在于其交易结构。在 AWS 通过 Bedrock 分销 Claude token 的安排下,Anthropic 作为 seller of record 确认完整的 token 销售收入;客户由 AWS 开票,模型部署在 AWS 基础设施上;AWS 则获得两部分收益:类似 EC2/IaaS 的基础设施费用,以及分销或收入分成。
相比五年期 take-or-pay 式的 IaaS 合同,这类 Token-as-a-Service(TaaS)业务收入锁定性更低,但利润率更厚。对 Anthropic/Bedrock 安排的测算显示,固定 IaaS 费用、收入分成与超量绩效门槛叠加,使 Bedrock 在 2026 年一季度实现了约 55% 的 EBIT 利润率。代价也很明确:若 Claude token 消费下滑,AWS 承担的需求风险高于传统 IaaS。

Anthropic 爆发:AWS 利润杠杆的核心燃料
Bedrock 高度绑定 Anthropic 需求。测算显示,Bedrock 80% 至 90% 以上的客户使用 Anthropic 模型,Bedrock 实质上是一个由 Claude 需求驱动的业务。
利润率同样大幅改善。Anthropic 推理毛利率已升至 60% 中段,相比 2025 年的 38% 和 2024 年的 -94% 实现大幅修复。Anthropic 越快增长,Bedrock 上 Claude token 消费越大,AWS 拿到的基础设施费和分销分成也越多。
这种借力关系在财务数据上已有体现。2026 年二季度的路径假设更为激进:Bedrock 占 AWS AI 收入比例有望升至 53%,并为 AWS 总收入增长额外贡献 9 个百分点。
容量布局:提前锁电,才接得住 TaaS 需求
TaaS 要做大,前提是有足够的推理算力按时交付。AWS 在这一点上比多数同行更为激进。
数据中心模型显示,AWS 在 2025 年至 2027 年的新增容量上持续领先;微软在 2024 年至 2026 年节奏接近,但到 2027 年被明显拉开。更重要的是,微软内部 AI 项目消耗的算力高于亚马逊,且大量 AI 算力通过长期合同锁定给了 OpenAI ——仅 OpenAI 相关积压订单规模,就是 Azure 全年收入的 2.5 倍。
AWS 则更早将电力和容量当作市场份额问题处理,与 Talen、Vistra、NiSource 等独立电力生产商签下数十亿美元级 PPA,并在印第安纳和密西西比推进接近 2GW 规模的建设。微软此前曾经历约一年的数据中心建设暂停,拉低了 2027 年容量预测;威斯康星大型 AI 集群进展也慢于 AWS 同类项目。若要追赶,微软只能从 neocloud 购买更多容量,成本更高,利润率也将承压。
AWS 还在推进更高模块化和预制化比例的新数据中心设计。对 AI 推理业务而言,这直接关系到收入的交付能力。
自研芯片:在分销费之外压低底层成本
Bedrock 模式对自研芯片天然友好——客户购买的是 token,不关心底层跑的是英伟达 GPU 还是 Trainium。这给了 AWS 一个额外的成本杠杆。
Trainium 在高 batch 推理、强化学习等对内存带宽敏感的工作负载中具备较好的性能 / 总拥有成本表现。AWS CEO Matt Garman 在 2025 年 11 月披露,Trainium 已支撑超过 50% 的 Amazon Bedrock token 使用量。
CPU 侧同样值得关注。前沿大模型训练和推理对 CPU 需求上升,尤其在强化学习和 agentic 工作负载中。AWS 的 Graviton4、Graviton5 在性能 / 总拥有成本上具备优势,并将作为 Trn3 的 head node 集成,也可单独用于强化学习和 agentic 任务。AWS 已与 Anthropic、OpenAI、Meta 签下大型 CPU 及 Graviton 相关合作,Bedrock 客户基础越大,向其追加销售 Graviton 能力的摩擦越小。
同行落后:不是 AI 收入不够,而是结构没变
Azure 的核心问题是 AI 收入仍高度 IaaS 化,Microsoft 365 Copilot 和 GitHub 相关业务尚未形成同等规模的利润率拉动。
Google Cloud 的 Gemini API 表现尚可,但没有复制 Anthropic 在编码市场的强势。更重要的是,Google Cloud 存在会计口径差异—— DeepMind 的训练成本未计入 GCP 分部,导致其利润率与 AWS 不完全可比。
Oracle 和 neocloud 的处境更为直接:主要在 AI IaaS 和算力租赁层竞争,TaaS 几乎没有规模。一旦云业务利润低于预期,批发算力模式的脆弱性即刻暴露。
AWS 这轮跑赢,依赖几条线同时成立:Anthropic 需求爆发提供收入基础,Bedrock 交易结构提供利润率,电力与数据中心容量提供交付能力,Trainium 和 Graviton 压低底层成本。只要这几条线保持连接,AWS 的 AI 业务逻辑就不只是 " 资本开支换增长 ",而是 " 模型需求换经营杠杆 "。
