关于ZAKER Skills 合作
全天候科技 10分钟前

从 "Token 竞赛 " 到 "Token 节流 ":月人均成本 7500 美元,天价账单倒逼巨头集体踩刹车

企业 AI 支出正经历一场方向性逆转。曾用排行榜激励员工大量消耗 Token 的科技巨头们,如今已纷纷为 AI 使用设置上限,"tokenmaxxing"(极限消耗)迅速让位于 "tokenminimizing"(极限节流),一轮席卷 AT&T、Meta、Uber、沃尔玛和亚马逊等 Fortune 500 巨头的 AI 预算管控浪潮正全面到来。

据 The Information 报道,AT&T 已开始限制部分员工访问微软旗下 GitHub Copilot 的权限;Meta 则在收紧员工在 Anthropic 及其他 AI 服务商上的支出,与数月前员工相互竞争、争相消耗 Token 的热闹景象形成鲜明反差。据彭博此前报道,Uber 和沃尔玛已相继对 AI 编程工具的使用设置上限;据英国《金融时报》报道,亚马逊已废除按 AI 使用量为员工排名的内部排行榜。

驱动这一转变的是迅速膨胀的成本压力。AI 使用强度最高的企业,每名员工每月 AI 支出已高达 7500 美元。即便各模型的单 Token 价格持续走低,反复调用模型的智能体(agentic)工具仍令企业 AI 账单较此前翻了三倍,成本压力已超出许多企业的预算承受范围。

这一转变正重新定义 AI 市场的受益方。能够帮助企业监控、限制和优化 AI 支出的 " 网关 "(gateway)工具与模型路由器(model router)需求快速上升,微软、Databricks 以及英伟达旗下投资的 Factory 等公司正迎来新的增长窗口,软件供应商 Palantir 和 Snowflake 亦被视为这一结构性转变的潜在受益者。

账单触目惊心:成本失控重塑预算逻辑

成本压力的累积有迹可循。Uber 是迄今最极端的案例——该公司在 2026 年 4 月就已耗尽全年 AI 编程预算,目前已将每位员工每款工具的月度使用上限调整为 1500 美元。沃尔玛对其内部 AI 智能体的使用设置了上限;亚马逊则在发现员工为争夺排名而大量消耗算力、推高成本后,直接废除了相关排行榜。

即便在个人层面,成本消耗也令人侧目。微软发现,部分工程师每月仅在 Claude Code 上消耗的 Token 费用就高达 500 至 2000 美元。

问题的根源在于,智能体工具的普及从结构上改变了 Token 的消耗模式。与用户手动发送单条指令不同,此类工具在完成一项任务的过程中会反复自动调用模型,大幅推高实际用量。这使得即便单 Token 价格已在持续下降,企业整体账单依然居高不下。

反应分化:踩刹车还是继续踩油门?

并非所有企业都选择收紧。Box 首席执行官 Aaron Levie 对此颇为自得。" 我们从未庆祝过 tokenmaxxing," 他表示," 我们没有排行榜,所以我们没有走偏——没有去激励错误的行为。"

与此形成对比的是 Databricks。该公司工程领域负责人 Nikita Shamgunov 上周在 Nebius 举办的活动上表示,Databricks 对工程师的 AI 预算不设上限," 因此 tokenmaxxing 依然存在 "。这一立场折射出一种观点:对于相信自身员工能够高效利用 AI 的企业而言,限制使用未必合算。

这一分歧揭示了 Token 节流政策内在的张力:控制使用量固然能压降成本,但也可能同步削减 AI 原本承诺带来的生产率提升——而后者恰恰是企业当初为这笔支出所作的主要辩护理由。

基础设施受益:成本管控工具迎来结构性需求

"Token 节流 " 浪潮的另一面,是对成本管控基础设施的结构性需求上升。

越来越多的企业正将简单任务从高价前沿模型迁移至更廉价或开源的替代模型,以在不削减实际使用量的前提下控制成本。Palantir 和 Box 的高管均表示,来自企业客户的此类需求正在快速增长。

基础设施层供应商正迅速填补这一空白。微软和 Databricks 已分别推出 " 网关 " 工具,可帮助企业监控员工的 AI 使用并实施支出上限。英伟达旗下投资、估值 15 亿美元的 AI 软件开发公司 Factory 则于本月初发布了新款模型路由器,旨在将低复杂度任务自动分配给成本更低的模型。

微软首席执行官 Satya Nadella 在上周末于 X 平台发布的一篇文章中对上述趋势有所呼应,主张 AI 模型应当像可随时替换的商品一样运作。他写道:" 我们任何人都不希望看到这样一个世界——每家公司在每个行业都将价值拱手让给少数几个 ' 通吃一切 ' 的模型。" 值得关注的是,这一表态出自一位旗下生产力软件正面临 Anthropic 和 OpenAI 竞争压力的科技巨头掌门人,其背后的战略意图同样耐人寻味。

微软两面作战:推出新定价,却主打 " 成本可控 "

在积极呼应客户降本诉求的同时,微软本周揭示了新旗舰 AI 产品 Copilot Cowork 的定价结构,其计费逻辑与 Anthropic 此前推出的模式高度相似。

Copilot Cowork 主要依托 Anthropic 的模型,旨在微软 Office 365 软件内自动完成复杂的多步骤任务——例如,用户可将一批收据截图发送给该工具,由其自动生成包含相应费用信息的电子表格。这远超现有 365 Copilot 所能处理的基础任务(如汇总邮件或在 Excel 中建立财务模型)的范畴。

定价方面,用户须先持有月费起价 30 美元的 365 Copilot 授权,再按照 Copilot Cowork 的实际使用量额外付费。这一 " 座位费 + 消耗量 " 组合计费模式,与 Anthropic 今年早些时候向企业客户推出的收费方式如出一辙。

面对企业客户对 AI 成本飙升的普遍担忧,微软执行副总裁 Charles Lamanna 在周二的博客文章中表示,客户 " 可以选择管控成本的方式 ",包括为员工设置 Copilot Cowork 的使用上限。与此同时,微软还预告了允许客户将 Copilot Cowork 中的 Anthropic 模型替换为来自 OpenAI 或微软自身的其他模型的功能,声称可在相近效果下实现更低成本;据一位知情员工透露,微软还在测试可在部分场景下替换 Anthropic 模型的开源模型选项。上述布局表明,在 "Token 节流 " 时代,如何在维持产品竞争力的同时缓解客户的成本焦虑,已成为企业软件市场新一轮竞争的核心命题。

相关标签
全天候科技

全天候科技

提供专业快速完整的科技商业资讯

订阅

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容