AI 账单暴涨，实际效益难言：谁在助推“ Token 通胀”？

文 | 青橙财经

100000000000000。

100 万亿，1 后面跟着 14 个 0。这无疑是个天文数字，但可能还不到国人每天 Token 消耗量的一半。

2026 年上半年，从中关村到硅谷，大厂茶水间里最热的话题变成了一句：" 你今天烧了多少？" 几十万、几百万、几千万？旁边桌吃饭的骑手听见了，大概率以为这哥们在吹牛，或者脑子有毛病。其实没扯谎，他们聊的不是人民币，是 Token。

Token 和真金白银之间虽然隔着数量级，但架不住后面的 0 涨得太凶。据报道，国外一家企业给员工批量开通 Anthropic 的 Claude 企业授权时忘了设消费上限，一个月后账单出来—— 5 亿美元，约合人民币 34 亿元。

国内近期有个案例是米哈游，《崩坏》系列技术团队负责人郑银河在 2026 年 5 月阿里云峰会上自曝：一名工程师测试多 Agent 协作时没设置熔断，数十个智能体陷入循环调用，13 小时烧掉 200 万元 Token 账单。

账单炸了，但问起 AI 带来了什么实际效益？多数人可能会面露尴尬。米哈游工程师烧掉的 200 万元，足够支付一个小型研发团队整月的薪资，最终换来了的却只是一整夜毫无产出的 "AI 摸鱼 "。

或许，企业里只有 HR 完成了裁员 KPI，老板转头把省下的人力成本又砸去建 AI、买 Token。

单位价值稀释，消耗规模指数膨胀，投入与产出错位—— Token 作为 AI 时代的硬通货，正呈现出典型的通胀特征。而且其通胀程度，可能比津巴布韦人民扛一麻袋钱买大米还要疯。

那么，到底是谁在为 "Token 通胀 " 推波助澜？

「从极大化使用，到限量使用」

2026 年上半年，硅谷刮起一股名为 "Tokenmaxxing"（极大化 Token 使用量）的风潮。大厂们主动鼓励员工尽可能多地消耗 Token，甚至将 Token 消耗量与 KPI 直接挂钩。

Meta 内部上线了追踪 8.5 万名员工 Token 消耗的排行榜，给排名靠前的员工授予 "Token 传说 "" 缓存大师 " 等称号；亚马逊推出内部 AI 使用榜单 "KiroRank"，将消耗数据纳入团队考评。

英伟达 CEO 黄仁勋的言论更火上浇油：" 如果我的工程师消耗的 Token 价值达不到他们年薪的一半，我会深感忧虑。"

国内厂商迅速跟进。腾讯在 2026 年 3 月推出全员 AI 激励计划，为员工提供每人年均 22 万元的 Token 资源，覆盖 Cursor、CodeBuddy 等多款国内外工具，内部也一度出现 Token 消耗排行榜。

于是，不出意外的，它们的 AI 账单，都失控了。

短短 30 天，Meta 员工消耗了 60.2 万亿 token，成本超 1 亿美元；Uber 仅用 4 个月就耗尽了 2026 年全年的 AI 预算，管理层不得不紧急出台限额令，每位员工每月 AI 工具费用不得超过 1500 美元；亚马逊也开始推行严格的 Token 限额管理，高级副总裁 Dave Treadwell 甚至亲自下场喊话 " 别为了用 AI 而用 AI"。

就在上个月，腾讯内部也下发额度调整通知：全员 Token 配额大幅缩水，核心研发团队月额度从宽松状态收紧至 7000 元，外包岗位更是砍到 1000 元。

从全员敞开用，到限额使用，短短三个月，画风突变。究其原因，无非是飞起的账单让财大气粗的大厂们都头皮发麻。

正如 OpenAI CEO 山姆 · 奥特曼近日在一个企业客户活动上所说：" 今年年初，AI 运行成本还是一个从未被提起的问题，现在突然变成了一个巨大的问题。"

这背后是需求的爆炸式增长。国家数据局数据显示，2026 年 3 月中国日均 Token 调用量已突破 140 万亿，而 2024 年初仅为 1000 亿，两年增长超千倍。

而从全球范围来看，这个增长趋势还未看到放缓的苗头。高盛近期发布的报告，预计到 2030 年，全球 Token 月消耗量将比 2026 年增长 24 倍，达到约 120 千万亿（120 quadrillion）个 Token/ 月，其中企业级智能体是核心增长动力。

* 图源高盛

Token 账单失控还带来一个副作用。为了填平 AI 的成本窟窿，今年一季度，海外十几家科技巨头裁员超 4 万人，程序员首当其冲；而在国内，"630" 成了不少互联网人共同的 Last Day。

在 Meta，已经几乎没有人手写代码；在国内头部大厂，新增代码中最高 90% 由 AI 生成。AI 代码率的飙升，直接导致了人员需求的下跌，以及随之而来的职场震荡。

「Token 账单暴涨之谜」

账单费用 = 用量 X 价格。这道简单的公式背后，藏着两层不那么透明的推高逻辑，最终叠加形成了指数级的成本膨胀。

很多人有个错觉：大模型价格一直在降，AI 不是越来越便宜吗？实际上，这只说对了一半——便宜的永远是通用轻量模型，而企业真正刚需的编程、长上下文、复杂推理等高价值场景，价格非但没降，反而在逆势上涨。

Anthropic 推出的安全增强版模型 Fable 5，定价达到每百万 Token 输入 10 美元、输出 50 美元，是同期 Opus 系列的两倍。

国内的智谱 AI 也是一个典型样本。据天眼查，2026 年一季度，智谱伴随新模型迭代连续三次上调核心 API 价格，累计涨幅达 83%；其面向通用场景的 GLM-4.7 轻量模型，输入价格仅 2-4 元 / 百万 Token，输出 8-16 元；但对准编程与 Agent 场景的 GLM-5.2，输入价格涨到 8 元，输出高达 28 元，两者价差最高达 4 倍。

此外，腾讯云在 2026 年 3-4 月经历两轮调价，混元 HY 2.0 Instruct 模型输入价格涨幅高达 463%；MiniMax 核心模型价格也有 30%-50% 的上调。

与此同时，模型厂商的计费模式从订阅制全面转向按量付费，厂商的收入直接和 Token 消耗量挂钩。这就形成了一个结构性矛盾：客户的目标是用最少的 Token 完成任务，而厂商的商业利益天然倾向于让客户消耗更多 Token。

而从实际数据来看，近来 Token 消耗量的增长不是线性的，而是指数级的。

2025 年底至今，AI 产业最核心的变化，是从对话式 AI 向智能体 Agent 跃迁。AI 不再是一问一答的线性交互，而是自主规划、循环调用、多轮纠错的复杂流程，Token 消耗也随之从线性增长变成指数膨胀。

Agent 虽然能力强大，但据腾讯研究院分析，它其实隐藏着几类典型的低效消耗：

一是上下文陷阱，智能体每一步操作都会重复带入历史对话、工具日志和文件内容，同一批信息被反复计费；

二是技能 Skill 冗余，对 49 个软件工程技能的基准测试显示，79.6% 的技能对任务通过率没有任何提升，却最高带来 451% 的 Token 开销增长；

三是多 Agent 的 " 沟通税 "，多个智能体分工协作时，会不断重复任务背景、结论和格式化套话，每一次对话都是一次重复计费；

四是长任务的 " 熵增 "，任务链条越长越容易跑偏，而为了纠偏又要增加摘要、检查、回滚机制，进一步推高消耗。

这些损耗不是简单的加和，而是互相叠加的乘积效应。一个复杂的多 Agent 任务，可能有近一半的 Token 花在了内部协调、自我纠偏和重复读取上，真正用于生成有效内容的比例并不高。对缺乏技术能力的普通企业而言，这更是一笔看不清、算不明的糊涂账。

「踏空的恐惧」

如果说大模型厂商的产品和定价策略是外部的 " 阳谋 "，那么企业内部的 Token 消费，则是一场自上而下的 " 自我掏空 "。

担心踏空 AI 变革的浪潮，企业纷纷拼命拥抱 AI。这种压力自然会传导到每个员工身上，尤其在 AI 替代裁员的阴影下，员工普遍把 " 会用 AI、多用 AI" 当成安全感来源。

不少公司把 AI 代码率、工具使用时长写进了 OKR，甚至上线全员可见的数据看板，倒逼每个人刷消耗。简单的邮件回复、基础代码片段、常规数据查询，明明用搜索引擎或人脑几秒就能解决，也要交给大模型跑一遍——反正预算不是自己掏，用得越多越显得 " 拥抱变革 "。

企业这般将 Token 消耗量与员工绩效挂钩，默认 " 用了多少 AI" 等同于 " 创造了多少价值 "，并愿意为此支付高额账单。

有人说，这是历史规律。历史上每一次通用技术革命，都走过相似的路径。蒸汽机刚发明时，工厂主算完账发现还不如用马匹便宜；电灯刚商用时，成本远高于煤气灯。

但不同的是，电力消耗产出的是实实在在、可衡量的工厂效益，但 Token 换来的 " 智能 "，到底创造了多少价值？答案是，目前还难以量化。

据晚点 LatePost 报道，一位互联网大厂技术管理者坦言，自己部门 20 多个人，一个月消耗 5 万元 Token，回头看却没沉淀出几个可落地的成果。这笔钱相当于 10 名实习生的月薪，化作无形的 Token 之后，连清晰的产出物都没有。

企业往往认为用 AI 替代人工是节省了成本。但反常识的是，大量基础场景里，用 AI 反而比人工更贵。

国内某人力资源服务商做过测算：用 AI 筛选并初评一份简历，Token 加系统成本约 1.2 元 / 份，而雇佣兼职人事处理的成本仅 0.8 元 / 份。类似的情况在数据标注、基础文案撰写、简单客服问答中普遍存在。

AI 还有更隐蔽的成本。有软件公司的研发负责人反馈，引入 AI 编程工具后，初级开发的效率看似提升了，但高级工程师的评审工作量翻倍，线上故障的返工成本增加了 30% 以上，算总账反而不划算，而且，人反而更累了。

这正是 Token 经济最核心的矛盾：Token 消耗与价值创造之间，从来不是线性关系。不是消耗的 Token 越多，产出的价值就越大；相反，很多时候消耗的增长恰恰来自无效的循环、冗余的架构和盲目的焦虑。

「写在最后」

回到最初的问题，谁在推动 "Token 通货膨胀 "？不是某一家 AI 厂商的恶意营销，也不是某几个员工的滥用浪费，而是在座的所有人。

从卖 GPU 卖存储的底层算力基础设施，到大模型架构的天然膨胀属性；从每一个怕踏空 AI 而焦虑的企业，直至每一位担心落伍的员工——所有人，共同推高了 Token 的消耗，推动了 Token 的贬值，也推高了那本越来越厚的 AI 账单。

每个人都助推了 Token 的通胀。而每个人又在自己的推力下被拉得踉踉跄跄。

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

AI 账单暴涨，实际效益难言：谁在助推“ Token 通胀”？

宙世代

一起剪

相关阅读

小米高管回应友商暗讽小米空调：用户会用脚投票

从16色到实时光追：10款彻底改变PC游戏的显卡！你见过几款

遭Anthropic指控蒸馏攻击 阿里全面禁用Claude全系产品

存储涨价把“非洲手机王”逼疯：利润腰斩 传音一台手机平均只卖346元

谁在卡灵巧手的脖子？

英伟达公布了提升营收的新计划

亚马逊LEO挑战马斯克星链

工程机械ETF招商（560920）拉涨2.9%！内需外销双双高景气，三大挖机主机厂已集中发布涨价函

AI催热Micro LED光互连：2027年商用预期升温

水滴屏重出江湖！iQOO Z11i开售：国补价1019.15元起

靠“硅胶娃娃”破圈，优必选急了？

iPhone 18 Pro只是开胃菜！苹果下半年新品汇总：16款陆续登场

继续打破二游藩篱，《异环》又一次爆了

美知名券商：AI将媲美人类交易员，散户将获得机构级交易能力

苹果将于7月30日发布2026财年第三财季财报

最新评论

钛媒体

热门推荐

企业资讯

遭Anthropic指控蒸馏攻击阿里全面禁用Claude全系产品

存储涨价把“非洲手机王”逼疯：利润腰斩传音一台手机平均只卖346元