文 | 青橙财经
100000000000000。
100 万亿,1 后面跟着 14 个 0。这无疑是个天文数字,但可能还不到国人每天 Token 消耗量的一半。
2026 年上半年,从中关村到硅谷,大厂茶水间里最热的话题变成了一句:" 你今天烧了多少?" 几十万、几百万、几千万?旁边桌吃饭的骑手听见了,大概率以为这哥们在吹牛,或者脑子有毛病。其实没扯谎,他们聊的不是人民币,是 Token。
Token 和真金白银之间虽然隔着数量级,但架不住后面的 0 涨得太凶。据报道,国外一家企业给员工批量开通 Anthropic 的 Claude 企业授权时忘了设消费上限,一个月后账单出来—— 5 亿美元,约合人民币 34 亿元。
国内近期有个案例是米哈游,《崩坏》系列技术团队负责人郑银河在 2026 年 5 月阿里云峰会上自曝:一名工程师测试多 Agent 协作时没设置熔断,数十个智能体陷入循环调用,13 小时烧掉 200 万元 Token 账单。
账单炸了,但问起 AI 带来了什么实际效益?多数人可能会面露尴尬。米哈游工程师烧掉的 200 万元,足够支付一个小型研发团队整月的薪资,最终换来了的却只是一整夜毫无产出的 "AI 摸鱼 "。
或许,企业里只有 HR 完成了裁员 KPI,老板转头把省下的人力成本又砸去建 AI、买 Token。
单位价值稀释,消耗规模指数膨胀,投入与产出错位—— Token 作为 AI 时代的硬通货,正呈现出典型的通胀特征。而且其通胀程度,可能比津巴布韦人民扛一麻袋钱买大米还要疯。
那么,到底是谁在为 "Token 通胀 " 推波助澜?
「从极大化使用,到限量使用」
2026 年上半年,硅谷刮起一股名为 "Tokenmaxxing"(极大化 Token 使用量)的风潮。大厂们主动鼓励员工尽可能多地消耗 Token,甚至将 Token 消耗量与 KPI 直接挂钩。
Meta 内部上线了追踪 8.5 万名员工 Token 消耗的排行榜,给排名靠前的员工授予 "Token 传说 "" 缓存大师 " 等称号;亚马逊推出内部 AI 使用榜单 "KiroRank",将消耗数据纳入团队考评。
英伟达 CEO 黄仁勋的言论更火上浇油:" 如果我的工程师消耗的 Token 价值达不到他们年薪的一半,我会深感忧虑。"
国内厂商迅速跟进。腾讯在 2026 年 3 月推出全员 AI 激励计划,为员工提供每人年均 22 万元的 Token 资源,覆盖 Cursor、CodeBuddy 等多款国内外工具,内部也一度出现 Token 消耗排行榜。
于是,不出意外的,它们的 AI 账单,都失控了。
短短 30 天,Meta 员工消耗了 60.2 万亿 token,成本超 1 亿美元;Uber 仅用 4 个月就耗尽了 2026 年全年的 AI 预算,管理层不得不紧急出台限额令,每位员工每月 AI 工具费用不得超过 1500 美元;亚马逊也开始推行严格的 Token 限额管理,高级副总裁 Dave Treadwell 甚至亲自下场喊话 " 别为了用 AI 而用 AI"。
就在上个月,腾讯内部也下发额度调整通知:全员 Token 配额大幅缩水,核心研发团队月额度从宽松状态收紧至 7000 元,外包岗位更是砍到 1000 元。
从全员敞开用,到限额使用,短短三个月,画风突变。究其原因,无非是飞起的账单让财大气粗的大厂们都头皮发麻。
正如 OpenAI CEO 山姆 · 奥特曼近日在一个企业客户活动上所说:" 今年年初,AI 运行成本还是一个从未被提起的问题,现在突然变成了一个巨大的问题。"
这背后是需求的爆炸式增长。国家数据局数据显示,2026 年 3 月中国日均 Token 调用量已突破 140 万亿,而 2024 年初仅为 1000 亿,两年增长超千倍。
而从全球范围来看,这个增长趋势还未看到放缓的苗头。高盛近期发布的报告,预计到 2030 年,全球 Token 月消耗量将比 2026 年增长 24 倍,达到约 120 千万亿(120 quadrillion)个 Token/ 月,其中企业级智能体是核心增长动力。

Token 账单失控还带来一个副作用。为了填平 AI 的成本窟窿,今年一季度,海外十几家科技巨头裁员超 4 万人,程序员首当其冲;而在国内,"630" 成了不少互联网人共同的 Last Day。
在 Meta,已经几乎没有人手写代码;在国内头部大厂,新增代码中最高 90% 由 AI 生成。AI 代码率的飙升,直接导致了人员需求的下跌,以及随之而来的职场震荡。
「Token 账单暴涨之谜」
账单费用 = 用量 X 价格。这道简单的公式背后,藏着两层不那么透明的推高逻辑,最终叠加形成了指数级的成本膨胀。
很多人有个错觉:大模型价格一直在降,AI 不是越来越便宜吗?实际上,这只说对了一半——便宜的永远是通用轻量模型,而企业真正刚需的编程、长上下文、复杂推理等高价值场景,价格非但没降,反而在逆势上涨。
Anthropic 推出的安全增强版模型 Fable 5,定价达到每百万 Token 输入 10 美元、输出 50 美元,是同期 Opus 系列的两倍。
国内的智谱 AI 也是一个典型样本。据天眼查,2026 年一季度,智谱伴随新模型迭代连续三次上调核心 API 价格,累计涨幅达 83%;其面向通用场景的 GLM-4.7 轻量模型,输入价格仅 2-4 元 / 百万 Token,输出 8-16 元;但对准编程与 Agent 场景的 GLM-5.2,输入价格涨到 8 元,输出高达 28 元,两者价差最高达 4 倍。
此外,腾讯云在 2026 年 3-4 月经历两轮调价,混元 HY 2.0 Instruct 模型输入价格涨幅高达 463%;MiniMax 核心模型价格也有 30%-50% 的上调。
与此同时,模型厂商的计费模式从订阅制全面转向按量付费,厂商的收入直接和 Token 消耗量挂钩。这就形成了一个结构性矛盾:客户的目标是用最少的 Token 完成任务,而厂商的商业利益天然倾向于让客户消耗更多 Token。
而从实际数据来看,近来 Token 消耗量的增长不是线性的,而是指数级的。
2025 年底至今,AI 产业最核心的变化,是从对话式 AI 向智能体 Agent 跃迁。AI 不再是一问一答的线性交互,而是自主规划、循环调用、多轮纠错的复杂流程,Token 消耗也随之从线性增长变成指数膨胀。
Agent 虽然能力强大,但据腾讯研究院分析,它其实隐藏着几类典型的低效消耗:
一是上下文陷阱,智能体每一步操作都会重复带入历史对话、工具日志和文件内容,同一批信息被反复计费;
二是技能 Skill 冗余,对 49 个软件工程技能的基准测试显示,79.6% 的技能对任务通过率没有任何提升,却最高带来 451% 的 Token 开销增长;
三是多 Agent 的 " 沟通税 ",多个智能体分工协作时,会不断重复任务背景、结论和格式化套话,每一次对话都是一次重复计费;
四是长任务的 " 熵增 ",任务链条越长越容易跑偏,而为了纠偏又要增加摘要、检查、回滚机制,进一步推高消耗。
这些损耗不是简单的加和,而是互相叠加的乘积效应。一个复杂的多 Agent 任务,可能有近一半的 Token 花在了内部协调、自我纠偏和重复读取上,真正用于生成有效内容的比例并不高。对缺乏技术能力的普通企业而言,这更是一笔看不清、算不明的糊涂账。
「踏空的恐惧」
如果说大模型厂商的产品和定价策略是外部的 " 阳谋 ",那么企业内部的 Token 消费,则是一场自上而下的 " 自我掏空 "。
担心踏空 AI 变革的浪潮,企业纷纷拼命拥抱 AI。这种压力自然会传导到每个员工身上,尤其在 AI 替代裁员的阴影下,员工普遍把 " 会用 AI、多用 AI" 当成安全感来源。
不少公司把 AI 代码率、工具使用时长写进了 OKR,甚至上线全员可见的数据看板,倒逼每个人刷消耗。简单的邮件回复、基础代码片段、常规数据查询,明明用搜索引擎或人脑几秒就能解决,也要交给大模型跑一遍——反正预算不是自己掏,用得越多越显得 " 拥抱变革 "。
企业这般将 Token 消耗量与员工绩效挂钩,默认 " 用了多少 AI" 等同于 " 创造了多少价值 ",并愿意为此支付高额账单。
有人说,这是历史规律。历史上每一次通用技术革命,都走过相似的路径。蒸汽机刚发明时,工厂主算完账发现还不如用马匹便宜;电灯刚商用时,成本远高于煤气灯。
但不同的是,电力消耗产出的是实实在在、可衡量的工厂效益,但 Token 换来的 " 智能 ",到底创造了多少价值?答案是,目前还难以量化。
据晚点 LatePost 报道,一位互联网大厂技术管理者坦言,自己部门 20 多个人,一个月消耗 5 万元 Token,回头看却没沉淀出几个可落地的成果。这笔钱相当于 10 名实习生的月薪,化作无形的 Token 之后,连清晰的产出物都没有。
企业往往认为用 AI 替代人工是节省了成本。但反常识的是,大量基础场景里,用 AI 反而比人工更贵。
国内某人力资源服务商做过测算:用 AI 筛选并初评一份简历,Token 加系统成本约 1.2 元 / 份,而雇佣兼职人事处理的成本仅 0.8 元 / 份。类似的情况在数据标注、基础文案撰写、简单客服问答中普遍存在。
AI 还有更隐蔽的成本。有软件公司的研发负责人反馈,引入 AI 编程工具后,初级开发的效率看似提升了,但高级工程师的评审工作量翻倍,线上故障的返工成本增加了 30% 以上,算总账反而不划算,而且,人反而更累了。
这正是 Token 经济最核心的矛盾:Token 消耗与价值创造之间,从来不是线性关系。不是消耗的 Token 越多,产出的价值就越大;相反,很多时候消耗的增长恰恰来自无效的循环、冗余的架构和盲目的焦虑。
「写在最后」
回到最初的问题,谁在推动 "Token 通货膨胀 "?不是某一家 AI 厂商的恶意营销,也不是某几个员工的滥用浪费,而是在座的所有人。
从卖 GPU 卖存储的底层算力基础设施,到大模型架构的天然膨胀属性;从每一个怕踏空 AI 而焦虑的企业,直至每一位担心落伍的员工——所有人,共同推高了 Token 的消耗,推动了 Token 的贬值,也推高了那本越来越厚的 AI 账单。
每个人都助推了 Token 的通胀。而每个人又在自己的推力下被拉得踉踉跄跄。