
微软 CEO 萨提亚 · 纳德拉和 Coinbase Global CEO 布莱恩 · 阿姆斯特朗等高管均表示,体量更小、成本更低的模型已经能够满足企业相当大一部分需求。
这是硅谷企业通过内部重新评估得出的结论。不久前,许多公司还鼓励员工尽可能多地使用 AI 工具,并将 AI 使用量增长视为生产力提升的象征,这种现象被称为 "Tokenmaxxing"(Token 消耗最大化)。
Token 是衡量 AI 使用量的单位。
然而,如今 AI 账单开始让企业感到压力。
尽管 Token 价格持续下降,但随着 AI 公司逐步从固定订阅收费转向按使用量计费,完成一项任务的实际成本反而不断上升。这使得企业每项任务的 AI 支出变得更加难以预测,整体费用也越来越高。
据报道,优步员工争相使用 AI 编程工具,仅用 4 个月便耗尽了公司 2026 年全年 AI 预算,迫使管理层不得不限制使用额度。
初创公司 BlueRock 首席执行官 Harold Byun 表示:" 授权模式的变化让很多企业措手不及。变化发生后,我们立即收到不少客户反馈,他们的 AI 预算超支了 20% 至 30%。"
企业开始担忧 AI 账单失控
随着企业越来越广泛地使用 AI,其成本正远远超出最初预期。
市场研究机构 Gartner 预计,到 2028 年,AI 编程工具的使用成本将超过普通软件开发人员的平均薪资。
Gartner 另一项调查显示,今年四分之三的企业高管预计 IT 预算将继续增加,其中近一半预计预算增幅将达到两位数。
因此,越来越多企业开始转向价格更低的模型,并借助 OpenRouter 等 AI 模型市场,通过 " 路由 " 技术,把不同任务分配给最具成本效益的模型,而仅将价格昂贵的顶级模型用于编程等复杂任务。
花旗研报显示,今年 6 月,OpenRouter 平台处理的开源模型 Token 占比已升至 65%,而今年 1 月这一比例仅为 34%。
这意味着,以 DeepSeek 为代表的开源模型开发商有望受益。虽然这些模型在初创企业中已得到广泛采用,但一直难以进入大型企业市场。
上周,帕洛阿尔托网络 CEO 阿罗拉在社交平台 X 发文称:" 如果想赢得企业客户,就应该采用前瞻性 Token 定价。" 他呼吁 AI 实验室按照未来几年 Token 预计达到的低价水平,提前向企业收费。
OpenAI 似乎也正在顺应这一趋势。据报道,OpenAI 正考虑大幅下调产品价格,包括降低 Token 使用费用,该公司认为,竞争对手 Anthropic 可能采取类似行动。
不过,价格下降也可能影响 AI 公司的收入增长,尤其是在它们准备 IPO 之际。
Synovus Securities 私人财富管理财务顾问 Christopher Brown 表示:" 随着 OpenAI 和 Anthropic 争夺‘率先上市’的机会,两家公司之间很可能爆发价格战。"
开源模型与中国 AI 受到更多关注
AI 成本上升也推动更多企业转向开源模型,其中包括价格更低的中国 AI 模型。目前,OpenRouter 平台最受欢迎的四款模型全部来自中国,DeepSeek 排名第一。
花旗研报显示,中国 AI 模型与美国领先模型之间的性能差距正迅速缩小,但价格仅为每百万 Token 约 0.18 美元,而美国顶级模型平均价格约为 4 美元。
据媒体报道,由于 API 调用成本和 Token 消耗的压力,微软将 DeepSeek 整合进其生态,作为 OpenAI 和 Anthropic 等昂贵模型的低成本平替选项。
" 过去,开源模型通常落后领先模型一年以上;现在业内普遍认为,它们只落后约四个月,而且这一差距还会继续缩小,"Brown 表示。
不过,也有分析人士指出,出于地缘政治因素,一些企业仍会对中国 AI 模型保持谨慎。
他们预计,未来企业更可能复制云计算的发展路径,同时采用多家 AI 模型供应商,根据不同场景选择最适合、性价比最高的模型。
WEKA 首席 AI 官 Val Bercovici 表示:" 开源模型已经能够以 10% 的成本实现 90% 的效果。没有必要在所有任务上都使用最昂贵的 Token。"