5 月底,美国企业支出管理平台 Ramp 的首席经济学家阿拉 · 卡拉齐安(Ara Kharazian)做了一个预判:美国企业管理 AI 支出会越来越精打细算,会更多尝试开源模型,或者 OpenAI、Anthropic 和谷歌家更便宜的低配版本。
一周之后,他自己平台的数据给出了一个超出预判的答案。
6 月 3 日,Ramp 发布 6 月软件趋势榜,登顶的是 DeepSeek。

" 我没有料到美国公司会去用 DeepSeek。" 卡拉齐安在报告里写道。
Ramp 公司负责替 5 万多家美国企业管企业卡和对公账单,每个月经手数十亿美元的开支。它的软件趋势榜负责统计哪些软件供应商正在被企业第一次付款,增速最快。这张榜单过去的常客是 Figma、Fireworks AI 这类硅谷自己人,一家中国模型公司登顶,是头一回。
付款记录里还有一个更隐藏的细节。这些美国公司没有走下载开源权重、本地部署模型的思路,而是直接向 DeepSeek 付费。
" 说得明确一点:这不只是自部署的开源使用。企业在直接通过 DeepSeek 收发数据。" 卡拉齐安特意强调了这一点。
他补充表示称,这可能是迄今为止最明显的信号,说明美国企业正在寻找 OpenAI 和 Anthropic 的低成本替代品,一些公司愿意用更便宜的中国模型," 让美国的数据在中国托管的服务器之间来回传输 "。
这不是 DeepSeek 第一次出现在美国企业的账本上。2025 年 1 月,R1 发布引爆全球,DeepSeek 的应用一度超过 ChatGPT 登顶美区 App Store 免费榜,在 Ramp 当时的数据榜单里,美国企业对 DeepSeek 的采用率同期冲到 0.3%,随后很快回落到 0.1%。
如果说 2025 年初更像是企业跟着舆论热度的一次集体试用。那这一轮企业们又用回了 DeepSeek 的核心变化在于动机:AI 账单的财务压力。
Uber 四个月烧光了全年 Token 预算
美国企业的 AI 账单有多难看,已经不再是行业内才知道的秘密。
咨询公司贝恩近期调查了全球 951 家年收入超过 1 亿美元的企业,结论相当不客气:在企业 AI 累计支出突破 1 万亿美元之后,AI 带来的实际成本节约普遍远低于预期;更扎眼的是,44% 的大型企业正在用 " 上一轮 AI 尚未兑现的费用节省 " 来论证下一轮 AI 投资的合理性。贝恩把这种操作定性为 " 一个存在结构性漏洞的循环赌注 "。
落到具体公司,数字则更加夸张,打车巨头 Uber 透露,仅 2026 年前四个月,公司就耗尽了全年的 Token 预算;Salesforce 表示,今年支付给 Anthropic 的费用将达到约 3 亿美元。
科技巨头同样开始捂钱包:亚马逊叫停了内部的 AI 使用排行榜,原因是员工为了刷排名刻意执行不必要的任务、推高 Token 消耗;微软则计划在 6 月末前,逐步停用多个关键产品部门员工的 Claude Code 订阅。
当亚马逊都开始心疼 Token 的时候,成本就不再是创业公司才需要操心的问题了。
而美国企业花钱最多的,恰好是费用最贵的两家 AI 大模型公司。
Ramp 自家的 AI 指数显示,Anthropic 和 OpenAI 在美国企业中的付费采用率分别达到 34.4% 和 32.3%,Anthropic 还是首次反超 OpenAI。这两家的旗舰模型定价长期站在全行业最高一档,企业的 AI 支出大头,几乎就是给这两家的账单。卡拉齐安那番 " 成本纪律 " 的判断,说的正是这个处境:钱已经花出去了,回报迟迟没到,财务部门开始挨个审视每一行 AI 开支。
对于企业而言,省钱的路无非两条,要么少用,要么换便宜的。亚马逊和微软选了前者。趋势榜上的那批公司,选了后者。
把价格打到四分之一,开发者先投了票
就在美国企业被高额 AI 账单困扰时,DeepSeek5 月刚好递上了一个很难拒绝的报价。
5 月 22 日,DeepSeek 宣布旗舰模型 V4-Pro 的 API 价格永久下调至原价的四分之一:限时优惠结束后,每百万 Tokens 输入价格低至 0.025 元(缓存命中)、3 元(缓存未命中),输出 6 元,再次刷新全球主流大模型的底价纪录。
根据第三方测算,在相同任务复杂度下,V4-Pro 的平均调用成本约为 GPT-5.5 的十分之一,约为 Claude Opus 4.7 的十一分之一。
低价对 DeepSeek 来说不是新策略。早在 2024 年 V2 降价引发国内大模型价格战时,创始人梁文锋就在接受采访时讲过定价原则:核算成本后定价," 不贴钱,也不赚取暴利 ",降价的底气来自下一代模型结构带来的成本下降,"API 和 AI 都应该是普惠的、人人用得起的东西 "。
如果说当时这番话听起来像一家中国创业公司的自我要求,那么两年后,DeepSeek 的普惠定价开始在美国公司的对公账户落地。
而在企业掏钱之前,开发者群体已经对 DeepSeek 投下了自己的信任票。
全球模型聚合平台 OpenRouter 的数据显示,5 月 18 日至 24 日当周,DeepSeek V4-Flash 以 3.43 万亿 Tokens 的周调用量登顶全球第一,DeepSeek 旗下模型周调用总量达到 5.74 万亿 Tokens,超过 Anthropic 与谷歌,连续两周位居全球厂商第一。同期整个中国模型阵营的周调用量达到 9.22 万亿 Tokens,连续四周压过美国模型的 4.93 万亿 Tokens。OpenRouter 的用户以海外开发者为主,中国开发者只占约 6%,这份榜单上的每一笔调用,基本都来自海外开发者的真实选择。

开发者用脚投票在先,企业用预算跟进在后。对企业软件来说,这条 " 开发者先用、公司后买 " 的路径再经典不过,过去二十年,AWS、GitHub、Slack 都是这么走进美国企业的,只不过这一次,走这条路的是一家中国的模型公司。
中国模型进入美国公司,DeepSeek 不是第一个,也不是唯一一个。早在 2025 年底,Airbnb 的 CEO 布莱恩 · 切斯基就公开说,公司 " 大量依赖阿里巴巴的 Qwen 模型,它又好又快又便宜 ",OpenAI 的模型反而 " 在生产环境里用得不多 ",这番话今年还招来了美国众议院的问询。
今年 3 月,估值近 300 亿美元的 AI 编程工具 Cursor 推出新模型 Composer 2,发布 24 小时内就被开发者扒出底座是月之暗面的 Kimi K2.5,联合创始人阿曼 · 桑格(Aman Sanger)事后承认," 一开始没在博客里说明基于 Kimi,是个失误 "。
这些公司用中国模型的方式,和 DeepSeek 这一次不一样。Cursor 用的是 Kimi 的开源权重做二次训练,Airbnb 的 Qwen 也是自己部署,切斯基反复强调 " 我们没有向任何中国公司提供数据 "。它们调用的是中国开源模型的能力,钱并没有进中国公司的账。
而 Ramp 这次记录到的是另一回事,美国公司在直接给 DeepSeek 付费,数据也直接经 DeepSeek 进出。从 " 拿开源权重自己跑 " 到 " 付钱直连托管 ",这才是 6 月这张榜单真正的新意,也正是卡拉齐安特意点明 " 这不只是自部署 " 的原因。
这次能够不一样吗?
对于 DeepSeek 冲上美国企业订阅榜的结论,卡拉齐安在报告里补了一段:" 我不会高估这个趋势的持久性。对企业来说,直接接入 DeepSeek 存在真实的竞争与安全顾虑。"
美国企业直接把数据发给一家中国公司的服务器,合规部门不可能没有意见。这层顾虑是真实的,也未必是 DeepSeek 短期能解决的。
但卡拉齐安这段话的后半句,分量不比前半句轻:" 美国模型公司无论如何都应该注意到这种竞争压力,用更便宜的模型,或者用智能路由,帮企业管住不断失控的 AI 支出。"
简单翻译一下:即便美国企业明天就因为安全顾虑集体退掉 DeepSeek,逼它们走到这一步的成本压力也不会消失,OpenAI 和 Anthropic 的定价体系照样要回答这道题。
何况趋势榜上的信号不只 DeepSeek 一个。同月上榜的还有 Fireworks AI、fal、DeepInfra 这批开源模型推理平台,美国企业在整体性地转向开源和低成本方案,DeepSeek 只是这场迁徙里最显眼、也最让人意外的那个目的地。
便宜也可能是另一段麻烦的开始。进入 Agent 时代,一个任务要反复调用模型、自己写代码、自己跑测试、自己纠错,吞掉的 Token 是过去一句一答的几倍甚至几十倍。测算显示,当 Agent 的渗透率爬到 8%,它消耗的 Token 就追平了聊天机器人,往后还有 5 倍以上的空间。单价降到四分之一,调用量翻上十倍,账单只会更厚。DeepSeek 的低价把更多公司请进了门,也把它们更深地推进了这场停不下来的消耗。
一年半前,DeepSeek-R1 发布引爆全球,那个 " 约 560 万美元训练成本 " 的故事让硅谷集体恐慌,英伟达单日蒸发近 6000 亿美元市值。
尽管当时 DeepSeek 对股市的恐慌一周就能平息,但如今愈发压力山大的 AI 预算压力,每个月都会准时拷问所有的美国企业。