关于ZAKER 合作
王智远 3小时前

国产大模型集体转身

过去六十天,国内大模型头部公司在集体做同一件事。

从卖算力、做项目,转向卖 Token、做订阅。你可能会好奇,为啥动作这么一致?我拆了一下,觉得有三件事同时发生了,把大家推到了同一条路上。

第一件,C 端这口井,挖不动了。这事 MiniMax 替所有人验证过;2025 年它全年收入 7903 万美元,海外收入占 73%,整体毛利率 25.4%。这已经是国内 C 端 AI 产品跑得最好的一家了。

其他 C 端 AI 助手,到今天没一家把商业化真正跑通。

Kimi K2.5 更说明问题,今年 1 月底发布,不到二十天,累计收入就超过了 2025 全年。数字看着猛,你拆开一看,核心增长全在海外。

Kimi 自己在内部信里说,2025 年 11 月以来,海外 API 收入增长 4 倍,海内外付费用户月环比增速超过 170%,你看,国内 C 端这边,真的挣不动了。

第二件,钱不好找了。

这事最能说明问题的是 DeepSeek。梁文锋过去三年一直说,幻方赚的钱够 DeepSeek 烧。这话到 2026 年,说不下去了。

过去一年,DeepSeek 被精准挖走了五个核心成员,V2 的关键开发者罗福莉去了小米,雷军开的是千万年薪。

R1 核心研究员郭达雅去了字节 Seed,传闻近亿总包,OCR 核心魏浩然、多模态核心阮翀也先后走了,五个人,覆盖了基座模型、推理、OCR、多模态四条核心技术线。

别人都在融资、扩团队,给顶尖研究员开天价。它自己赚的钱烧自己」这套,扛不住了。

2023 年那一轮,你能讲 AI 故事就能融资;2026 年这一轮,你得证明自己能造血,这个信号,传给了所有还在牌桌上的人。

第三件,海外那两个样本,太扎眼了。

Anthropic 的 Claude Code,2025 年 5 月正式公开发布,11 月做到 10 亿美元年化,2026 年 2 月冲到 25 亿美元。三个月翻一倍多。

这速度,当年 Salesforce、Workday、ServiceNow 那些后来千亿美金的 SaaS 公司,谁都没跑出来过。

更猛的是 Cursor,TechCrunch 4 月 17 号刚报,Cursor 正在以 500 亿美元估值融资,比去年秋天的 293 亿几乎翻了倍。今年 2 月它年化收入 20 亿,公司内部预计到年底能干到 60 亿。

两个样本摆在那儿,信号很清楚;一个靠卖 Token 赚溢价,一个靠做订阅赚续费,两条路都跑通了。于是国内这几家公司集体转身,各自盯上了其中一条。

不过,在往下看之前,得先把这两条路拆开看一眼;一条是 Anthropic 走的,做底座、卖 Token、赚溢价;一条是 Cursor 走的,做工具、做订阅、收续费,两条路的终点都是钱,但脚下的土壤完全不一样。

先从 Cursor 说起,因为它是国内几家讨论最多、对标最密集的那个样本。

Cursor 到底是什么?

了解过的人都知道,这家公司走得挺曲折;AI 编程刚火那阵,Cursor 是顶流明星,一个 IDE 插件做到几十万日活;后来 Claude、ChatGPT 把编程功能嵌进自己产品里,还免费给用户用,Cursor 的数据一下被打下来了。

那时,业内好多人都觉得它要凉了。巨头亲自下场,谁还会用一个套壳工具啊?

结果它不光没凉,反而涨回来了,还涨得比以前更猛;它靠什么?我觉得关键在它脚下那片土壤,海外这片地,有三样东西,是中国没有的。

第一样,愿意掏钱的开发者基本盘。

这事在国内看可能有点反直觉,在美国真的太常见了;从几十年前 JetBrains 那会儿开始,写代码的人每年自己掏几百美元买 IDE,就跟设计师买 Photoshop、会计师用 Excel 一样,天经地义。

工具是他们的吃饭家伙,花钱买好用的,没人觉得奇怪,这个习惯一直传到现在;你看 GitHub Copilot 每月 10 美元,JetBrains AI 助手每月 20 美元,大家都觉得合理。

Cursor 定价 20 到 200 美元一个月,放在这个环境里就很正常。一个全职开发者一年工资十几万美元,花一两千美元买工具,连 1% 都不到。

用着顺手就续费,不顺手就换,但绝不会为了省钱去用盗版,这就是 Cursor 的基本盘,几百万愿意每月为工具付费的开发者。

第二样,走通了二十年的企业采购流程。

海外企业早就把「按席位订阅软件」这套玩法走通了,这模式是 Salesforce 开创的,1999 年上线以后,企业软件就从「一次性买断加每年服务费」,变成了「按人头按月付费」。

后来 ServiceNow、Zoom、Slack、Notion、GitHub,一家接一家,全走这条路;走了二十年,企业的 IT 采购流程、财务审批、预算科目、续费机制,全按这套模式搭好了。

举个例子你就懂了:

公司招个新工程师,HR 给他开账号的时候,顺手就把 Cursor 的席位加上,钱从 IT 预算里走,CFO 根本不用专门审批。到年底续费,财务看一眼使用率和留存率,直接就续了。

这套流程最值钱的地方在哪呢?它把企业付费从「一件要专门决策的事」,变成了「一个默认动作」。

Cursor 卖给企业时,相当于接了一条已经在正常流转的管道,省了太多麻烦。现在它 60% 的收入都来自企业客户,就是从这条管道流过来的。

第三样,分工明确的三层生态。

海外 AI 编程有一套完整的分层生态,各司其职,互不越界,上游是 Anthropic、OpenAI 这些底座模型公司,专门负责把模型训练好、把 API 做好。

中游是 Cursor、Windsurf 这些编程工具公司,负责把模型包装成开发者用着顺手的产品,下游是几千万开发者和几十万家企业,是最终掏钱的人。

这三层谁也不抢谁的饭碗,Anthropic 赚 Token 结算的钱,Cursor 赚订阅费,下游拿到好用的工具。三方都能获利。

这个生态能跑起来,核心是 Anthropic 这种底座公司主动选择了「只做底座」;它把 API 开放出来,让 Cursor、Windsurf,甚至做文档、做测试、做客服的公司,都能接它的模型去赚自己的钱。

它不抢下游的生意,下游才敢放心把产品建在它的基础上。

最后就形成了一个正向循环,Anthropic 越开放,下游生态越繁荣;下游生态越繁荣,调用它 API 的需求越大,Anthropic 的 Token 生意就越好。

三样东西叠在一起,才长出了 Cursor,所以你看,Cursor 不止一个产品,是一套环境里长出的果实。

那国内这片地上,能长出同样的东西吗?六家公司怎么下注?

智谱赌「付费习惯能被教育出来」,这半年智谱路子很明确,砍掉了其他业务线,把全部资源压在 GLM Coding Plan 这一条腿上。

2025 年底推出时,套餐月费最低才 3 美元,海外媒体还特意给它起了个外号,叫「3 美元版 Claude Code」。结果不到半年,连涨了三次价。

2 月 12 号 GLM-5 发布,整体涨幅 30% 起。3 月 16 号 GLM-5 Turbo 出来,又涨 20%。4 月 8 号 GLM-5.1 发布,再涨 10%。最高档直接从 80 美元涨到 160 美元,几乎翻倍。

智谱 CEO 张鹏在财报电话会上说,一季度接口调用价格涨了 83%,但调用量还是增长了 400%。

敢这么连涨还能保住用户,意思很明显,智谱想用这组动作证明一件事:国内开发者,也愿意为好用的 Coding 工具持续买单。

MiniMax,它赌「三条腿走路」;过去的底子是 C 端,靠两亿用户堆出了一套流量打法。今年它做了个关键动作,挖来了华为云原中国区副总裁、现新加坡总经理胡维琦。

这个位置要的不是懂 C 端流量的人。

华为云那套打法你可能有所耳闻,派专门的服务团队住进客户现场,跟着客户的实际业务做深度定制,把每一个央国企客户都当成十年的生意来经营。

这步棋很关键,相当于 MiniMax 跟自己说,C 端的底盘不能丢,但得再练一套 B 端的功夫,这个过程,最快也得一两年起步。

与此同时,AI 编程这条线它也没让出去;智谱的 GLM Coding Plan 跑出订阅模式之后,MiniMax 在模型和 Agent 上明显加大了压注力度,瞄的就是开发者这个赛道。

C 端、B 端、开发者,三条腿同时伸出去,哪条先跑通就压哪条。

阿里赌的最大,它赌「规模能碾压所有对手」。

3 月 16 号,吴泳铭亲自下场,成立了 ATH 事业群,把通义实验室、MaaS 业务线、千问事业部、悟空事业部、AI 创新事业部全合到一起。

CEO 亲自挂帅,核心动作很直接,把 AI 业务的目标从「卖算力」改成了「卖 Token」。

但阿里这一轮真正值得琢磨的,不止底座这一边;阿里云同时在变阵,上层应用这条线也在加码,悟空、秒悟这些 AI 产品一个接一个推出来。

产品表面看是应用,往里拆其实都是一个个 Agent,主要服务开发者和效率工作者这波人。

阿里算盘很清楚,上层应用用得越多,底座 Token 消耗就越大;底座 Token 卖得越便宜,上层应用就越能铺开;两头互相带动。

这个打法的逻辑特别朴素。我家底厚,人多,资源调度快,只要方向没错,就用规模碾压对手。

字节走得最早,它赌「MaaS 生态能自己滚起来」。

Seed 在 2023 年底就独立建制了,到现在跑了两年多,搭出了一套三层结构。Seed 管模型,Flow 管产品,火山引擎管商业化。

数据摆在这儿;IDC 的数据,2025 年上半年中国公有云大模型调用量,火山引擎占了 49.2%,超过第二、第三位的阿里云和百度智能云加起来还多。

字节押生态逻辑;我模型够便宜,平台够好用,调用量就会自己涨;调用量涨了,上下游玩家就会围过来;玩家多了,生态就能自己养活自己。这个飞轮一旦转起来,会特别快。

DeepSeek 有点不一样,它看着最没动作,动作可能最重。

目前能拿到的消息,它在死磕国产芯片适配;V4 版本优先给华为昇腾和寒武纪做预发布,要从英伟达 CUDA 生态,硬生生切到华为 CANN 框架。

这条路代价太大,节奏会明显变慢;V4 从 2 月一直推到 4 月,还在隐身测试,市场对它的预期一直在往下调。它看起来像那个「掉队」的人。

但换个角度想,这条路也保住了一样别人都在放弃的东西,当其他家都绑死在英伟达和 Token 订阅的路子上时,DeepSeek 还有别的选择,它赌跑得快的未必能赢,留得住选择权的人,才能笑到最后。

还有一家,走了一条完全不同的路。

百度 2025 年 AI 业务收入 400 亿,其中 AI 云基础设施 198 亿,同比增长 34%。但百度似乎根本不在意 Token 订阅这门生意。

它走全栈路线。底层自己做芯片 ( 昆仑芯 ) ,中间做模型、训练平台,往上做智能体、应用,从下到上一整条链,全是自己攒的。

客户主要是金融机构、央国企、政府、大型制造业,一套打包方案卖给你,这玩法,跟其他五家完全是两个物种。

六家大厂,看着同一件事,动作天差地别;智谱、MiniMax、阿里、字节、DeepSeek,五种不同的赌法,百度干脆说「我躺平做 TOB 生意就够了」。

那问题来了,这么多种押法,到底哪种能押中?或者换个问法。卖 Token、做订阅这条路,到底学不学得会?

答案很明确。短期内,学不来。国内这片地上,长不出一模一样的东西,听着有点绝对,你跟着我拆一下就明白了。

第一道坎,国内开发者不愿意掏钱。

过去二十年,中国互联网的默认玩法是「免费」。从早年下载盗版软件,到后来找开源替代品,再到现在用破解版、白嫖免费版,写代码的人早就习惯了「工具不花钱」这回事。

你让他每月掏 20 美元买工具,他第一反应,为啥要花这个钱?有没有免费的?

这种本能,二十年攒下来的肌肉记忆,改变需要时间。

Cursor 定价逻辑,放在美国没毛病;搬到中国,一个标准档位的费用差不多能吃掉初级工程师小半天的饭钱。与其花这个钱,他宁可花半小时去 GitHub 上找个免费替代品。

这是第一头拦路虎。更扎心是第二道坎,海外位置早就被占死了。

肯定有人会想,国内做不通,做出好模型卖到海外不就行了?海外开发者有钱、愿意付费,去赚他们的钱不好吗?

不行。位置轮不到你。

3 月底,Cursor 发了新一代编程模型 Composer 2,宣传语吹得挺唬人,叫「前沿级编程智能」;博客里压根没提它的底座是谁。

三天后就被开发者扒出来了,Composer 2 底座是 Kimi K2.5,藏都没藏干净;月之暗面预训练负责人杜宇伦在 X 上确认了,双方通过 Fireworks AI 平台有授权合作。

这事本身没啥瓜可吃,开源模型被二次训练、重新包装,行业里本来就是常态。

值得你多琢磨背后的账本,据《财富》的报道,Cursor 在 ARR 5 亿美元时,每年付给 Anthropic 的推理费大约 6.5 亿美元。

每一块钱订阅费,背后的成本超过一块钱,一直在赔本赚吆喝;直到把 Kimi 这种便宜的中国模型接进来,压下推理成本,才在企业客户那端实现了微薄的正毛利。

你品品这个账,品牌挂 Cursor,订阅费全归 Cursor,500 亿美元估值也归 Cursor。那 Kimi 在里面扮演啥角色?就是个按 Token 结算的底座供应方,而且是「更便宜的那一个」。

一个估值 500 亿美元的编程工具,靠压低上游中国供应商的价格,才救活了自己的毛利;这就是海外下游生态对国产模型的定价方式。海外的赢家吃肉,中国的供货商喝汤。

第三道坎,Token 已经卖不出价钱了。说到这,肯定有人要反驳。OpenRouter 上国产模型不是霸榜了吗?前五里占四席,这还不算赢?

算赢,但只赢在调用量,没赢在收入。

OpenRouter 是聚合平台,开发者拿一个 API Key,就能在所有模型之间自由切换,哪个便宜用哪个;调用量大,只能说明海外开发者在频繁试用你;跟背后有没有稳定的付费用户,完全是两码事。

Cursor 拿国产模型当底座能赚大钱,因为它有几千万订阅用户。国产模型在 OpenRouter 上调用量再大,最终把订阅费变成真金白银的那一步,还是被海外生态收走了。我们看似参与了,只赚了点零头。

那品牌就品牌呗,做底座生意也挺好,卖 Token 照样赚钱。

这恰恰是最要命的地方。

Claude Code 能跑通订阅制,前提很简单;Anthropic 的 Token 能卖溢价;Claude Opus 的输出价 25 美元每百万 Token,靠这个单价,它能覆盖推理成本、训练成本,还能剩下毛利。订阅制的账才算得通。

再看国内。从 2025 年下半年开始,Token 价格就被字节和阿里卷到地板价了。字节豆包进入「厘计价」时代,阿里千问主力模型降价 97%。

具体到编程模型,差距更吓人。MiniMax M2.5 输出价 1.2 美元每百万 Token,智谱 GLM-5 也就 3.2 美元。同样一百万 Token,Claude 能卖 15 到 25 美元,国产模型只能卖 1 到 3 美元。

你想想这差距意味着什么。

Claude Code 的订阅制商业模型,直接搬到中国来复刻,地基就少了五分之四。

订阅制的账很朴素,用户每月给你付 X 块钱,你拿这笔钱覆盖推理成本,剩下的就是毛利。

Anthropic 能做到,因为它 Token 单价够高,订阅费减掉推理成本还有剩余;国内 Token 单价只有它的 1/5 到 1/12,同样一份订阅费,光推理成本就快不够覆盖了。

上游已经卷成红海,下游付费端还没长起来,中间这段,根本挤不出利润空间。

三道坎挡在前面,产品能学得来,土壤学不来。最后能学成啥样?

大概率是这样一幅画面:六家都把 Cursor、Claude Code 的中间层各做一遍,国内市场里互相卷;底座那头,Token 价格被卷到地板,规模做大,毛利做薄,每一分钱都得从石头里榨出来。

这就是 Token 经济真实的天花板。

相关标签
科技频道

科技频道

科技改变世界

订阅

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容