中国智算行业正在同时经历两件矛盾的事:算力越来越贵,但 Token 越来越便宜。
一面是算力需求溢出,国内优质算力资源持续紧张,价格自今年春节前已涨超 50%,有渠道商反映,部分热门算力卡型号 " 不是贵的问题,是根本拿不到 ";国内外的智算中心疯狂堆算力,甚至要靠签远期合同锁定。
但另一面是 Token 价格崩塌,两年前每百万 token 要几十美元,现在不到一美元,主流大模型厂商为了争用户,几乎在做赔本的生意。行业内有观点认为,当前以超低价争夺用户的模式,长期来看可持续性存疑。
这说明大模型产业发展的早期,还没有找到多赢的方式,也注定是不可持续的商业模式。当芯片厂商拿走了 60% 以上的利润,做应用的几乎没有定价权,中间层的智算云,顶着上游的成本压力,也要面对下游客户不断压价。

训练侧的逻辑,撑不起推理侧的账
过去三年,智算行业卖出了一个共同的故事,谁有卡,谁就赢。
这个逻辑在训练侧是成立的,大模型竞赛本质是算力竞赛,一个 1 万卡集群和一个 10 万卡集群能训出来的模型根本不在同一天花板。
九章云集创始人方磊透露,九章云极目前收到的远期订单是自身可交付容量的 10 倍以上,锁定资源的定金比例最低只有 5%,但若同时锁定价格则需要 30% 到 40% 的定金。
但推理侧的生意,早就跑在了一条完全不同的轨道上。全球范围内,Token 单价持续降低,底层的算力成本却并没有同步下降,能耗、折旧、网络,每一笔都是真实支出。
问题还不止于此,智算中心的算力利用率普遍不高,根本原因在于网络传输本身成为了瓶颈。在大规模训练集群里,数万块加速卡需要频繁同步数据,任何网络延迟都会让大量算力陷入等待。
此前有业内人士指出,千卡级训练中通信时间占比可达 30% 以上,在超大规模场景下甚至高达 50% 至 70%,scale up(单机多卡)和 scale out(多机组网)之间的效率鸿沟,是从训练工厂移植过来、天然无法消除的技术债。
如上所述,产业链的利润分配结构也是问题,上游芯片厂商吃掉了整条链路 60% 以上的价值,中游云厂商在 CPU 时代的净利润率大约在 35%,但在 AI 时代,算力成本占到运营支出的七八成,毛利空间被双向挤压。
银河证券分析师吴砚靖称,Token 经济的定价权目前仍集中在上游,中游是效率放大器,下游暂时没有话语权。换而言之,中下游的景气度改善需要等待上游产能充分释放之后。
硬件供给侧同样受限,国产 AI 芯片产能不足,是当前最薄的那块木板。
国内方面,还多了一层算电协同的复杂性,业内人士提到,绿电直供有 60 到 80 公里的物理传输上限,一旦上高压就要缴纳 " 过路费 ",而且光伏夜间不发电,风电功率曲线波动剧烈,和智算中心希望的恒定功率曲线严重错位,储能配比超过 15% 就开始亏本。
当前算电协同还有待更多突破,包括绿电直供能否通过高压更远传输,水电和核电能否纳入绿电认定,甚至绿证价格本身也在持续上涨,今年以来已涨了近一倍。
现在谈 Token 工厂,时机上既不早也不晚,早了基础设施不成熟,晚了就错失机会窗口。

云计算行业已经很久没有新的挑战者,即便 AI 带来了全新的变量,但云计算所需要的规模和资金,依然是现实的护城河,一些企业极却给出了一个让人意外的答案。
" 九章非常重要的定位,是走出一条与互联网大厂云不同的路——做算力赛道的‘第三方选择。" 方磊所说的大云,是阿里云和火山引擎,阿里云和火山引擎背后是两家年收入数千亿的互联网巨头,九章云极至今仍是一家创业公司,这种反差,怎么看都有些错位。
他认为,大云有大云的结构性特点,那些在互联网时代成长起来的云厂商,底层架构是为带宽和存储优化的,AI 时代 90% 的成本是计算,100G 的老交换机和为 AI 专门设计的 400G 交换机之间,效率差距难以弥合。新的云计算平台跑同样一张英伟达 GPU,在特定场景下效率优势显著,这是历史包袱决定的。
事实上,行业内存在一种 " 算力贸易 " 模式——买一批服务器放进机房,租给客户,自己没有调度能力。
在方磊看来,现货倒卖,客户应该签远期订单才能拿到资源,资产是自己控制的——一些与互联网大厂存在竞争关系的企业,在选择算力平台时会优先考虑中立方案——这正是第三方云存在的理由。
训练工厂对应零到一的模型制造,目标是在未来 24 个月内形成 10 万 P 的训练算力,方磊判断,下一代前沿模型的突破,要靠 30 万卡甚至更大的集群才能跑出来,而这样的超大规模基础设施仍在建设过程中。
Token 工厂对应一到 N 的规模化交付,目标是每天 10 万亿 token,但这 10 万亿不是通用 token,而是面向专业场景的 " 专业级 " 和 " 前沿级 "。方磊将 token 市场分成三层:消费级(每百万 token 约 1 美元)、专业级(每百万 20 到 40 美元)、前沿级(每百万 150 美元以上)。
九章的战略锚定在后两层,帮助客户训练专业模型,再通过 Token 工厂低成本交付专业 token。他的逻辑是,千行百业里真正能让 AI 落地的,不是通用大模型,而是垂直专业模型," 没有专业模型,所谓‘ AI+ 行业’就只是一句口号 "。
具体落地上,九章云极计划合作超过 1000 家专业模型厂商,资产端则复制了一种基础设施行业常见的轻资产模式:央国企出资持有资产,九章负责运营,按比例分成。
此外,九章云极已在东南亚、日本、中东及欧洲多地进行布局,将中国方案定位为 AI 基础设施的 " 第二选项 "。这背后的逻辑是:上一轮云计算,欧洲和日本几乎全面依赖美国技术栈,当前 AI 时代各国对 " 主权云 " 的诉求空前强烈,中国的模型能力、成本优势和不依附于美国供应链的属性,正好填上了这个缺口。(本文作者 | 张帅,编辑 | 杨林)