APP下载

关于ZAKER

Skills 合作

钛媒体 16分钟前

算力荒，但 Token 却便宜了，智算云的账该怎么算？

中国智算行业正在同时经历两件矛盾的事：算力越来越贵，但 Token 越来越便宜。

一面是算力需求溢出，国内优质算力资源持续紧张，价格自今年春节前已涨超 50%，有渠道商反映，部分热门算力卡型号 " 不是贵的问题，是根本拿不到 "；国内外的智算中心疯狂堆算力，甚至要靠签远期合同锁定。

但另一面是 Token 价格崩塌，两年前每百万 token 要几十美元，现在不到一美元，主流大模型厂商为了争用户，几乎在做赔本的生意。行业内有观点认为，当前以超低价争夺用户的模式，长期来看可持续性存疑。

这说明大模型产业发展的早期，还没有找到多赢的方式，也注定是不可持续的商业模式。当芯片厂商拿走了 60% 以上的利润，做应用的几乎没有定价权，中间层的智算云，顶着上游的成本压力，也要面对下游客户不断压价。

在行业人士看来，更根本的问题是，现在撑着整个行业运转的硬件，本质上是为训练设计的，拿来跑推理、生产 Token，就像开着法拉利送外卖，成本结构从一开始就对不上。

训练侧的逻辑，撑不起推理侧的账

过去三年，智算行业卖出了一个共同的故事，谁有卡，谁就赢。

这个逻辑在训练侧是成立的，大模型竞赛本质是算力竞赛，一个 1 万卡集群和一个 10 万卡集群能训出来的模型根本不在同一天花板。

九章云集创始人方磊透露，九章云极目前收到的远期订单是自身可交付容量的 10 倍以上，锁定资源的定金比例最低只有 5%，但若同时锁定价格则需要 30% 到 40% 的定金。

但推理侧的生意，早就跑在了一条完全不同的轨道上。全球范围内，Token 单价持续降低，底层的算力成本却并没有同步下降，能耗、折旧、网络，每一笔都是真实支出。

问题还不止于此，智算中心的算力利用率普遍不高，根本原因在于网络传输本身成为了瓶颈。在大规模训练集群里，数万块加速卡需要频繁同步数据，任何网络延迟都会让大量算力陷入等待。

此前有业内人士指出，千卡级训练中通信时间占比可达 30% 以上，在超大规模场景下甚至高达 50% 至 70%，scale up（单机多卡）和 scale out（多机组网）之间的效率鸿沟，是从训练工厂移植过来、天然无法消除的技术债。

如上所述，产业链的利润分配结构也是问题，上游芯片厂商吃掉了整条链路 60% 以上的价值，中游云厂商在 CPU 时代的净利润率大约在 35%，但在 AI 时代，算力成本占到运营支出的七八成，毛利空间被双向挤压。

银河证券分析师吴砚靖称，Token 经济的定价权目前仍集中在上游，中游是效率放大器，下游暂时没有话语权。换而言之，中下游的景气度改善需要等待上游产能充分释放之后。

硬件供给侧同样受限，国产 AI 芯片产能不足，是当前最薄的那块木板。

国内方面，还多了一层算电协同的复杂性，业内人士提到，绿电直供有 60 到 80 公里的物理传输上限，一旦上高压就要缴纳 " 过路费 "，而且光伏夜间不发电，风电功率曲线波动剧烈，和智算中心希望的恒定功率曲线严重错位，储能配比超过 15% 就开始亏本。

当前算电协同还有待更多突破，包括绿电直供能否通过高压更远传输，水电和核电能否纳入绿电认定，甚至绿证价格本身也在持续上涨，今年以来已涨了近一倍。

现在谈 Token 工厂，时机上既不早也不晚，早了基础设施不成熟，晚了就错失机会窗口。

做运营商，不做中间商

云计算行业已经很久没有新的挑战者，即便 AI 带来了全新的变量，但云计算所需要的规模和资金，依然是现实的护城河，一些企业极却给出了一个让人意外的答案。

" 九章非常重要的定位，是走出一条与互联网大厂云不同的路——做算力赛道的‘第三方选择。" 方磊所说的大云，是阿里云和火山引擎，阿里云和火山引擎背后是两家年收入数千亿的互联网巨头，九章云极至今仍是一家创业公司，这种反差，怎么看都有些错位。

他认为，大云有大云的结构性特点，那些在互联网时代成长起来的云厂商，底层架构是为带宽和存储优化的，AI 时代 90% 的成本是计算，100G 的老交换机和为 AI 专门设计的 400G 交换机之间，效率差距难以弥合。新的云计算平台跑同样一张英伟达 GPU，在特定场景下效率优势显著，这是历史包袱决定的。

事实上，行业内存在一种 " 算力贸易 " 模式——买一批服务器放进机房，租给客户，自己没有调度能力。

在方磊看来，现货倒卖，客户应该签远期订单才能拿到资源，资产是自己控制的——一些与互联网大厂存在竞争关系的企业，在选择算力平台时会优先考虑中立方案——这正是第三方云存在的理由。

训练工厂对应零到一的模型制造，目标是在未来 24 个月内形成 10 万 P 的训练算力，方磊判断，下一代前沿模型的突破，要靠 30 万卡甚至更大的集群才能跑出来，而这样的超大规模基础设施仍在建设过程中。

Token 工厂对应一到 N 的规模化交付，目标是每天 10 万亿 token，但这 10 万亿不是通用 token，而是面向专业场景的 " 专业级 " 和 " 前沿级 "。方磊将 token 市场分成三层：消费级（每百万 token 约 1 美元）、专业级（每百万 20 到 40 美元）、前沿级（每百万 150 美元以上）。

九章的战略锚定在后两层，帮助客户训练专业模型，再通过 Token 工厂低成本交付专业 token。他的逻辑是，千行百业里真正能让 AI 落地的，不是通用大模型，而是垂直专业模型，" 没有专业模型，所谓‘ AI+ 行业’就只是一句口号 "。

具体落地上，九章云极计划合作超过 1000 家专业模型厂商，资产端则复制了一种基础设施行业常见的轻资产模式：央国企出资持有资产，九章负责运营，按比例分成。

此外，九章云极已在东南亚、日本、中东及欧洲多地进行布局，将中国方案定位为 AI 基础设施的 " 第二选项 "。这背后的逻辑是：上一轮云计算，欧洲和日本几乎全面依赖美国技术栈，当前 AI 时代各国对 " 主权云 " 的诉求空前强烈，中国的模型能力、成本优势和不依附于美国供应链的属性，正好填上了这个缺口。（本文作者 | 张帅，编辑 | 杨林）

查看原文

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

ZAKER旗下免费视频剪辑工具

企业资讯

查看更多内容

Blockchain News

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

算力荒，但 Token 却便宜了，智算云的账该怎么算？

宙世代

一起剪

相关阅读

老旗舰满血复活！小米14系列电池升级服务官宣：预计第四季度上线

中国移动董事长陈忠岳：将构建一体化算力网 布局超大规模智算中心

SSD容量4倍提升！三星冲刺1000层NAND

AI电力系统演进，或将重塑算力竞争格局

16针电源线亮了！不是着火 而是ARGB

英伟达遭起诉！原告索赔约1.23亿元

豆包专业版正式上线，最高一年6000元，将提供教育优惠

立时集团研发“超黑涂层”：让黑色汽车吸收99.9%可见光

天马宣布供屏荣耀X80 Pro Max：行业最高10000nits局部峰值亮度

一句话操控NAS！全球首个AI原生NAS操作系统铁威马TOS7上线

iPhone刷公交地铁更方便！支付宝宣布三城交通卡接入苹果钱包

华为轮值董事长汪涛：全球5G用户已超31亿，倡议共同定义面向未来十年的移动通信网络

消费前怎么避坑？黑猫瞄一眼功能帮你提前排雷

中国移动董事长陈忠岳：人工智能不应只服务于少数精英，AI打开了运营商行业发展天花板

最新评论

钛媒体

热门推荐

企业资讯

中国移动董事长陈忠岳：将构建一体化算力网布局超大规模智算中心

16针电源线亮了！不是着火而是ARGB