关于ZAKER 合作
钛媒体 37分钟前

当 Token 成为产业共识,火山引擎的好消息和坏消息

120 万亿。

这是豆包大模型现在的日均 Token 消耗量,在全球范围仅次于 OpenAI 和谷歌。三个月前,这个数字还是 63 万亿,过个春节翻了一倍,如果时间线放到两年前,增速是一千倍。

也无怪乎没人再讨论 AI 泡沫,在 Token 消耗量那条急速上昂的曲线面前,对大模型需求的一切质疑都显得不合时宜,2026 年是产业的 "Token 共识之年 ",对于火山引擎来说,即是好消息,也是坏消息。

好消息在于,大模型产业的走向证明了火山引擎战略的正确性。过去两到三年,在所有关于 MaaS 和 Token 的产业叙事中,火山引擎始终是最激进的一个,这被解读为后来者面向先行者的挑战机会,尽管其他头部云厂商或多或少提及 MaaS 的商业模式,但是大船掉头的思维和战略惯性,导致这些厂商并没有彻底转向新的 Token 逻辑。

当 AI Agent 运行规模与任务复杂度同步提高,以 OpenClaw 为代表的各类 " 龙虾 " 智能体产品,极大推升了 Token 消耗的天花板,加之视频、音频等模型的调用,相较文字对话的 Token 消耗也有指数级的增长,因此所有厂商都加大了 MaaS 商业模式的投入。

坏消息在于,火山引擎要直面比以往更激烈的竞争,当所有厂商都达成共识,被行业诟病的 Token 商业粘性差、毛利低的问题,也就暴露在直白的商业竞争之下,甚至可能掀起新一轮的行业价格战。

火山引擎的策略是什么?

120 万亿 Token,花在哪了?

火山引擎总裁谭待指出,Token 使用量是衡量 AI 发展速度的核心指标,近期豆包大模型使用量高速增长,核心驱动因素是 AI 视频创作的爆发与 AI 智能体的加速普及。

第一个是视频创作的爆发。Seedance 2.0、Seedream 5.0 lite 等多模态模型的推出,让视频创作相关的 Token 消耗大幅增长。这不再是某个特定行业的需求,而是跨行业的普适应用,所有行业都有营销、传播的需求,视频内容是最好的载体。

在本次大会上,火山引擎宣布 Seedance 2.0 API 面向企业用户开放公测。据介绍,火山引擎为 Seedance 2.0 建立了行业领先的版权与肖像安全保障,覆盖视频生成涉及的各种模态和创作前后全流程,对侵权、深度伪造等行为进行检测和防御,有效保护版权方和创作者的权益。

第二个是龙虾类智能体的普及。这个在一个月内迅速走红的 AI 产品,正在改变企业 AI 的使用方式。

谭待表示,现在很难把龙虾带来的 Token 消耗归到某个特定行业或场景。一年前大家还会按行业划分 AI 的应用,现在龙虾的普及,让每个员工都能使用,有人用它做招聘,有人用它做市场分析,有人用它处理周报,所以无法单一定义其应用场景。

" 这也印证了我们的逻辑,AI 的发展既要自上而下,也要自下而上,自下而上就是让员工都能使用 AI,ArkClaw 这类产品就非常适合;自上而下则是像 HiAgent 这类产品,二者结合能让企业的 AI 创新和转型速度大幅提升。" 他补充道。

由此也引出企业使用 AI 的两种方式,谭待认为,企业 AI 未来会有敏态和稳态两种形态,敏态以员工为导向,支持广泛尝试,比如通过 ArkClaw 产品,员工能探索招聘等问题的解法,这就是敏态。

当尝试出有效方法后,可通过 HiAgent 产品将方法固化,转为稳态业务。稳态业务能关注稳定性、准确率和成本问题,还能优化路径、选择不同尺寸和能力的模型,从而降低成本。

" 企业真正关注的是端到端完成事情的整体成本,而非单 Token 成本,若单 Token 成本低,但用较差的模型需要消耗 10 倍甚至 20 倍 Token 还做不出结果,只会造成浪费。" 谭待说。

Token 会不会涨价?

摩根士丹利在 3 月份研报中指出,云计算一直是价格通缩的行业,规模越大,成本越低,价格就越向下。但是,AI 时代正在打破这一范式,一个前所未有的提价周期正在酝酿,中国 AI 云定价将开启 20 年来首次上调周期。

其同时也指出,不同于全球市场云厂商已开启涨价周期,中国市场具备两个独有制约因素,一是不同厂商对于市场份额的优先级不同,相应定价策略可能压制行业整体提价空间;

二是中国缺乏类似 OpenAI 这样对算力需求极度旺盛的独立基础模型提供商,使得供应端成本压力向下游定价的传导效率相对弱于美国市场。

谈及涨价话题,谭待的回应很直接,首先涨价只是部分厂商的行为,也有厂商在降价。更重要的是,Token 的价值不同,价格自然也不同。" 下一代模型能力更强,单 Token 成本理论上会更贵,但单 Token 产生的经济价值也会更高。"

此外他还表示,一些场景下 Token 价格高,关键不在 Token 本身贵,而在无效 Token 消耗太多。" 目前龙虾使用的 Tokens,有一大半都是无谓的探索。通过优化 skill 配合、压缩等方法,能减少这类无谓的投入消耗,成本也会大幅降低。"

图片来自 AI 生成

三年前没人用模型,大家只能讲模型参数;之后开始讲用量,因为模型能力还有限,能做的案例也比较简单,当时企业也在探索如何通过模型赚钱。

现在的趋势是,不少企业已经找到了用模型创造更大经济价值的方法,比如用 Seedance 2.0 能以低成本、高效率制作内容,在广告营销、内容制作上获得更多收入。一旦这个商业逻辑跑通,企业对模型的要求就会转向价值导向,关注模型能否创造更大价值、解决实际问题,这能推动行业建立正循环,也是企业现在最核心的关注点。

近期国内阿里云、百度云等厂商先后宣布 AI 相关算力产品涨价公告,火山引擎等厂商则保持价格不变,反映出不同厂商的策略以及资源储备不同。

谭待指出,豆包每一代模型的定价都经过精心设计,定价后基本保持不变,若结合模型的智力水平看,单 Token 的价格实际在下降,因为软硬件层面的优化一直在推进,而模型的智力上限却在持续提升,看 Token 价格,不能抛开模型能力,否则没有任何意义。

赛博养虾三要素

龙虾火了之后,一个问题困扰着很多企业客户:推出龙虾后,原有工作该如何开展?

谭待提出的敏态和稳态思路,为这个问题提供了解决方案。但要让龙虾真正在企业落地,还需要三个关键要素:模型、安全和 Skills。

" 模型是核心,决定了智能体能力的上限和下限。" 谭待说,豆包 2.0 针对 Agent 场景做了很多优化,尤其是在 VLM 能力上,在视觉理解、计算机视觉、机器人视觉方面表现很好。

安全是第二个要素,也是用户关注的核心。随着 OpenClaw 使用量的提升,有很多问题,比如沙箱与权限失控、提示词注入、Skills 插件投毒等安全问题不断出现,实际上 Openclaw 有一套安全设计的机制,完全可以通过更好的产品化设计,和现有安全方案的结合,尽可能的完善龙虾的安全机制。

火山引擎 ArkClaw 针对 Agent 权限管理和 Skills 全流程安全防护做了全面升级,也正式通过了信通院有关 " 龙虾 " 类产品的可信能力认和安全防护产品有效认证,是国内首家、也是目前唯一一家同时斩获这两项认证的厂商。

第三个要素是 Skills 的开放,决定智能体执行能力边界的要素,正在成为各家竞争的焦点。谭待表示,大家使用 OpenClaw,核心看中的是其全球开放的生态。

本次大会上,火山引擎宣布和 OpenClaw 共建 "ClawHub 中国镜像站 ",而非做私有的生态。通过中国官方镜像网站,开发者可以提供更友好的使用体验,不用担心高频访问源站即时性和稳定性问题。

谈及龙虾这条路线是否是 AGI 过程中的真正转折点,还是可能在半年甚至一年后被更先进的方式取代,谭待给出了一个类比:

" 电脑是伟大的发明,但软盘在电脑发展史上的地位,很难定义是转折点还是阶段性产物。OpenClaw 的相关技术对行业产生了巨大影响,但未来到了 AGI 时代,再回看它的定位,是像软盘一样的阶段性产物,还是有更高的地位,现在很难判断。"

一年前,谭待曾用马拉松作比喻,AI 行业大概跑了 500 米,现在,他判断这个距离变成了一公里。

" 判断行业阶段可以用终局来倒推,目前 OpenAI、Anthropic 等企业的收入是已知的,全球行业收入大概是这些企业收入的三倍,结合对未来收入的想象空间,就能判断行业的发展进度。"(本文作者 | 张帅,编辑 | 杨林)

相关标签

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容