文 | 窄播,作者 | 李威(北京)
这是《窄播 weekly》的第 89 期,本周我们关注的商业动态是:豆包开始筹划付费,国内头部 AI 助手的竞争要从免费的 Chatbot 阶段进入到付费的 Agent 阶段了。
5 月 4 日,豆包的 App Store 页面出现了订阅服务声明,在免费的基础版之外,增加了三个付费版本:标准版连续包月每月 68 元,连续包年每年 688 元;加强版连续包月每月 200 元,连续包年每年 2048 元;专业版连续包月每月 500 元,连续包年每年 5088 元。

在付费声明发布之前,《见实》就已经发现豆包在移动端开始灰度隐藏 PPT 生成、长文档 AI 排版、Word 一键美化等复杂任务场景的入口,同时还在移动端下线了 AI 思维导图生成、流程图自动排版的入口。这种针对移动端的功能下线,可以被看作是对任务场景进行的预先分层。
很明显,豆包走向付费是消费端 AI 业务发展的一个分水岭。
过去豆包虽然在基于一个 Chatbot 不断增加新的 AI 能力,但用户与豆包的交互大部分还是集中在聊天、搜索等对话场景中,缺乏高价值的付费功能,难以打破中国用户的免费思维。并且,因为对话场景的 Token 消耗可控,大厂还能坚持采用互联时代的先免费圈地,再规划商业模式的思路。
但面向未来,对话成为标配,执行任务有了更强吸引力。豆包这样的通用 AI 助手事实上需要与 OpenClaw 类产品进行博弈,争夺大众用户而不是开发者用户。这也意味着,豆包需要具备相应的能力,来满足大众用户不是那么高频出现的生产力需求,以此保证大众用户不会投入到 OpenClaw 类产品的怀抱,进而跑出新的竞争对手。
这个判断有一个前提是,中国用户也将开始习惯于为生产力场景中的 AI 服务付费。无论是在豆包中,还是在 OpenClaw 类产品中,AI 完成生产力场景中的任务基本都需要依托于一套建立在 AI Coding 上的 Agent 能力底座。这套底座才是未来留存用户、让其付费的基础。
豆包进行的付费尝试是与这套能力底座相匹配的。通过梳理消费端 AI 业务,豆包会对用户需求进行分层,将更耗费算力、成本更高的生产力场景抽离出来,按照不同层级调用这个 Agent 底座的能力,并付出相应的费用。
AI 的商业模式遇到了挑战
豆包提出付费模式,是为了应对 Token 用量的大规模爆发,提前铺设一个可量化、可分层、可扩展的商业基础设施。
一方面,当人们见识到了 Agent 具备了解决问题的能力,就会更有意愿让 Agent 来解决复杂问题。这样豆包就需要满足大众用户解决复杂问题的需求,有了从免费走向付费的契机。之前的对话功能还是可以保持免费,而更复杂的 PPT 制作、思维导图制作等会大大提升用户付费的可能性。
另一方面,让复杂问题获得更好解决,就需要使用更高级的模型,消耗更多 Token。没有一家企业愿意承受指数级的 Token 消耗增长,生产力场景必然走向付费。只是这个过程中,Agent 售卖的是一种解决问题的能力框架,其运行方式是变化的、不固定的,算力成本也会因此变得不可预测,按月付费的方式可能会遇到挑战。
今年以来,AI 厂商们频频传出调整付费模式的消息。核心的变化就是从针对 Chatbot 的无限制月付模式,切换到了针对 Agent 的按消耗付费模式。
Kimi 将付费会员的计费方式从「按次」改为「按实际消耗」。调整之后,经常有复杂任务需求的用户可能就需要购买更高级的权益。GitHub 也将基于请求次数的使用限制,变成了既限制对话数量,也限制每周 token 使用量。OpenAI 则推出了每月 100 美元的新订阅套餐。
同时,开发者们也发现云厂商的 Coding Plan 正在变成 Token Plan,并且新的套餐也开始有了更严格的限制。比如,新版 GLM Coding Plan 有了 5 小时和周额度双重限制,并且套餐周期内最多能进行 1600 次提示。阿里云下架了 Lite 版套餐,现在在售的是 200 元 / 月的 Pro 版套餐。

其中既有「按需型」Agent,由用户发起任务后自主规划、执行并返回结果,也会有「常驻型」Agent,比如持续在后台运行的邮件监控、日程管理或数字生活助手。Agent 在运行过程中会不断消耗 Token 来持续监控上下文并在需要时主动行动。
GitHub 产品副总裁 Joe Binder 表示,长时间运行、并行执行的工作流确实能为用户带来巨大价值,但也对 GitHub 的基础设施和定价结构提出了挑战。高盛的模拟数据显示,Chatbot 每次会话消耗约 1000 个 Token,嵌入式 Copilot 每天消耗超过 5000 个 Token,常驻型 Agent 每天的消耗可以达到 100000 个 Token。
Agent 是一种能力底座
豆包走向付费,提供了一个重新审视消费端 AI 发展的节点。这件事的意义不在于豆包开始收钱了,而在于它标记了一个时代的切换:Chatbot 时代结束了。
Chatbot 时代的产品逻辑是「模型即产品」——谁聊得更好、更聪明、更懂你,谁就赢。但这个逻辑正在失效。当所有主流模型的对话能力都进入到高水平时,「聊得好」就成为了一种标配。
在 Agent 时代,解决个性化问题的能力才是吸引和留存用户的关键。这个办事的框架像一个八爪鱼。有一个承载用户数据、Skill、模型和操作台的统一基座,然后从基座向不同入口延伸出一个个通道——每个通道负责接收任务、返回结果,同时将新的数据和 Skill 沉淀回基座。
豆包只是字节这只章鱼最粗壮的一根触角。它连接着 3.45 亿月活用户,绝大多数时间在满足闲聊、翻译、讲题等轻量交互。这些交互高频但浅层,甚至不需要调用基座的深度能力,基座上的模型、工具链、知识库在这类场景中处于闲置状态。

但是,用户也可能会在飞书上用 ArkClaw 自动生成周报、用多维表格让 AI 处理数据,或者打开扣子搭建一个专属工作流来完成更复杂的任务。这些也是字节章鱼的不同触角。甚至相比豆包,它们连接着更多生产力场景中的高价值用户。飞书上的企业员工、扣子上的效率极客,这些用户天然就比豆包的闲聊用户更容易被说服付费。
那为什么豆包还要为低频需求做付费?因为豆包需要与整个字节 AI 生态形成协同,不是把用户留在一个入口上,而是让用户将 AI 的未来使用习惯植根在自己生态中。入口只是触角之一,真正的壁垒在基座——谁的数据最厚、谁的 Skill 最多、谁的模型最懂用户,谁的飞轮转得最快。
未来的 Agent 的竞争,也是一个个被打通、理顺之后的生态体系的碰撞。用户会更加慎重地选择在某个生态体系内付费,将自己的数据积累在这个体系中,然后会对这个生态体系保持更强的忠诚度。所以,AI 厂商未来的竞争策略可能是整理和收束业务布局,聚焦在一个 Agent 底座上,打通一套付费体系,然后服务同一群用户。
从这一点看,豆包的收费可能会成为字节在基座层面构建 Agent 生态的护城河的开端。