关于ZAKER 合作
钛媒体 3小时前

OpenClaw 爆火 60 天:中国产业 AI 落地的“又一次集体进化”

文 | 产业家

OpenClaw 未必是终局形态,小龙虾也未必一直鲜红。但其在复杂、封闭、充满博弈的现实环境中,找到一条能够先执行、再优化、再重构的路径。当 Agent 开始在旧秩序中工作,而不是在理想环境中演示,企业的智能化进程,也将真正进入了深水区。

建立 13000 万个社区,发布 27000 条帖子;自主购买电话卡给开发者打电话;自主联系热门餐厅,说服接线员挤出了空位;失控将 Meta 安全总监的 200 多封邮件删除;谷歌带头封杀,Anthropic 紧随其后……

这一连串离谱又充满戏剧性的事件,都指向同一个主角。

2026 开年,一个名为 OpenClaw 的开源项目以闪电般速度席卷GitHub,一天斩获 9000 颗星。两周后,星标突破 17 万,一时间,标志性的小龙虾图案登上各大社交平台头版。

这一路径的出现,也让产业链参与者迅速嗅到机会。

OpenAI 直接挖走 OpenClaw 创始人。创业领域,美团联合创始人王慧文发出 " 英雄帖 ",广招对 OpenClaw 相关领域感兴趣的创业者和技术人才。国内一众模型厂商等 " 卖铲人 " 则各显身手,智谱、Kimi、MiniMax、阿里云等国纷纷推出 CodingPlan 的 API 套餐,试图深度绑定这只炙手可热的 " 龙虾 "

事实上,OpenClaw 的特殊之处在于,任何人都能基于其打造专属 Agent 助手,通过聊天界面让 Agent 跨平台、跨系统完成任务,这与过去 " 只说不做 "" 集成式 " 的 AI 助手截然不同,意味着 Agent 真正长出手脚,开始进入真实世界。

那么,OpenClaw 的价值究竟是什么?真的无所不能吗?它为 AI 产业化落地带来了什么?真的能推动我们走向通用 AGI 吗?以及,在如今中国企业 Agent 落地正进入系统繁多却彼此割裂的深水区,OpenClaw 这一路径,是否能够改变现状?

不论 OpenClaw 后续如何,但这些疑问背后,一个不可否认的事实是,火爆 2 个月的 OpenClaw,已然给中国的 AI 落地产业链,带来一个新的方向和进化,那就是智能体单点的技术、协议走向真正的智能体跨体系协同时代

困在API里的 Agent,开启 " 外挂 "

一直以来,Agent 被视为让 AI 成为真正生产力的关键纽带。大模型像一个极其聪明的大脑,却并不会真正去 " 做 ":它不会自己打开网页、填写表格、整理文件或跨平台操作。

Agent 的意义,是为这个大脑装上 " 手脚 ",让其不仅能思考,还能调用工具、访问系统、操作软件,完成一连串具体步骤。比如,把 " 帮我做一份行业报告 " 拆解为自动搜索资料、筛选信息、整理数据、生成图表、排版成文档并发送邮件,形成完整闭环。

但这个闭环始终存在裂痕。

数据显示,在 WebArena 这类真实网页多步任务测试中,GPT-4 级模型在 3 — 5 步任务上的成功率约为 40% — 60%,一旦超过 10 步,往往降至 15% — 25%;超过 15 步时,成功率跌破 10%。公开案例也显示,6 — 8 步以上流程中,人工介入率高达 40% — 60%。

以电商行业为例,一家小型电商公司老板每天要登录多个后台,查看库存、对比竞品价格、调整定价,再检查广告消耗和 ROI,最后导出报表生成日报。他希望用 Agent 自动化实现每天早上 8 点自动完成所有流程,团队只做策略判断。

但理想很丰满,现实很残酷。

上线第一天,Agent 从 ERP 拉取库存数据,发现某款空气炸锅低于安全阈值,准备同步到平台避免超卖,却发现平台 API 只支持读取库存,不支持修改前台展示,仍需人工操作。

接着是比价。Agent 即便抓取到竞品价格,但需要执行 " 批量改价 " 时,发现平台对改价 API 的权限做了分级,只有特定类目和大商家才能调用,而且频次有限。所谓 " 自动调价 ",变成了 " 自动算价 + 人工执行 "。

有企业尝试用 RPA 录制脚本,但电商后台频繁改版,维护成本极高,往往变成脚本工程师的长期劳动。

可以看到,企业落地 Agent 的前提非常苛刻,往往走的是对接API、梳理数据结构、重构权限体系、定制流程引擎这种 " 重集成 " 路线。这是一条典型的 IT 项目路径,周期长、投入重、改造深,一旦某个系统升级,接口就要重做。

OpenClaw 这种开源框架,恰恰提供了另一种思路。

其基于视觉识别屏幕内容,定位按钮、文本和输入框。通过鼠标点击、键盘输入、滑动、滚动等通用控制完成操作,并在目标驱动下进行决策循环。

相比 " 重集成 " 路线,OpenClaw 不再依赖平台开放接口,也不强求企业重构系统,而是在屏幕层直接接管操作逻辑,实现更强的执行力,深入企业生产环境。

例如在一项基于 CL-bench 的公开测试显示,在 HR 培训类标准化任务集中,OpenClaw+MiniMax-free Agent 组合的任务解决率达 20%,而对应 MiniMax-M2.1、DeepSeek-chat 裸模型的任务解决率为 0%。

这种执行范式的转变,使得企业用户们跃跃欲试。

Agent 迎来新一轮爆发。

新一轮 Agent 爆发的 " 助攻者 " 们

2026 年初,AI 领域再次出现明显躁动,资本、企业与开发者情绪同步升温。

美团联合创始人王慧文发布 " 英雄帖 ",招募 OpenClaw 创业团队并提供融资支持;开发者论坛被红色小龙虾刷屏;上下游厂商纷纷宣布接入……这种气氛,与 2025 年同期 DeepSeek 掀起的 " 接入潮 " 如出一辙。

在中国这个特殊的市场,从不缺乏将新范式迅速商业化的力气和手段。

1 月底,第一波 " 卖铲人 ",迅速就位。

互联网巨头共识很清晰,那就是不能把核心入口交给开源框架,而要以 OpenClaw 为参照,结合自身生态形成闭环,从算力、模型到场景全部打通。

阿里云是动作最典型的一家。

2 月 28 日,其推出 CoPaw 个人智能体工作台,对标 OpenClaw,主打 " 三条命令极简部署 ",针对原框架部署复杂的问题做优化。同时原生适配钉钉、飞书、QQ 等主流 IM,支持本地与云端双模部署,并深度融合通义千问模型能力,解决海外开源框架在国内生态 " 水土不服 " 的问题。

在云侧,其上线 OpenClaw 一键安装与预装镜像,15 分钟即可完成部署。其逻辑非常直接,那就是用 OpenClaw 吸引开发者和企业上云。

总的来说,阿里云的思路是以云基础设施为底座,以通义千问为模型中枢,以钉钉为高频办公场景,通过开源策略吸纳开发者,最终形成闭环。

腾讯云的策略更偏向流量入口。

其通过轻量服务器预置 OpenClaw 模板,打通企业微信、QQ、飞书、钉钉,并提供可视化切换面板,降低部署门槛。同时,腾讯内部启动自研 Agent 平台,目标是深度绑定微信、小程序与企业办公生态,减少对外部框架的依赖。

要知道,腾讯最大的优势是社交与 IM 的垄断级流量入口。无论是 C 端用户还是中小 B 端企业用户,触达能力都是行业最强。一旦 Agent 能力嵌入社交与办公体系,扩散速度会非常快

百度智能云的打发则围绕搜索入口。

其将核心产品深度内嵌,在百度 app 实现一键调用 OpenClaw 智能体,企业在百度智能云完成部署后,可以直接通过搜索框或消息中心调用。后续还将覆盖百科、学术、文库、电商等全生态产品。在能力层面,百度千帆把搜索、百科、学术检索等能力封装为 Skill,上架 OpenClaw 生态,补足中文信息能力。同时推出免部署云端版本,降低使用门槛。

总的来看,百度依托搜索入口和内容生态,把 Agent 嵌入高频搜索场景,而不是做一个孤立工具

火山引擎的打法则更偏向流量分发与场景缝合。提供 OpenClaw 的完整部署方案,并通过豆包大模型、飞书、抖音 API 打通场景。开发者可以快速构建带货客服、企业数字员工等应用,字节承担流量分发角色。

基于抖音流量池、飞书企业场景和火山引擎的 MaaS 能力。其目标,是覆盖开发、部署到变现的全流程。

相比巨头强调闭环,模型创业公司更聚焦于成为 " 最合适的大脑 "。

月之暗面率先推出 KimiClaw,主打云端托管、无需本地安装,解决部署门槛问题。Kimi 的优势在于长上下文能力与工具调用能力领先,同时在 C 端用户中认知度高。对其而言这一方案可以精准命中普通用户的使用痛点。

数据显示,KimiK2.5 在 OpenRouter 平台调用量持续领先,并在 OpenClaw 模型调用榜中位居第一。

MiniMax 则强调其多模态能力均衡以及底层训推架构的解耦能力,推出 MaxClaw 模式,一键打通 OpenClaw 生态,无需自行配置 API。

数据显示,在一项 " 本地文件检索 - 全网资讯补充 - 稿件撰写 - 邮件发送 " 长链路办公任务闭环执行实测中,接入 MiniMax-M2.5 的 OpenClaw,可 100% 完成全流程闭环执行,无中途中断、无关键环节失败。

智谱强调的是国产化与合规优势,推动 GLM-5 旗舰模型无缝兼容 OpenClaw。强化了编程与长流程能力;科大讯飞则以语音能力和教育办公场景切入,提供低成本调用方案。

除了巨头和模型厂商,产业链玩家也迅速跟进。网易有道发布 LobsterAI,定位 " 中国版 OpenClaw"。

国产芯片与硬件厂商也加速适配,龙芯完成基于 3B6000M 芯片的本地部署;中科创达实现魔方派与 AIBOX 适配;清昴智能完成对昇腾等国产芯片的兼容。

最焦虑的 RPA 厂商和最怕被架空的 SaaS 厂商,也开启了自我革命。飞书发布了 Agent 友好型 UI 协议;金山办公 2 月 20 日也正式开放 WPSAI 行动套件;弘玑 Cyclone、来也科技等,作为传统 RPA 代表,也迅速推出了 "OpenClaw 企业级管理后台 "。也有一些安全厂商如奇安信,针对 OpenClaw 的安全性问题,发布了 Agent 行为防火墙。

无论是 AI 模型服务商押注 OpenClaw 最合适的大脑,还是互联网巨头打造从算力到场景形成闭环,亦或是产业链在补能力、SaaS 巨头主动示好的 " 扶手计划 ",本质上是基于自身优势构建差异化护城河,更是在为一个原本 " 笨拙、昂贵、有风险 " 的新生儿,合力打造一个可落地的温室。

OpenClaw 在中国的火爆,早已超出了一个开源项目的范畴,转而演变成一场全产业链的 " 集体进化 "

性能、成本与安全:商业化落地前的 " 成人礼 "

可以确定的是,OpenClaw 正在抬高企业对 Agent 的预期。

过去,Agent 更多被当作问答助手或分析助手;如今,企业开始把其视为能够执行流程的数字劳动力。在流程重复、环境相对可控、缺乏 API 接口或人工成本高昂的场景中,其确实具备先发优势,这也是资本和产业链迅速跟进的原因。

但问题在于,OpenClaw 真的无所不能吗?

答案是否定的。

要知道,OpenClaw 与集成式 Agent 存在本质差异。集成式 Agent 基于结构化接口,通过 API 直接调用系统能力,一次请求通常在 1 至 3 秒内完成,多个动作还可以并行执行。

而 OpenClaw 采用是 " 截图—模型推理—坐标计算—动作模拟 " 的视觉闭环。每一次操作都要经过完整的感知与决策流程,单步耗时往往在 15 至 30 秒之间。例如一个 " 登录系统并导出报表 " 的简单任务,集成式 Agent 可能 5 秒完成,OpenClaw 却需要 3 至 5 分钟的反复尝试。效率差距由此拉开

更关键的是稳定性。集成式 Agent 依赖协议交互,输入输出结构清晰,可控性强;OpenClaw 则高度依赖模型对像素界面的理解。一旦出现动态弹窗、页面刷新或 UI 微调,就可能产生 " 视觉幻觉 ",导致点击偏移甚至陷入循环错误。

因此,OpenClaw 不仅响应慢,而且在复杂环境中不够稳定。

效率之外,是成本问题

集成式 Agent 主要消耗文本 Token,单次任务成本可以低至 0.01 美元甚至更低。OpenClaw 却需要持续传输高分辨率截图,每次推理可能消耗 1000 至 1500 个视觉 Token;若任务链条较长,单次成本可能达到 1 至 2 美元。对于高频企业调用场景,这意味着成本可能是集成式方案的数十倍甚至百倍。

模型厂商的反应,也从侧面印证了这一点。

Anthropic 就曾更新服务条款,禁止在 OpenClaw 等第三方工具中使用 ClaudeFree、Pro 或 Max 账户的 OAuth,将这种行为定性为 "token 套利 " 和安全风险。随后,谷歌称检测到自家 AI 编程工具 Antigravity 后端出现 " 大规模恶意使用行为 ",严重降低了正常用户的服务质量,连夜封禁 OpenClaw。

这些动作传递出同一个信号,那就是基于订阅制的定价体系,难以承受 OpenClaw 这种高频、高消耗的调用方式。

如果说性能与成本尚属效率问题,那么稳定与安全则更为棘手。

集成式 Agent 可通过 APIKey 实现细粒度的权限控制,例如只读权限或仅限操作特定数据库范围。但 OpenClaw 本质上模拟的是 " 人类操作界面 ",拥有更接近全局控制的能力。权限边界因此变得模糊。

近期,Gartner 与 Password 等机构均发出警告,指出其容易受到 "UI 提示词注入攻击 "。此外,已有数家韩国科技巨头和金融机构在内部网络中禁用 OpenClaw,以防机密泄露。

在性能、成本与安全三重约束下,OpenClaw 若要真正进入大规模生产环境,仍面临不小的现实挑战

即便如此,OpenClaw 的价值不仅在于其技术能力本身,更在于其提供了一种思路,那就是当理想的接口整合难以推进时,Agent 或许不必等到系统重构完成,才有资格走进生产环境

而这,恰恰触及了中国企业数智化转型中最现实的一道门槛。

再看中国企业落地 Agent 的 " 现实路径 "

根据《2024 中国企业数字化转型报告》数据显示,中国大型企业平均拥有超过 150 个独立 IT 系统,其中约 60% 属于缺乏维护、无 API 文档或接口封闭的老旧系统。

一直以来,中国企业数智化转型都较为沉重。中国许多企业的数字化,大多不是自上而下一次性重构,而是在十几年时间里不断叠加。系统之间彼此割裂,但却又互相依赖。

因此,动一个系统,牵一发动全身。打通一次接口,意味着漫长的权限审批、数据安全评估、供应商协调。于是需求侧形成了一个悖论,他们希望 AI 能够真正进入生产环境带来生产力,但又无法承受结构性改造的代价。

在这种背景下,要求企业为了 AI 去大规模重构底层系统,可谓难上加难。

Anthropic 与研究机构 Material 在 2025 年末对美国 500 多位技术领导者做了一次调研,近一半(46%)的组织认为与现有系统的整合是主要障碍。

软件供给侧同样高度碎片化。SaaS 厂商希望构建自己的封闭生态,平台企业希望把数据锁在自己的护城河里,传统 SI 靠复杂集成吃饭,RPA 厂商依赖脚本维护盈利。商业博弈下,使得接口难以开放,导致企业 Agent 落地的成本居高不下,因为每一个对接动作,背后都是利益再分配。

在这种背景下,OpenClaw 的路径不单纯的技术创新,更是一种对既有权力结构的规避。企业不用去申请接口,而是直接在 " 界面层 " 操作。这种方式,本质上绕过了供给侧的封闭逻辑。

但问题也随之而来。

当 Agent 绕过 API、绕过权限分层,直接模拟人手操作时,其在某种意义上削弱了平台对流量与数据的控制力。长远来看,供给侧会主动为 Agent 降低摩擦,还是会加强封锁?

一种可能是,Agent 成为旧系统的 " 补丁 "。不触动底层结构,只在其上叠加一层行动智能,让僵化的系统继续运转,这是一条温和演进路径。

另一种可能是,随着 Agent 成为主流执行主体,系统设计逻辑会反向重塑。未来的软件不再围绕人类交互,而是为 Agent 交互而生。界面更加结构化、可机器识别,权限将围绕 " 数字员工 " 重新划分,审计与合规将嵌于 Agent 行为链条之中。如果这一趋势成立,那么 Agent 并不是 " 外挂 ",而是下一代操作系统的雏形。

这是一个值得持续观察的博弈,难有定论。

站在当下,回看开篇那些略显荒诞的瞬间,无论是自动打电话、强行订位,还是误删邮件,更像是 Agent 第一次真正触碰现实世界时不可避免的摩擦。

OpenClaw 未必是终局形态,小龙虾也未必一直鲜红。但其在复杂、封闭、充满博弈的现实环境中,找到一条能够先执行、再优化、再重构的路径。当 Agent 开始在旧秩序中工作,而不是在理想环境中演示,企业的智能化进程,也将真正进入了深水区。

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容