市场对国产 AI 的乐观情绪,再次被 Claude Code 点燃。
年初,Claude Code 在编码及白领工业领域的突破,不仅推动 Anthropic 进入爆发期,也为中国厂商提供了清晰的追赶坐标;而昨晚那场意外的 " 开源 ",为市场强化了一种更具想象力的叙事,仿佛中国厂商直接获得了智能体系统的工程蓝图。
昨日,智谱股价涨幅约 32%,总市值至 4080 亿港元(约 520 亿美元);MiniMax 涨幅 14%,超 3300 亿港元(约 420 亿美元)。
时隔一日,开发者社区仍然沉浸在拆解 Claude Code 源代码的窃喜之中。这无异于一场 " 面向未来的考古 "。
在已经泄露的 1906 个文件,512000 行代码,40 多个工具中,埋藏着 Anthropic 构建生产级智能体系统的全套工程方法论。那些围绕 "harness 工程 " 的系统化设计正被逐一还原。数十项尚未发布的功能(Unshipped Features)所指向的未来,比 Anthropic 官方博客所描绘的未来,还要 " 超前 " 得多。

这种长时间无人值守、可持续运行的智能体体系,一直被视为通往 AGI 的关键路径之一。Claude Code 的源码泄露表明,这些组件已经准备好了,距离现实不再遥远。
早在今年 2 月,Anthropic 曾披露,用户让 Claude Code 不间断自动执行任务的时长已超过 45 分钟,几乎是三个月前的两倍。在达沃斯世界经济论坛上,Anthropic 创始人阿莫迪(Dario Amodei)坚信,到 2026 或 2027 年,大模型将通过 " 自我设计 " 与 " 递归进化 ",在多数领域达到诺奖得主水平。
除战略布局外,泄露的源码更揭示了 Anthropic 在战术层面如何打磨 harness 工程:流式工具并行,允许模型生成和只读操作的工具调用并行执行," 等待 " 的延迟被藏在了时间里;四种粒度的上下文管理,可以有序地剪裁、缓存、归档与压缩,解决长程任务 " 注意力不支 " 问题,等等。
当智能体演化为能够长时运行、分工协作并进行反复自我评估的系统后,其记忆管理、延迟控制与权限体系的重要性愈发凸显。人人都知道,2026 年的竞争重点,不只是谁模型更大,而是谁的智能体系统更工程化。
然而,实现这一目标的路径并非显而易见。Claude Code 的源代码提供了经过验证的方法,虽然它既不是唯一方案,也不一定是最优方案,但实实在在地提升了可见性,降低了快速跟随者的实验成本和时间门槛。如今,不少智能体初创团队,可以选择直接跳过昂贵与漫长的试错与迭代,并将它接入中国的开源模型。
肯定会有团队这么做。年初以来,有关智能体的一切都在加速,包括 harness 工程支持的 token 消耗,以及它在各大应用场景的渗透。harness 工程的上限,也意味着智能体系统的生产可用性和经济价值的上限。用 Claude Opus 4.5 做一个 2D 复古游戏制作器,solo 版本运行 20 分钟,成本 9 美元,而全套 harness 环境下需要运行 6 小时,成本高达 200 美元。但是,只有后者的产出,才是真正能用的。
2026/03/31 完整阅读 >
市场普遍预期,这一加速趋势将持续深化。在编码领域取得突破后,Claude Code 的应用边界不断外延,其企业服务应用 Cowork 旗下的系列智能体,已渗透至十多个高经济价值的白领工作领域。这些垂直领域也需要自己的 harness 工程。Anthropic 的年度经常性收入(ARR),也因此达到了 190 亿美元,而去年底仅为 90 亿美元。
这吓得 OpenAI 拉响红色警报。在迅速调整战略方向后,目前,OpenAI 面向企业的收入显著提升,营收占比达到 40%,预计年底与消费者业务持平。其中,Codex 的周活跃用户超过 200 万,过去三个月增长了 5 倍。第一方 API 的 token 消耗也在急剧攀升,每分钟处理量超 150 亿,是去年 10 月的 2.5 倍,料与谷歌接近(去年底 100 亿 / 分钟)。
中国开源模型已证明其足以胜任大多数 AI 编程任务。500 亿美元估值的 Cursor 便是一个鲜活例证,它宣称自研的 Composer 2 模型,底层基座实为 Kimi-K2.5 开源模型。此外,年初以来,其他开源模型,如智谱的 GLM-5,以及 Minimax 的 M2.5,也都称编码性能逼平 Claude Opus 4.6,价格却低至只有其 1/20。现在的挑战在于,它们需证明这些模型在 harness 工程的支持下,智能体系统能取得同等增速的商业成绩。
OpenAI 与 Anthropic 正在筹备上市,公司最新估值分别达到了 8520 亿美元与 3800 亿美元。在这之前,抢先上市的 MiniMax 与智谱,享受到了时间的红利。年初至今的股价走势,正是市场对智能体的焦虑与亢奋的映射,今日再次引爆。它们已成为 Claude Code 在中国的完美镜像。
国内企业服务市场的迅猛成长,为市场解读此次代码泄露事件,提供了一定程度的基本面支撑。昨晚,恰逢智谱发布上市后首份年度业绩,其中开放平台和 API 收入,去年至今增幅近 3 倍至 1.9 亿元人民币,远超公司整体收入增幅。公司 API 的 ARR 已达约 17 亿人民币(约 2.5 亿美元),同比增长 60 倍;即便一季度 API 涨价 83%,调用量仍逆势增长 4 倍。

此前,MiniMax 年报亦披露 API 收入约 1.8 亿人民币,增长约 200%;截至 2 月,其 ARR 达 1.5 亿美元,M2 系列模型的 Token 消耗量较去年底增长了 6 倍。
它们也都在转向高价值经济任务。智谱提出了 "Token 架构能力 "(TAC)概念。该指标不仅考量 " 智能质量 " 与 " 调用量 " 等模型层价值,更融入了 " 转化为经济价值的效率 " 这一关键因子。这标志着国内 AI 行业的竞争重心,也正从单纯的模型竞赛转向架构竞赛,首当其冲的便是智能体架构与 harness 工程的比拼。
MiniMax 也明确表示,将从研发型 AI 公司向平台型 AI 公司转型,并指出当前最具经济价值与使用价值的,往往正是当下最好的模型的不足之处。
市场已开始畅想,若一年后智谱或 MiniMax 能复刻 Anthropic 的爆发路径,实现 ARR 十倍增长,其估值天花板则仍未触及。Anthropic 在 ARR 约 14 亿美元时,对应估值 615 亿美元。
然而,市场简单地将研读源代码等同于 " 复刻 "Claude Code,甚至将其直接映射为 Anthropic 式的收入增长,未免失之草率。源码泄露并不等同于模型权重、API 基础设施、用户信任及生态系统的全面泄露。而笃定这是中国团队实现技术创新与价值创造的唯一方式,也未免失之粗鲁。
月之暗面 Agentic AI 研究员 Yufeng He,用 Opus" 读完 "Claude Code 的代码后最大的感受,是 Anthropic 把 " 实验驱动 + 可验证性 " 这套科研方法,搬进了工程系统。他发现,Claude Code 内置了一套消融实验基础设施,启用后会关掉相关功能,允许团队每上线一个新功能,都可以跑一组对照实验,量化它的价值。这种追求 " 可解释性 " 的工程文化,比任何技术都值得效仿。