别人都在卷 Harness，而 Google 的沉默振聋发聩

今年 1 月，Google Gemini API 团队的 Principal Engineer Jaana Dogan 在 X 上发了一条帖子，迅速获得了数百万次浏览。

" 我不是在开玩笑，这也不好笑。我们在 Google 从去年起就一直在尝试构建分布式 agent 编排系统，各种方案，团队内部意见不统一。我给 Claude Code 描述了这个问题，它在一个小时内生成了我们花了一年时间构建的东西。"

她后来补充说，生成的只是一个玩具版本，不是生产级代码。但她同时说了一句话，" 我们不能一边要求人们 100% 发挥，一边让他们不断在冲突和争论中消耗。"

三个月过去了，这条帖子背后的问题变得更加尖锐。据开发者调查数据，Claude Code 在专业开发者中拿下约 41% 的市场份额，年化收入约 25 亿美元，是 AI 编程工具领域有史以来增长最快的产品。OpenClaw 两个月内从开源项目迅速走红为全球热议的 agent 平台，中国大厂飞书、钉钉、微信纷纷接入。"Agent harness" 成为 AI 行业最新、最热的关键词。

而过去这一周的密度更是惊人。Anthropic 宣布年化收入 run rate 突破 300 亿美元（2025 年底为 90 亿），同时发布了 Claude Mythos Preview，一个比现有 Opus 更强的新层级前沿模型，以 Project Glasswing 的名义定向开放给 Palo Alto Networks、Amazon、Apple 等 40 家机构用于网络安全防御，消息发布当天引发美国软件股集体下跌。同一周还上线了 Claude Managed Agents，为企业提供托管的 agent 基础设施，从沙盒到编排一站式解决。

Meta 发布了 Muse Spark，Alexandr Wang 领导的 Meta Superintelligence Labs 的第一个模型，放弃了此前坚持的开源路线，转向闭源。OpenAI 不久前刚完成 1220 亿美元融资，估值 8520 亿美元，Codex 周活跃用户超过 200 万且仍在快速增长。

而 Google，在这一切中几乎没有声音。

强模型，弱 harness

Ben Thompson 在今年 3 月的文章中点出了 Google 的核心问题，Gemini 是一款强大的模型，但谷歌尚未为其推出有说服力的 harness。（Gemini is a strong model, but Google hasn't yet shipped a compelling harness）。

所谓 harness，是围绕 AI 模型构建的编排和控制层，让模型不只是在聊天框里回答问题，而是能在真实场景中稳定地执行多步骤、跨应用的复杂任务。Thompson 的判断是，agent 时代的竞争关键已经从模型本身转移到了 harness。他用苹果的硬件 - 软件整合做类比，利润从模块化的、被商品化的部分流走，流向整合的、差异化的部分。

Anthropic 的 Claude Code 和 OpenAI 的 Codex 建立了模型与 harness 的紧密整合。Google 没有。

Google 的 agent 产品并不少。Jules 是自动编程 agent，Antigravity 是 Google 以 24 亿美元从 Windsurf 挖来 CEO Varun Mohan 等核心人才后组建的 agentic coding 平台，Gemini Code Assist 在 IDE 里有 agent 模式，协议层面有 A2A 和 ADK 等开发者框架。消费端还有 Gemini Agent，能帮用户管理邮件、日历、执行多步骤任务，不过目前只对美国的 Ultra 用户开放，月费 249.99 美元。

但市场数据说明了一切。Antigravity 的开发者采用率与 Claude Code 差距明显。不少用户选择在 Antigravity 内切换到 Claude 的模型来获得更好的编程效果。Composio 的对比测试中，同一个任务 Claude Code 用了 1 小时 17 分钟自主完成，Gemini CLI 用了 2 小时 2 分钟且需要人工干预，过程中 " 会陷入循环，反复尝试相同的方法 "。

Hacker News 上一个高赞帖子标题写着，Google 在 agentic CLI coding 方面远远落后。How-To Geek 的评测说，" 我两个都大量使用过，根本不是一个量级的竞争。"

连 Hassabis 本人也在金融时报采访中承认，Claude Code" 做了一些特别的东西 "。

这个 gap 到底是主动选择还是被动落后？

Dogan 的帖子给出了一个很难回避的答案。" 各种方案、团队意见不统一 "，这指向的不是战略取舍，而是组织执行力出了问题。Antigravity 上线后留不住想用 Gemini 写代码的用户，Jules 在公测阶段的数据（228 万次访问、14 万次代码改进）和 Claude Code 的增长曲线不在一个量级。这些不是选择不做能解释的，是做了但没做好。

皮查伊和 Hassabis 的公开发言试图把这呈现为一种优先级选择，强调 Google 的资源倾斜给了模型训练和 TPU 扩产，" 先模型、再产品 "。但当你自家的 Principal Engineer 公开说 Claude Code 一小时干完了团队一年的活，这个战略选择的说法就不那么有说服力了。

Gemini 在打另一场仗

把 harness gap 等同于 "Google 在 AI 上失败了 "，是把问题简单化了。Harness gap 是开发者工具这个特定赛道上的缺位，不是消费端的溃败。事实上，如果你只看消费者数据，Google 的 AI 业务看起来相当健康。

Gemini 的消费端数据依然强势。月活 7.5 亿，据 Apptopia 数据，在美国 AI 聊天应用的市场份额从 14.7% 增长到约 25%，网页月访问量突破 20 亿次。

App Store 排名上，Meta AI 因 Muse Spark 发布冲进前十，Gemini 仍然稳居第 3，仅次于 ChatGPT 和 Claude。

今年 3 月 Google 的产品更新节奏不慢。Gemini 3.1 Flash-Lite（Google 主打高吞吐低成本的轻量模型）、Gemma 4 开源模型（基于 Gemini 3 架构，Google 在开源生态的一次重要押注）、Workspace 全家桶 AI 深度整合、NotebookLM 持续迭代、Gemini Live 对话体验升级、Pixel 手机上的 Gemini App Actions 开始支持跨应用操作。

只是这些更新的方向和行业热点大部分错开了。行业在讨论 agent harness 和 coding 工具，Google 在做搜索整合、Workspace 生产力、手机助手。

Gemini API 的定价整体低于 Claude 和 GPT 等闭源模型（具体随型号差异较大），且提供慷慨的免费额度，不过和 DeepSeek 等开源模型比，价格优势就不那么突出了。开发者社区形成了一种务实的分工，高价值项目用 Claude Code，追求性价比用 Gemini、开源模型。超过 75% 的企业组织已经在生产环境中使用多个 AI 供应商。

皮查伊在最近一次播客中说，搜索团队为每个子功能设定了毫秒级的延迟预算。Flash 模型达到 Pro 的 90% 能力，速度快得多。他说这完全不是一个 " 零和博弈的时刻 "。

Google 优化的是十亿级用户的轻量体验，搜索、Gmail、YouTube、Android，每一毫秒都在考量范围内。这个方向在过去二十年一直是对的。

但 agent 时代的逻辑可能不同。Claude Code 之所以引爆讨论，恰恰因为它是一个独立的产品，有自己的入口和体验。OpenClaw 之所以爆发，是因为它构建了一个独立的平台。如果 harness 层成为下一个平台级入口（就像搜索之于网页、App Store 之于移动端），Google 在这一层的缺位就不只是不参与某个细分市场的问题了。

庄家不需要站在台前

以上说的都是产品层面的事。但 Google 这家公司有一个其他 AI 公司不具备的特殊身份，它同时是 AI 行业最大的基础设施供应商之一。就在 Anthropic 发布 Mythos、Meta 推出 Muse Spark 的同一周，Google 这边的大新闻不是某个产品发布，而是一份 TPU 算力合同。

Anthropic 和 Broadcom、Google 在 4 月初正式确认了一份长期协议，从 2027 年起锁定约 3.5GW 下一代 TPU 算力，据 Broadcom 披露文件显示合同延续到 2031 年。此前 Anthropic 已经在执行另一份价值数百亿美元的合同，最多 100 万颗 TPU，2026 年上线超 1GW 算力。

两份合同叠加，Anthropic 的核心算力在未来五六年相当程度上绑定在 Google 的基础设施上。Claude Code 越成功，Anthropic 需要的算力越多，Google Cloud 收到的账单就越大。

OpenAI 也在用 TPU。2025 年年中开始通过 Google Cloud 租用 TPU 降低推理成本，推理目前占 OpenAI 算力预算的一半以上。Meta 在 2026 年 2 月放弃自研 AI 芯片 Iris 和 Olympus，转投 TPU。

SemiAnalysis 指出了一个耐人寻味的现象，OpenAI 甚至还没有大规模部署 TPU，但仅仅是拥有 " 可能转向 TPU" 这个选项，就从 Nvidia 拿到了约 30% 的折扣，他们称之为 " 威胁折扣效应 "。TPU 的存在本身就在重塑 AI 算力市场的定价权。

SemiAnalysis 对 TPUv7（代号 Ironwood）的评估是，性能与 Nvidia Blackwell 大致相当，但每有效 FLOP 的总成本低 20% 到 50%。

当然，TPU 的护城河也不是没有挑战。Anthropic 同时在用 TPU、Amazon Trainium 和 Nvidia GPU 三条腿走路，OpenAI 有自研芯片的长期计划，Amazon 的 Trainium 在追赶。但至少在目前，TPU 的客户名单还在变长，不是在变短。

皮查伊在播客中说他每周至少花一个小时管理 TPU 的项目分配，" 按项目和团队了解他们所使用的计算单元 "。CEO 亲自管芯片，这件事本身就说明了在 Google 的优先级里，算力远比产品层的开发者心智更接近核心。

投资布局上，Google 持有 Anthropic 约 14% 的股份、SpaceX 的股份（SpaceX 在 2026 年 2 月收购 xAI 后，Google 间接持有 xAI 相关资产）。AI 赛道的头部玩家，Google 要么自己做，要么持股，要么卖算力。

Google 在科学和前沿技术方向的储备也不应被忽略。Hassabis 和 Jumper 凭 AlphaFold2 获得了 2024 年诺贝尔化学奖，Isomorphic Labs 在做 AI 药物发现，Genie 3 在探索交互式世界模型，机器人基础模型在和 Boston Dynamics 合作，Waymo 已经在多个城市运营无人出租车。这些和当下 agent 热潮没有直接关系，但构成了 Google 独有的技术纵深。

不一样的 AI 路径

4 月 22 日，Google Cloud Next 在拉斯维加斯开幕（美西时间）。5 月 19-20 日，Google I/O 紧随其后。官方预告已经明确提到 "agentic coding 和最新 Gemini 模型更新 "。接下来六周是 Google 集中亮牌的窗口。

但即便 Google 在这两个会上发布了有竞争力的 agent 产品，它走的也注定是一条和 OpenAI、Anthropic 不同的路。

过去这一周的行业动作说明了一件事，所有玩家都在积极调整 AI 战略。Anthropic 用 Claude Mythos 把前沿模型能力打包成了面向安全行业的定向产品方案，这种把模型能力快速产品化到特定高价值场景的动作，是 Google 目前缺少的。Meta 发布 Muse Spark 时放弃了坚持多年的开源路线，转向闭源，试图用 30 亿月活用户的分发优势追赶。OpenAI 在推 "AI 超级应用 " 的概念，把 ChatGPT、Codex 和浏览能力统一成一个 agent-first 的入口。

每家公司都在抢位置，Google 的相对沉默在这个背景下格外显眼。

综合皮查伊和 Hassabis 近期的公开发言，Google 的 AI 战略逻辑比较清楚，不把 AI 当作一个独立的产品类别来经营，而是当作整个公司的加速器。皮查伊的原话是，" 我们拥有这项通用技术，它可以加速所有业务的发展，搜索、YouTube、Cloud、Waymo。"Hassabis 的 KPI 排序是先模型做到最好，然后尽快反映到产品中。

这和 OpenAI、Anthropic 的路径完全不同。OpenAI 围绕 ChatGPT 建立了独立的消费者入口，然后向企业和开发者两端延伸。Anthropic 围绕 Claude Code 建立了开发者工具壁垒，再通过 API 和企业服务变现。两家公司的共同点是都在做独立的 AI 产品品牌，争夺用户的直接注意力。

Google 赌的是，长期来看模型会商品化，agent 产品会反复迭代和替换，但算力基础设施和十亿级分发渠道（搜索、Android、YouTube、Workspace）不会轻易被替代。与其在产品层和一堆初创公司逐个厮杀，不如守住基础设施和分发，等产品层面的格局明朗了再出手也不迟。

这个赌注是否正确，取决于一个关键假设，harness 层不会成为一个锁定用户的平台级入口。如果 agent 只是工作流的一部分，用户会在 Claude、Gemini、GPT 之间灵活切换，那 Google 的 " 基础设施 + 分发 " 路径就是对的，不需要在 harness 上赢。

但越来越多的迹象显示，agent 正在演变成一个操作系统级别的界面。Claude Managed Agents 已经在做这件事，harness 正在从产品概念变成基础设施。那 Google 就可能在拥有最好的模型和最强的芯片的情况下，依然错过这个时代最重要的产品窗口。这不是没有先例的。Google 曾经在即时通讯、社交网络等领域拥有很强的技术基础，但在这些领域的产品竞争中并不总是赢家。

Gemini 3 在模型层证明了 Google 不会缺席。TPU 在基础设施层证明了 Google 无论如何都会赚钱。真正悬而未决的是第三层，agent harness。Google Cloud Next 和 I/O 或许会给出第一批线索。

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

别人都在卷 Harness， 而 Google 的沉默振聋发聩

宙世代

一起剪

相关阅读

网友用AI买保险被骗 轻信AI给的二维码钱却流入第三方 平台回应

iPhone Fold最新模型出炉：音量键搬到顶部 果粉不得不重新适应

软件ETF天弘（认购代码159035）下周一正式开募，机构称AI相关软件产品的需求将是确定性的存在

爱奇艺回应网易云音乐诡异广告：投放量较小，已下线处理

索尼发布新款游戏外设

为了让它走两步，我的电脑抽了十几小时皮鞭。

SpaceX的高估值隐忧：星链营收增50%难抵火箭与AI烧钱

AI时代的年轻创造者 技术不再稀缺，想法更加珍贵

多家科技企业发布AI新进展，亚马逊拟116亿美元收购卫星公司，车企2025年普遍面临盈利压力

3.92%收官：小台韩剧如何逆袭创纪录

不会拍照有救了！华为Pura 90系列首发AI姿势推荐 余承东力荐

英特尔9连涨，CPU仍被低估了

亚马逊加速追赶SpaceX 正深入谈判收购GlobalStar

AI时代的年轻创造者：技术不再稀缺，想法更加珍贵

高德回应：已在具身智能领域布局，近期将有首款四足机器人发布

最新评论

硅星人

热门推荐

企业资讯

别人都在卷 Harness，而 Google 的沉默振聋发聩

网友用AI买保险被骗轻信AI给的二维码钱却流入第三方平台回应

iPhone Fold最新模型出炉：音量键搬到顶部果粉不得不重新适应

AI时代的年轻创造者技术不再稀缺，想法更加珍贵

不会拍照有救了！华为Pura 90系列首发AI姿势推荐余承东力荐