关于ZAKER 合作
硅星人 48分钟前

Agent 落地的“光刻机之问”:当全行业紧盯“大脑”,谁在打造真正的基石?

当下的 AI Agent 领域,正上演着一幕 " 奇特 " 的景象,一方面,是关于 Agent 能力极限的狂热探讨;但另一方面,是当这些光鲜的 Agent 从实验室走向真实生产环境时的普遍 " 失速 " 与 " 沉寂 "。

这之间巨大的落差,源于一个被行业集体选择性忽视的 " 盲点 ":我们痴迷于为 Agent 打造更聪明的 " 大脑 ",却忽略了为其提供一个稳定、安全、可靠的 " 数字身体 "(运行环境)。

这正是 "Agent 的光刻机之问 "。在芯片制造中,若没有 EUV 光源、精密光学系统和超净间这些昂贵且复杂的物理基础,再精妙的芯片设计图也无法被刻上晶圆。同理,Agent 的价值实现,也依赖于一个看不见、摸不着,却至关重要的底层支撑。

如同光刻机需要 EUV 光源、光学系统和超净间的完整配合,Agent 也需要大模型、框架和云端环境的协同工作。

正是这个常被忽视的物理基础,通过提供持久化的状态管理、绝对安全的隔离沙箱、确保结果可复现的标准化工具集,以及工业级的稳定性和可观测性,解决了 Agent 从脆弱的演示走向强大生产力工具时所面临的一系列致命问题。

因此,当 Agent 技术从概念验证走向产业落地,下一阶段的竞争核心,已不再仅仅是模型智能的比拼。新的壁垒,在于谁能率先打造出稳定、可靠、高效且安全的云端运行环境。这台 " 隐形的光刻机 ",将最终决定谁能在即将到来的 Agent 时代中占据主导地位。

也是基于这一判断,一些深耕云计算的厂商开始从一个全新的视角破局,阿里云的无影云电脑团队给出的答案是:他们选择重注 " 云电脑 " 这一赛道,并对其进行根本性的重新定义——让它从一台 " 给人用的电脑 ",成为为一台 " 给 AI 用的电脑 " 。这一决定源于无影过去数年在企业服务市场积累的技术与认知 。而如今,正是这些为 " 人 " 打造极致远程体验时沉淀的能力,恰好构成了为 "AI" 解决光刻机问题的先决条件。

意外崛起的 MCP,唤醒了 Agent 沉睡

最早的 AI Agent 概念可以追溯到 20 世纪中期的科幻小说,尤其是艾萨克 · 阿西莫夫 1950 年发表的《我,机器人》,奠定了 " 自主智能体 " 这一概念的雏形。人类一直以来都在幻想 " 假机器之手行自我之事 ",科幻片里的贾维斯(Jarvis)、Moss(Her 中的 AI),甚至动画里的阿拉蕾,都是这些幻想的文化投射。

从概念到落地需要实际可行的技术指引,大模型兴起后,Agent 要落地,关键在于如何无缝接入海量工具——这正是 MCP 协议的使命。

2024 年 11 月,Anthropic 公司推出了 MCP(Model Context Protocol),这个被誉为 "AI 界的 USB-C" 的开放标准,正在改变 Agent 生态的发展轨迹。

MCP 试图解决了一个长期困扰 AI 开发者的核心痛点:工具调用的标准化问题。在 MCP 之前,AI 要想与外部工具互动,必须通过编写代码并调用 API,效率低下且耗时费力。随着 OpenAI、Google 等巨头宣布正式支持 MCP 协议。让业界看到了 MCP 成为标准协议的可能。

在这样的背景下,Agent 应用的开发架构也在发生根本性变化。正如在与硅星人的交流中提到的,Agent 要跑通,必须要有 " 新三大件 ":

基础模型:作为 Agent 的 " 大脑 ",提供推理和规划能力。

MCP 协议:作为 Agent 的 " 神经系统 ",连接大脑与外部工具,实现感知与操作。

云端环境:作为 Agent 的 " 身体 ",提供一个安全的、弹性的、高性能的物理载体,承载任务的最终执行。

这 " 新三大件 " 的组合,正在重新定义 Agent 应用的开发范式。而 Agent 应用的复杂性、对算力的高要求、以及对安全隔离的需求,都要求有专门的基础设施来承载。这就是为什么云电脑这样的基础设施产品开始受到关注——它们不仅提供了 Agent 运行所需的环境,更重要的是,它们可能正在重新定义 Agent 时代的云计算架构。

AgentBay:通用 Agent 的神兵利器

在这样的行业背景下,阿里云无影团队做出了一个战略判断:云电脑的未来不再仅仅是 " 给人用的电脑 ",而是要成为 " 给 AI 用的电脑 "。

从技术原理来看,AI" 感知 " 世界的方式(通过视频、音频流)与云电脑的技术原理(将画面和声音流式传输到终端)天然契合;AI" 操作 " 世界的方式(模拟键盘、鼠标事件)也与云电脑的控制协议异曲同工。这种技术基因上的匹配,让云电脑成为了 AI Agent 理想的数字化身躯。

更重要的是,无影团队认识到了一个核心问题:当前 Agent 生态面临的挑战,本质上是基础设施层面的挑战。无论是算力瓶颈、安全隔离还是开发复杂性,都指向同一个需求—— Agent 需要一个专门为其设计的运行环境。基于这一判断,无影推出了 AgentBay,这是国内首个支持 MCP 协议的云电脑服务,它致力于解决的是 Agent" 能不能用好 " 和 " 能不能用得起 " 的挑战。

首先是算力弹性。AgentBay 采用了 Serverless 化的算力调度模式,开发者通过简单的 API 调用就能获得弹性的云端算力。当 Agent 执行复杂任务时,系统会自动分配足够的计算资源;任务完成后,资源立即释放,按需使用。

特别值得一提的是,AgentBay 支持高并发任务执行。当多个 Agent 需要同时处理大量任务时,传统的单机环境往往无法承受。而 AgentBay 可以同时拉起数百个云电脑实例,彼此之间完全隔离。并发能力的提升,让 Agent 应用具备了商业化部署的可能。

其次是安全隔离。AgentBay 为每个任务创建独立的云上安全运行环境,这相当于给 Agent 的每次执行都提供了一个全新的 " 沙箱 ",任务执行完成后,这个沙箱会被完全销毁。

第三个突破是开发门槛的降低。AgentBay 原生支持 MCP 协议,开发者可以通过标准化的接口快速接入各种工具和服务。AgentBay 还预集成了大量常用工具,包括 Browser、Python(代码执行)、Terminal、File System 等工具,可以开箱即用。

AgentBay 更擅长的是 " 水面下的能力 ",正是这些能力让客户 " 眼前一亮 "。例如多平台支持,与市面上大多数只支持单一平台的解决方案不同,AgentBay 提供了 Linux、Windows、Android 等多种镜像,并支持在一个任务中跨平台操作。例如,Agent 可以在 Linux 环境中进行数据分析,然后切换到 Windows 环境生成报表,最后在 Android 环境中发布到移动应用,大大拓宽了 Agent 应用的想象力。

还有人机协同的 " 兜底 " 机制。AgentBay 内置了无影云电脑多年积累的 ASP 串流技术,当 AI 在执行任务时遇到需要人工干预的情况(比如需要输入验证码、处理异常情况等),可以直接呈现云端实时画面,允许用户随时接管操作,低延迟让实际体验跟用本地 PC 几乎一致。用户不用担心 Agent" 查错水表、送错快递 " 了。

" 最多跑一次 " 也是 AgentBay 的创新。传统模式下,Agent 阅读资讯和报告会从头读到尾,再从中选取有价值的内容,当几十个任务叠加时,消耗的总时长看起来就那么 " 高效 " 了。AgentBay 可以做到 " 在你看之前已经帮你看过了 ",接到任务的那一刻起,AgentBay 里的小 AI 就主动帮助 Agent 进行优化和筛选,把最直接相关的内容呈现出来,信息只要跑一次就能让 Agent 处理了。此外,AgentBay 还有专属的知识库、历史文件编辑等高阶能力,具备一定程度的 " 记忆力 ",让云端环境更像用户的 " 数字分身 "

AgentBay 的另一大价值在于清晰定义了 Agent 开发的标准架构。过去,Agent 开发者需要考虑各种环境兼容性问题、资源调度问题、安全隔离问题。现在 AgentBay 在基础设施层面都解决了。开发者只需专注业务逻辑,其它交给 AgentBay。

产品负责人屈立威表示:" 我们的目标是让开发者能够 ' 拎包入住 ',只需要专注于业务逻辑的实现。" 从市场反馈来看,目前国内头部的几家 Agent 大厂包括阿里系的夸克、钉钉等产品都在使用 AgentBay 来承载他们的 Agent 应用。

据团队介绍,AgentBay 未来将聚焦于两大核心方向的演进:一是打造 " 视觉理解中间层 ",让 AI 能更低成本地理解和操作图形界面;二是构建 " 长期记忆模块 ",让云端环境真正成为具备持续学习能力的个性化 " 数字分身 "。

Agent 时代的基础设施:长期投入、做好服务

当我们将视野从具体的应用场景拉回到行业发展的宏观层面时,一个问题浮现出来:在 Agent 即将大规模商业化的前夜,什么样的基础设施能够承载这一轮技术革命?

阿里云无影事业部总裁张献涛表示:" 我们的定位是服务好所有 Agent 厂商,而非在应用层面直接竞争。我们是 ' 卖铲子 ' 的,而不是自己去 ' 挖矿 '。"

在 Agent 生态中,模型能力、应用开发、基础设施三个层面各有其专业门槛和发展规律。模型层面需要大量的算法研发和数据积累,应用层面需要对具体业务场景的深度理解,而基础设施层面则需要对云计算、网络、安全等底层技术的长期投入。

" 做基础设施,没有三年五年的积累是很难做起来的。阿里云在早期发展阶段也用了七八年持续不断投入基础技术研发才有了今天的地位。靠的不仅仅是某个产品,而是对客户的全方位服务和对技术的长期投入。服务器稳定性、数据安全、网络可用性,这些都是看不到的技术战场。"

这让人回想起 2008 年,当史蒂夫 · 乔布斯在发布会上首次向世界介绍 App Store 时,很少有人能预见到,这个新生的应用商店,将如何开启一个价值万亿的移动互联网时代,并催生出无数颠覆性的商业模式。这正是苹果打造的通往移动世界的 " 基础设施 "。

今天,当大多数人还在惊叹于 Agent" 大脑 " 的聪明才智时,无影选择打造那个承载一切的 " 数字身体 " 和运行平台。而 AgentBay 也似乎像那个初生的 App Store,让开发者去自由地构建和想象 Agent 时代的未来。

毕竟,AI 是一场没有终点的马拉松。每当一个范式被突破,围绕它的所有细节都将被重构。Agent 是如此, MCP 也是如此,而为这一切提供动力的 " 新基建 ",才刚刚开始。