关于ZAKER 合作
钛媒体 12小时前

大厂 Agent 混战:复刻 Manus 的野心与困局

文 | 光锥智能,作者 | 魏琳华,编辑 | 王一粟

当 Manus 创始人肖弘直言 " 产品没有秘密 " 时,大厂们正陷入技术复刻与流量争夺的双重焦虑。据光锥智能了解,目前多家大厂均在内部开设对标 Manus 的产品团队。据悉,以擅长内部赛马的字节,内部至少有 5 个不同团队正在开发智能体产品。

在 Manus 发布的一个月后,大厂们先后交出了智能体的答卷:字节跳动 " 扣子空间 " 以裂变式邀请码席卷职场、阿里 " 心流 " 用超长耗时任务塑造研究深度、百度 " 心响 " 则带着医疗法律垂类场景突袭移动端。

但在这场看似繁荣的通用 Agent 发布潮背后,却暗藏着一个尴尬现实—— 所有产品仍未突破已有 Agent 的能力边界。

从去年开设 Agent 平台的无人问津,到今年交出 60 分答卷。可以确定的是,Agent 已经通过规划和工具能力跨越了通用 Agent 的 1.0 阶段,进入自主 Agent 的 2.0 阶段。

当下,扎堆发布的 Agent 已经能够初步担任起 " 实习生 " 的任务,解决那些在人类日常生活中耗时且难度低的任务:比如,根据用户的需求完成一部分资料的收集,并通过大量的信息分析并给出一些可供用户筛选的观点。再比如帮助用户完成基础操作,筛选岗位发简历、给目标发邮件等等。

这场围绕 Agent 展开的流量入口争夺战,只是 2025Agent 爆发之年的一个注脚。除了大模型公司和应用公司,更多玩家正在参与其中:

就在今天,联想也发布了面向个人用户的 " 天禧 " 智能体和面向企业的 " 乐享 " 智能体。其中,个人智能体 " 天禧 " 将自主操作和记忆交互作为卖点,并在旗下 4 款产品中搭载。除了自主完成点单、攻略等操作,它还能根据用户的偏好和习惯,给出匹配的预算和喜好推荐。

在大厂倾尽资源的进攻下,智能体之战现在走到了什么阶段?

批量复刻 Manus,谁能抢占流量入口?

4 月,通用 Agent 成为了大厂们发布会和产品更新的关键角色。

先是字节在 4 月 18 日发布了通用 Agent 产品 " 扣子空间 ",上线免费测试,以每人 5 个邀请码的裂变方式,先行抢占市场;4 月 22 日,阿里旗下 AI 助手 " 心流 " 上线高级研究功能,主打类似 OpenAI 的智能体 DeepResearch 式的报告研究;再到百度 4 月 25 日正式在开发者大会上官宣智能体 " 心响 ",侧重医疗、法律、绘本等多个适配生活场景的任务体验。

在前有 DeepSeek 的冲击过后,如何借助成熟产品引流,也成为了智能体接下来上线需要考虑的问题。

目前,大厂多处于内部团体自研的模式,比如字节和百度。但阿里早在 Manus 点燃市场热情的时候,就已经洽谈了和 Manus 的合作。目前,阿里除了有自研产品心流的发布以外,其旗下大模型团队通义千问也早在 3 月就敲定成为 Manus 中文版的专属模型支持方,先在模型合作上分到一杯羹。

但对于百度、字节和阿里这三家强调 AI 自研,并且从大模型研发到应用产品均亲力亲为的大厂来说,借自己的力量开发智能体也是非常必要。

扎堆发布的 Agent 们,各自的产品思路并不相同。

字节的 " 扣子空间 " 定位为" 精通各项技能的实习生 ",给出的各种案例更像是工作上的助手,比如生成行业报告、用户调研分析等。

光锥智能测试后,感觉扣子空间是一个更加面面俱到的及格产品,它不仅接入了高德等 MCP,借助工具提升使用能力,在报告输出上也做到了图文并茂,多模态能力突出。但在输出报告的内容深度上,还有进一步优化的空间。

对比来看,阿里旗下的 AI 助手 " 心流 " 上线的高级研究功能,更加接近于深度研究的应用场景。在多次测试过程中,心流显著的特点就是消耗的 Token 资源更多,耗时长。比如,在 " 智能体研究 " 任务上,心流的处理时长超过 1 个小时,浏览网页的数量也显著超过其他两个产品。

大量资源和牺牲效率的方式,换来了更具深度的生成内容,而这也是心流只能通过审核制申请测试的原因,大规模的开放,对算力消耗和成本来说,都是当前难以平衡的问题。但在对象选取准度上,心流的表现一般,比如在智能体报告中,它选择的产品多为大模型 AI 助手类,且把 Manus 融资 7500 万的信息误放在了扣子空间的分析中。

相比于字节和阿里的通用 Agent 选择在 PC 端上线,百度的心响则把首发选在了手机 App 端,后续才会上线 PC 端。

不同的智能硬件端,决定了两者面对的受众差异:电脑端面对的多为有工作、学习需求的用户,集中在报告研究、内容分析的领域;而手机端用户则更希望体验 AI 在实际生活场景中落地的各项功能。

结合百度在医疗、法律等行业的优势,再加上百度过往在 AI 虚拟社交等方向的探索成果,心响最终的上线形式就变成了主推垂类场景的模样。

目前,心响 App 的主界面推荐了包括 AI 相亲、旅游规划、医疗 / 法律咨询等场景的体验推荐。实际测试下来,心响在医疗、法律等问题上的准确度较高。比如在回答酒驾撞人逃逸问题时,心响调用了多个 Agent,最终给出量刑 7 年的结果,这也和现实中律师意见一致。

但在脱离垂类知识积累的其他业务上,心响的准确度还需要继续优化。比如在要求出一份旅游地点建议的任务执行中,心响明明已经判断出地点不属于朝阳区范围,但依然推荐了不满足用户设定条件的景点。

综合三个通用 Agent 的测评结果,大厂梯队的 AI 智能体,目前多数只能用来完成一些基础水平的工作,能力上还没有达到类似 Manus 般惊艳的效果。

但短期内,大厂们交出的答卷,已经让市场用户开始逐渐对智能体的概念感到兴奋和好奇。

无论是字节还是 360 的 Agent,近期都在大批量开放测试的过程中出现过服务器崩溃的情况,可以说,即使是拥有充足算力的大厂,其消耗程度也远远超出了发布的预期。

而智能体这条赛道,参与的选手不只有互联网大厂和创业公司,凭借硬件优势,有智能手机和电脑的公司也盯上了智能体的前景。

今天,联想就在发布会上发布了面向个人的智能体 " 天禧 " 和 " 乐享 " 企业超级智能体,针对个人来说,其智能体已经能够完成提供旅游建议、制定行程和下单等各种自主操作。

面对 " 智能体 " 这块肥肉,各家虎视眈眈。

Manus 还没被超越,但技术红利还能吃多久?

被称作 "Agent 之年 " 的 2025,大厂和创业公司,都在自己的能力范围内交出答卷。

但三家大厂目前上线的产品,折射出一个残酷现实:大厂们即便坐拥生态与算力,复刻 Manus 并不是一个能够在短期内完成的事情。

在 Manus 发布之初,其创始人肖弘就已经给出了自己的观点:Manus 没有秘密。

" 从产品经理的角度出发,要用就要用最好的大模型,用最好的东西能产生多大的商业价值,产品经理关心的是这个。" 肖弘说。

Manus 的核心能力建立在模型能力溢出上,但在最早建立市场认知的时刻,Manus 在模型能力调用和产品思路两个方面做到了极致:

首先,Agent 需要同时处理多模态理解、复杂推理、代码生成等多样化任务,这对底层模型的综合调用能力提出了极高要求。现在市面上能够看到的多数通用 Agent,都是采用不只一个大模型,而是多个模型按照不同需求调用,比如需要理解图片内容,就调用多模态能力更强的大模型。

以字节为例,据晚点 LatePost 报道,扣子团队开发扣子空间时,他们曾考虑优先使用 DeepSeek-R1,测试后发现其调用工具的能力不足。最后,基于能力表现和成本原因考虑。使用了豆包 1.5 Pro 为主的多款模型。

而在拥有更好的模型能力基础上,如何将技术转化为用户体验也是一个挑战。

不过,在各家公司交出的 Agent 上,均已经有不同的思路展现。比如,在搜索体验上,百度的 Agent 产品采用 " 多组关键词 + 搜索引擎 " 策略,用多组关键词尝试搜索,而智谱则让自家 AutoGLM 沉思在小红书、知乎等不同平台搜索,打破了不用应用数据固化的边界。

在短期时间内,当前的技术格局呈现出一个有趣现象:以 Manus、GensPark 为代表的创业公司,仍在关键指标上保持领先优势。比如,GensPark 在 GAIA 基准测试中的表现已超过 Manus。

相比之下,大厂现阶段推出的 Agent 产品更多是 "60 分解决方案 ",但和 Manus 的目标相同,大厂们需要在通用 Agent 相对空白的阶段,率先抢夺一部分市场。

技术路线的差异直接影响了商业化策略的选择,两类玩家正走向截然不同的道路:

目前主流大厂仍以免费策略为主导目标,试图撬走一部分用户,字节、阿里和百度的产品都采取了免费供应的方式。

而成本压力迫使创业公司更早启动商业化。目前,GensPark 已积累 1 万付费用户,其 ARR(年度经常性收入)达到 2200 万美元。而 Manus 更是在海外市场开出单月 39 美元的基础版和单月 199 美元的高级版两种收费模式,定价比肩 OpenAI 的会员。

不过,从基础大模型到应用产品来看,目前技术优势的窗口期正在缩短,留给创业公司们的时间不多。

现在的大厂们用不到一个月的时间,交出了 60 分的答卷,当新的通用 Agent 提升到 70 分、80 分,加上免费策略,势必会对创业公司们造成进一步的冲击。

这场竞赛的终局还处于起始阶段,而在通用 Agent 能力再跃升之前的一切交锋,只是 2025Agent 爆发之年的序章。

相关标签

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容