文 | 光锥智能,作者 | 魏琳华,编辑 | 王一粟
当 Manus 创始人肖弘直言 " 产品没有秘密 " 时,大厂们正陷入技术复刻与流量争夺的双重焦虑。据光锥智能了解,目前多家大厂均在内部开设对标 Manus 的产品团队。据悉,以擅长内部赛马的字节,内部至少有 5 个不同团队正在开发智能体产品。
在 Manus 发布的一个月后,大厂们先后交出了智能体的答卷:字节跳动 " 扣子空间 " 以裂变式邀请码席卷职场、阿里 " 心流 " 用超长耗时任务塑造研究深度、百度 " 心响 " 则带着医疗法律垂类场景突袭移动端。
但在这场看似繁荣的通用 Agent 发布潮背后,却暗藏着一个尴尬现实—— 所有产品仍未突破已有 Agent 的能力边界。
从去年开设 Agent 平台的无人问津,到今年交出 60 分答卷。可以确定的是,Agent 已经通过规划和工具能力跨越了通用 Agent 的 1.0 阶段,进入自主 Agent 的 2.0 阶段。
当下,扎堆发布的 Agent 已经能够初步担任起 " 实习生 " 的任务,解决那些在人类日常生活中耗时且难度低的任务:比如,根据用户的需求完成一部分资料的收集,并通过大量的信息分析并给出一些可供用户筛选的观点。再比如帮助用户完成基础操作,筛选岗位发简历、给目标发邮件等等。
这场围绕 Agent 展开的流量入口争夺战,只是 2025Agent 爆发之年的一个注脚。除了大模型公司和应用公司,更多玩家正在参与其中:
就在今天,联想也发布了面向个人用户的 " 天禧 " 智能体和面向企业的 " 乐享 " 智能体。其中,个人智能体 " 天禧 " 将自主操作和记忆交互作为卖点,并在旗下 4 款产品中搭载。除了自主完成点单、攻略等操作,它还能根据用户的偏好和习惯,给出匹配的预算和喜好推荐。
在大厂倾尽资源的进攻下,智能体之战现在走到了什么阶段?
批量复刻 Manus,谁能抢占流量入口?
4 月,通用 Agent 成为了大厂们发布会和产品更新的关键角色。
先是字节在 4 月 18 日发布了通用 Agent 产品 " 扣子空间 ",上线免费测试,以每人 5 个邀请码的裂变方式,先行抢占市场;4 月 22 日,阿里旗下 AI 助手 " 心流 " 上线高级研究功能,主打类似 OpenAI 的智能体 DeepResearch 式的报告研究;再到百度 4 月 25 日正式在开发者大会上官宣智能体 " 心响 ",侧重医疗、法律、绘本等多个适配生活场景的任务体验。
在前有 DeepSeek 的冲击过后,如何借助成熟产品引流,也成为了智能体接下来上线需要考虑的问题。
目前,大厂多处于内部团体自研的模式,比如字节和百度。但阿里早在 Manus 点燃市场热情的时候,就已经洽谈了和 Manus 的合作。目前,阿里除了有自研产品心流的发布以外,其旗下大模型团队通义千问也早在 3 月就敲定成为 Manus 中文版的专属模型支持方,先在模型合作上分到一杯羹。
扎堆发布的 Agent 们,各自的产品思路并不相同。
字节的 " 扣子空间 " 定位为" 精通各项技能的实习生 ",给出的各种案例更像是工作上的助手,比如生成行业报告、用户调研分析等。
光锥智能测试后,感觉扣子空间是一个更加面面俱到的及格产品,它不仅接入了高德等 MCP,借助工具提升使用能力,在报告输出上也做到了图文并茂,多模态能力突出。但在输出报告的内容深度上,还有进一步优化的空间。
大量资源和牺牲效率的方式,换来了更具深度的生成内容,而这也是心流只能通过审核制申请测试的原因,大规模的开放,对算力消耗和成本来说,都是当前难以平衡的问题。但在对象选取准度上,心流的表现一般,比如在智能体报告中,它选择的产品多为大模型 AI 助手类,且把 Manus 融资 7500 万的信息误放在了扣子空间的分析中。
不同的智能硬件端,决定了两者面对的受众差异:电脑端面对的多为有工作、学习需求的用户,集中在报告研究、内容分析的领域;而手机端用户则更希望体验 AI 在实际生活场景中落地的各项功能。
结合百度在医疗、法律等行业的优势,再加上百度过往在 AI 虚拟社交等方向的探索成果,心响最终的上线形式就变成了主推垂类场景的模样。
目前,心响 App 的主界面推荐了包括 AI 相亲、旅游规划、医疗 / 法律咨询等场景的体验推荐。实际测试下来,心响在医疗、法律等问题上的准确度较高。比如在回答酒驾撞人逃逸问题时,心响调用了多个 Agent,最终给出量刑 7 年的结果,这也和现实中律师意见一致。
综合三个通用 Agent 的测评结果,大厂梯队的 AI 智能体,目前多数只能用来完成一些基础水平的工作,能力上还没有达到类似 Manus 般惊艳的效果。
但短期内,大厂们交出的答卷,已经让市场用户开始逐渐对智能体的概念感到兴奋和好奇。
无论是字节还是 360 的 Agent,近期都在大批量开放测试的过程中出现过服务器崩溃的情况,可以说,即使是拥有充足算力的大厂,其消耗程度也远远超出了发布的预期。
而智能体这条赛道,参与的选手不只有互联网大厂和创业公司,凭借硬件优势,有智能手机和电脑的公司也盯上了智能体的前景。
今天,联想就在发布会上发布了面向个人的智能体 " 天禧 " 和 " 乐享 " 企业超级智能体,针对个人来说,其智能体已经能够完成提供旅游建议、制定行程和下单等各种自主操作。
面对 " 智能体 " 这块肥肉,各家虎视眈眈。
Manus 还没被超越,但技术红利还能吃多久?
被称作 "Agent 之年 " 的 2025,大厂和创业公司,都在自己的能力范围内交出答卷。
但三家大厂目前上线的产品,折射出一个残酷现实:大厂们即便坐拥生态与算力,复刻 Manus 并不是一个能够在短期内完成的事情。
在 Manus 发布之初,其创始人肖弘就已经给出了自己的观点:Manus 没有秘密。
" 从产品经理的角度出发,要用就要用最好的大模型,用最好的东西能产生多大的商业价值,产品经理关心的是这个。" 肖弘说。
Manus 的核心能力建立在模型能力溢出上,但在最早建立市场认知的时刻,Manus 在模型能力调用和产品思路两个方面做到了极致:
首先,Agent 需要同时处理多模态理解、复杂推理、代码生成等多样化任务,这对底层模型的综合调用能力提出了极高要求。现在市面上能够看到的多数通用 Agent,都是采用不只一个大模型,而是多个模型按照不同需求调用,比如需要理解图片内容,就调用多模态能力更强的大模型。
以字节为例,据晚点 LatePost 报道,扣子团队开发扣子空间时,他们曾考虑优先使用 DeepSeek-R1,测试后发现其调用工具的能力不足。最后,基于能力表现和成本原因考虑。使用了豆包 1.5 Pro 为主的多款模型。
而在拥有更好的模型能力基础上,如何将技术转化为用户体验也是一个挑战。
不过,在各家公司交出的 Agent 上,均已经有不同的思路展现。比如,在搜索体验上,百度的 Agent 产品采用 " 多组关键词 + 搜索引擎 " 策略,用多组关键词尝试搜索,而智谱则让自家 AutoGLM 沉思在小红书、知乎等不同平台搜索,打破了不用应用数据固化的边界。
在短期时间内,当前的技术格局呈现出一个有趣现象:以 Manus、GensPark 为代表的创业公司,仍在关键指标上保持领先优势。比如,GensPark 在 GAIA 基准测试中的表现已超过 Manus。
相比之下,大厂现阶段推出的 Agent 产品更多是 "60 分解决方案 ",但和 Manus 的目标相同,大厂们需要在通用 Agent 相对空白的阶段,率先抢夺一部分市场。
技术路线的差异直接影响了商业化策略的选择,两类玩家正走向截然不同的道路:
目前主流大厂仍以免费策略为主导目标,试图撬走一部分用户,字节、阿里和百度的产品都采取了免费供应的方式。
而成本压力迫使创业公司更早启动商业化。目前,GensPark 已积累 1 万付费用户,其 ARR(年度经常性收入)达到 2200 万美元。而 Manus 更是在海外市场开出单月 39 美元的基础版和单月 199 美元的高级版两种收费模式,定价比肩 OpenAI 的会员。
不过,从基础大模型到应用产品来看,目前技术优势的窗口期正在缩短,留给创业公司们的时间不多。
现在的大厂们用不到一个月的时间,交出了 60 分的答卷,当新的通用 Agent 提升到 70 分、80 分,加上免费策略,势必会对创业公司们造成进一步的冲击。
这场竞赛的终局还处于起始阶段,而在通用 Agent 能力再跃升之前的一切交锋,只是 2025Agent 爆发之年的序章。