关于ZAKER 合作
虎嗅APP 17分钟前

给 Manus 七分钟,它可以做什么

出品|虎嗅科技组

作者|余杨

编辑|苗正卿

头图|视觉中国

5 月 18 日消息,NVIDIA 特供的 H20 芯片被禁止向中国销售,黄仁勋批评美国的人工智能出口管制政策,认为应让美国技术在全球范围内普及。而大洋彼岸的另一面,Manus 大方选择了开源。

作为全球首个通用 AI 智能体,Manus 于 5 月 13 日宣布开放注册,所有人均可使用。

在此之前,这款国产 AI Agent 产品实行邀请码机制,由于 " 一码难求 ",其邀请码一度被炒至数万元,被网友质疑为 " 饥饿营销 "。据其合伙人在社交媒体上发布的解释,实行邀请码制度是因为服务器容量有限,并 " 正在全力输出,让大家早日体验上更好的产品 "。

此次开放使用的虽仅限海外预览版,但也意味着,Manus 认为自己 " 准备好了 "。

Manus 是一款通用型 AI 智能体,核心理念是 " 知行合一 ",与传统 AI 助手不同,它能够自主规划并执行复杂任务,直接交付完整成果。主要功能包括自主执行、多领域应用、多智能体协作架构以及记忆与学习能力,在 GAIA 基准测试中,Manus 取得了 SOTA(State-of-the-Art)的成绩,显示其性能甚至超越了 OpenAI。

另一方面,Manus 由中国境内的北京蝴蝶效应科技有限公司全资控股,创始人肖弘毕业于华中科技大学。或许也由于它的 " 民族身份 ",2025 年 3 月 6 日,Manus 一经官宣便迅速走红,它的出现一度被称为 " 中国的第二个 DeepSeek 时刻 ",并引起了人们对 AI Agent 的广泛关注。

在官宣视频中,肖弘表示,这是完全不同的、下一代人工智能。一种新的人机协作的范式。

"Manus 不只是一个聊天机器人或者工作流,还是一个真正自主的主体,相比以往只是产生想法的人工智能,Manus 直接交付成果,弥合了概念和执行之间的差距。或许,还可以从中一瞥 AGI。" 肖弘说到。

他通过简历筛选、股票分析、房地产调研 3 个场景演示了 Manus 的任务执行情况。总结下来,首先,Manus 支持在云端异步运行,用户可关闭设备,任务完成后自动通知结果。并且,Manus 采用 " 规划代理 + 执行代理 + 验证代理 " 的分工模式,是一种多智能体协作架构。此外,它还有着记忆和学习能力,能够根据用户偏好优化任务策略,目前一共涵盖 60 多个应用场景,包括教育、数据分析、内容创作等。

其创始人肖弘表示," 知识必须应用到现实中,对世界产生有意义的影响 "。

不过,也有不少网友表示," 它的表现也没比 OpenAI 的产品好多少。"

揭下 Agent 的面纱

今天我们就一起来看看,作为一款 AI Agent 产品,Manus 到底有什么特别的表现。

首先,Manus 支持两种推理深度,标准版和高阶测试版。首次登录赠送 1000 积分,Manus 提供了使用案例参考,分为生活、研究、教育、数据分析、生产力和内容创作者几个板块,社区中展示的所有任务和网站均由用户自愿分享。

根据官方发布的简历筛选、股票分析、房地产调研演示的经验,预期中 Manus 将直接交付完整成果。因此,此次测试将上传四张图片附件,再写一段描述文字给 Manus,要求它根据小红书、Instgram、X 等平台的特点,分别生成爆款文案,整理成一个 word 给我。

prompt:我是一个内容创作者,假期我去了一个可以听虫鸣鸟叫、夜里看到星星的地方,那里的樱桃熟了。请结合图片,根据小红书、Instgram、X 平台的特点,分别生成爆款文案,整理成 word 文件。

图片附件如下:

我首先就遇到了困难。

Manus 似乎并不支持图片文件,无论是 heic 格式还是 jpg 格式都无法上传成功,于是,我将四张图片合成了一个 pdf 文件,完成了上传。

发送成功后,Manus 立刻开始了工作,并生成了 6 个步骤。

对话框上,Manus 正在使用终端,看起来非常迷人,于是我点进去,看到了以下的步骤图。

Manus 使用自己的计算机,像一个 Agent 一样工作。并在大约 2 分钟左右,进行到了第三步。

出于好奇,又点开了它的缩略图,界面分为了两部分,右边的窗口呈现出如下图所示更具体的工作路径。

可以看到,它根据我的 prompt,形成了任务清单,拆解出 8 个步骤,并逐一完成。

又过了 4 分半钟,Manus 表示已经完成任务,提交了 pdf 格式的文件给我,我随时可以下载下来查看。

我注意到,Manus 还提供此任务中所有文件的查看。

点开可以看到,它分为了文档、图片、代码文件、链接几个大类,并且按照时间顺序倒序排列,可以实现步骤上的溯源。

当然,作为一个 Agent,最重要的还是用结果说话,接下来我们就一起来看看这个 pdf 文件。

不得不说,"emoji 表情 + 种草文 + 技巧 tips" 的行文思路很 " 小红书 ",其对小红书平台的内容特点有着较好的判断,大体合格。

Manus 为 Instagram 写的文案则直接切换成了英文,包括 tag,但也明显可以看到,文字字号大了很多,标题和正文的内容没有区别开来,不免有点遗憾。

而 Twitter 的文案则简单得多,文字风格上更加注重互动性,不过,这里的 tag 也存在和 Instagram 一样的问题。

看到这里我们或许会产生这样的错觉:如果把同样的 prompt 在 chatgpt 的窗口发送出去,或许能更快地得到反馈。

我不仅这样想,还这样做了,Kimi 和 ChatGPT 确实分分钟都给了我和 Manus 差不多的 " 不完美结果 ",文字我自己复制整理后一样能用。

头脑和手

但根据官网显示,这并不是 Manus 的全部本领,因此接下来再上点难度。

prompt2 为:根据以上内容帮我生成一个 30 秒短视频拍摄脚本,并画出分镜,要求以表格的形式呈现。

我注意到,一开始 Manus 仍然是熟悉的 6 个步骤,15 秒之后变成了 5 个步骤。

也就是说,大致可以猜测,Manus 的程序底层设置里基本涵盖:理解 prompt- 读取附件 - 分析附件 - 核心任务处理 - 整理为 prompt 所要求的结果形式 - 校验检查 - 发送给用户等几个步骤。

并且,由于我要求画出分镜,Manus 还生成了 png 图片,看起来很未来可期。

上一个文本任务耗费共计 6 分半钟,而这一次,等待的时间更长,大约 8 分半钟我拿到了以下结果。

Manus 帮我画成了分镜,也提交了表格形式的短视频拍摄脚本和分镜。

打开这次任务中的所有文件,相比上次的纯文本任务,图片分类下完整显示了此次生成的分镜图。

脚本分镜文件直接下载是 txt 格式的,同时也支持导出为 pdf 文件直接交付。

pdf 文件内容截图如下:

给 Manus 七分钟

总的来说,在测评任务中,Manus 支持多种任务类型,例如文案生成、短视频脚本及分镜创作,并且能够输出多种形态的交付结果,一定程度上降低了普通内容创作者的门槛,也能提供一些创作灵感。

这整个过程,耗时大约七分钟。

对比目前各家模型所呈现的 " 思考路径 ",Manus 工作流程更加清晰,其任务被拆解成多个步骤,用户可以追踪进度并了解每个步骤的具体内容。不仅如此,Manus 还提供任务文件管理功能,用户可以查看任务中生成的所有文件,包括文档、图片、代码文件和链接,操作界面相当流畅。

不过,就七分钟的处理速度而言,Manus 生成结果相对较慢,与 ChatGPT 等工具相比,在简单文本任务上可能没有明显优势。

肖弘表示,Manus 其名称来自 " 头脑和手 ",Manus 一直在解决现实世界的问题," 知识必须应用到现实中,对世界产生有意义的影响 "。

事实上,就以上的表现,Manus 距离这个愿景还有一段距离,但它仍然呈现出 AI Agent 起步阶段的大致轮廓。现在,它的速度还不够快,生成的结果还不够精确,还不够懂人类。

但它也展现了一种想象:在等待的这七分钟里,人们可以暂时停下来,喝一杯水,看看远处,回复回复家人和朋友的讯息,暂时脱离像机器一样作业的感觉,不必担心,Agent 帮你接住了一切。

等你短暂恢复过来,它已经 " 准备好了 "。

或许有一天,当开源变得稀松平常,知识最广泛地被应用到现实中,Agent 将真正做到:扩展你的能力,放大你的影响力,成为将你的思想愿景变为现实的手。