Manus 的 " 上帝之手 " 称号近日被一个新的 AI 智能体—— Flowith 旗下的 Neo 夺走了。这款智能体背后的团队不仅异常年轻,还在社交媒体上宣称在 0 营销投入的情况下,实现了 130 万美元的 ARR 收入。
在 GAIA 智能体评测标准的三个等级中,Neo 不仅超越了 Manus,还创下了新的评分记录。其中 Level1 和 Level3 更是突破了 " 整数级 " 评分。
各类产品纷纷打着 "AI 智能体 " 的旗号,但正如一些网友所说:许多所谓的智能体,不过是在 Manus 的框架上又叠加了一层 LLM 而已,万物皆可套壳。
今天,让我们深入分析下这款标榜自己是 " 下一代 AI 生成力 " 的产品,看看它是不是 " 穿新鞋,走老路 "。
一、Flowith Neo:无限步骤、无限上下文、无限工具
在 Flowith 产品官网中,如果点开输入框右上角的 Agent Mode,则会自动启用 Agent Neo,在此模式下,Neo 可以智能调控各种大模型,完成长序列的复杂任务。
它们集成了市场上几乎所有主流的大模型,涵盖了几乎所有模态,例如 Claude 3.7 Sonnet、Grok3、GPT Image1、Gemini 2.5 Pro preview、o3、o4 mini、DALLE 3、Flux、Recraft 和 Kling 等。
我们通过一系列测试来逐一展示这些特点。
1. 无限步骤
Neo 由于将任务的执行搬到了云端,现在的它几乎可以在任务中一直工作,即便用户关闭了网页,它对于用户本身网络环境的依赖已经不再是必需的了。
一个最明显的样本是:它可以帮你订阅大量平台的所有关键 KOL 或新闻媒体,并调用推理和相关模型撰写报告,发送到你的邮箱。用户还可以规定发送的频率,Neo 几乎会无限制地在云端跑流程,不断地重复工作步骤。
如果想要 Neo 完成此类任务,可以直接输入一段非常简单的 Prompt:
请你帮我找到 10 家最主流 AI 新闻媒体,并将它们最新更新的消息做成简报,每两小时更新一次,发送到我的邮箱。
从实际体验来看,Neo 的上下文非常之长,常常能达到数万甚至数十万字的地步。
这种超长的上下文能力使得 Neo 能够记住之前的对话内容,保持上下文连贯性,避免了频繁重复之前的叙述或信息,从而提升了交互的效率和质量。
在实际应用中,这意味着我们可以与 Neo 进行长时间、多轮次的深入对话,而无需担心它会 " 忘记 " 之前的讨论内容。
比如,我试着让它做了一个全球文科倒闭潮的可视化报道切片,提示词比较简略:
收集 2024 年至今中国大陆、新加坡、英国、美国、韩国、日本所有大学裁撤文科的情况,并在一张世界地图上进行可视化呈现。
拿到提示词后,Neo 会先在左侧的 workflow 面板里自行规划出一整套清晰的工作流程,然后按步骤一项项执行任务。
考虑到最终生成的内容可能过多导致混乱,它贴心地设置了一个 Files 面板,将所有生成的文件整理归类,便于随时查阅。
" 无限上下文 " 的 Neo 究竟能产生多少个文档?这是一个无法给出确切数字的问题。
在这一项任务中,它就累计了如此多的信息内容:
Neo 的操作流程兼容多种外部工具,并整合了 Flwith 自推出以来就广受好评的知识花园功能。知识花园其实就是我们一般所说的 " 知识库 ",但Flowith 会在你上传知识内容后,以 "Seed" 作为最小单元识别其中的知识。
为了增强 Neo 的检索能力,我会外挂知识花园中与 AI 相关的知识库,以增强 Neo 的检索能力,其中包含与人工智能相关的丰富信息。
然后输入 Prompt:
帮我找到 20 个非常专业的 AI 科技 X(原 Twitter)博主,做成网页。
然后,我又让 AI 模型自动丰富这些提示词,规定好了颜色显示等条件。
Neo 开始调用外挂工具,进行大量的相关信息搜索:
在进行 HTML 网页任务的前期,Neo 会先进行知识积攒,这也是为何思维流程中体现出 " 两边细,中间宽 " 的形态。
在这个网页中,它将奥特曼、杨立坤、吴恩达等一众 X 上的 AI 科学家和博主汇集在一起,为每个人贴上了标签,并实现了交互功能。每个名字下方还附有该博主在 X 上的链接,用户可以一键直接访问。
您目前设备暂不支持播放
可以看得出来,Neo 非常适合这类 " 需要调用多种工具并且高度复杂的任务 ",它对于大模型的调控和整体流程的把控都非常严谨。
比如,Neo 与其他 AI 智能体最大的一个区别就是:它会在工作流程中大量地嵌入审查机制,比如在每一个结果产出之前和之后都会进行自我反思。即便在所有项目结束后,也会给出好几份审查报告、项目总结报告等。
这样将用户也视作参与者的操作,虽然有放权的嫌疑,但也能够让其后续的生成效果更好。
这可能是 Neo 区别于传统 Agent 的关键能力:不是 " 从头再来 ",而是 " 就地优化 "。
二、Flowith,一家在 OpenAI o1 发布之前就早已深耕 Agent 赛道的选手
Flowith 最初在全网崭露头角的名称还只是 " 画布式 AI 创作平台 ",但却一直在探索智能体方向,第一代产品 Oracle 于 2024 年 8 月就已发布,甚至早于 OpenAI 的推理模型 o1 的发布。这款产品在各个社区都有一定的热度。当时的 Flowith 凭借 Oracle 甚至被誉为 " 让 Chatbot 式 AI 成为历史的下一代工具 "。
这家初创企业背后的团队也异常年轻,Flowith 由倪正民(Derek Nee)团队于 2024 年正式推出。这位 96 后 CEO 在 20 岁前就曾创立 X Academy、项目超过千万人民币 ARR 的 Realm 项目,都曾风动一时。
据 " 观察者网 " 心智观察,Flowith 的全体团队都是 95 后,市场负责人郭梓溢本人则是 00 后。这家团队在架构体系中几乎将任务导向做到了新高度:每周团队可能会有 100 个任务,而每个人只需摘取自己最适合的任务。他们在团队构建中抛弃了传统的任务分配机制,转而采用鼓励极致创新的开放式思路。
在这样的团队中孕育出来的 Oracle 显然也带有创新基因,这款产品最大的特色在于交互范式的创新。它没有沿用传统聊天框 + 黑箱执行的模式,而是开创性地引入了画布多线程交互理念。Flowith 没有自己训练大模型,而是专注于上层架构和交互创新:通过可视化工作流编排,把 LLM 的推理能力、搜索工具、插件能力组合起来。
这一理念的背后,其实代表了两种 AI 使用观念的差异:Manus 等追求的是 AI 完全自主行动,用户给出指令后 AI 自主完成一切;而 Flowith 则强调 " 用户 " 角色,等同于坦诚了一个事实:现在还不存在通用 AI 智能体,但是有了用户的参与,Flowith 能够表现得更好。
比如,在上面的操作演示中,我们可以清楚地看到,Flowith 为用户提供了微调和干预流程的能力,确保 AI 输出更精准地满足特定需求。例如,用户可以在 Flowith 画布的特定节点添加自定义数据源,使最终报告的关键信息往往能超越 Manus。
三、与大厂截然不同的思路
百度 Q1 财报的公众号文章中就把 AI 智能体放在了很重要的位置,不断地强化自家平台已经接入 " 几千 +MCP 组件 ",在未来更是会将通用 AI 智能体的任务类型扩展到数十万的水平。然而,Flowith 却走了条不同的路:研发了个 " 模拟人类大脑思维流程 " 的 AI 智能体工作流。
这或许仅是一种噱头,实际上更多地取决于使用者的个人偏好,这也反映了当前智能体市场所呈现的世界参差感:热爱者视之为真爱,可能是通向 AGI 的必由之路,而不喜欢者则觉得这玩意就是个噱头。
不过,不得不说的是,Flowith 仍然使用行业主流的 LLM,在智能能力上没有显著突破。它的优势在于速度更快、操作更流畅以及更强的反思能力。尽管如此,Flowith 还是成功地将智能体产品投入市场,因此建立了独特的竞争优势。
Flowith 所塑造的竞争壁垒主要在于用户社区和创新速度。前一代 Oracle 自发布以来,到今年 Neo 推出之前,一直在小众社区中保持了一定的热度,但也受到不少批评,比如多线程工作容易卡死、非云端导致用户过于依赖网络环境。
不过,Neo 的上线很大程度上解决了这些问题。
Flowith 的另一个潜在壁垒是团队一直想要构造的 " 社区 "。各网络平台上其实一直都有这么一句笑言:少玩产品,多搞社区。比如 Flowith 很早就搞了个 " 知识花园 " 功能模块,每个人跑完自己的工作流程还可以继续分享 Recipe 到社区里。这就会形成独特的知识共享网络,这会吸引新用户的加入。
总的来说,Manus、Lovart、字节的扣子空间、百度的心响,以及一些将 AI 智能体应用于自家搜索产品的公司,构成了整个智能体赛道。
但目前来看,与行业热度一起到来的还有些许乱象。
从 Manus 在 GAIA 上的综合成功率显著超过 OpenAI 的 DeepResearch 等系统,刷新了该基准的 SOTA 性能纪录开始,几乎所有大厂全部下场搞智能体。然而,没过多久,这些产品的宣传重点从智能体的能力转向了产品本身的能力,接着又开始宣传 MCP 工具的接入。
整个行业好像已经从 AI 能力优先,转化为生态优先。先将产品做出来,抢夺完用户,再煮酒论英雄。像 Flowith 这样的智能体在整体工作流程中几乎将自己的 " 肠子 " 都挖出来,向各位看官证明一下自己吃了几碗粉,仿佛成了一股清流。
前 OpenAI 副总裁 Lilian Weng 曾在博文中将智能体的标配总结为:Agent = LLM + Memory + Planning + Tool Use。
而在预训练大模型幻觉率仍居高不下的当今,我们将会看到这样一个局面:想要靠纯粹的 LLM 能力突围已经不再现实,从基础模型上挖掘不到更多的宝藏。各家厂商都在产品侧,以产品经理的思维寻找突破口。
本文来自微信公众号:直面 AI,作者:涯角,编辑:肖阳