关于ZAKER 合作
虎嗅APP 刚刚

新 Agent 玩起了“无限流”

本文来自微信公众号:直面 AI,作者:涯角,编辑:肖阳,题图来自:AI 生成

Manus 的 " 上帝之手 " 称号近日被一个新的 AI 智能体—— Flowith 旗下的 Neo 夺走了。这款智能体背后的团队不仅异常年轻,还在社交媒体上宣称在 0 营销投入的情况下,实现了 130 万美元的 ARR 收入。

在 GAIA 智能体评测标准的三个等级中,Neo 不仅超越了 Manus,还创下了新的评分记录。其中 Level1 和 Level3 更是突破了 " 整数级 " 评分。

目前的智能体市场可谓 " 大风起兮云飞扬 ",新玩家不断涌入这一赛道。从传统互联网巨头到专注产品研发的初创团队皆有涉足。

各类产品纷纷打着 "AI 智能体 " 的旗号,但正如一些网友所说:许多所谓的智能体,不过是在 Manus 的框架上又叠加了一层 LLM 而已,万物皆可套壳。

今天,让我们深入分析下这款标榜自己是 " 下一代 AI 生成力 " 的产品,看看它是不是 " 穿新鞋,走老路 "。

一、Flowith Neo:无限步骤、无限上下文、无限工具

在 Flowith 产品官网中,如果点开输入框右上角的 Agent Mode,则会自动启用 Agent Neo,在此模式下,Neo 可以智能调控各种大模型,完成长序列的复杂任务。

在非智能体模式下,Flowith 则提供了诸如常规模式、联网搜索、图片 / 视频生成等 " 垂类功能模式 "。每一个模式里都集成了数量非常多的市场主流 LLM。

Flowith 将它们能够提供的所有存货几乎都摆了出来,并分成 T1/T2 两个阵营,我稍微数了下,一共近 30 个模型。

它们集成了市场上几乎所有主流的大模型,涵盖了几乎所有模态,例如 Claude 3.7 Sonnet、Grok3、GPT Image1、Gemini 2.5 Pro preview、o3、o4 mini、DALLE 3、Flux、Recraft 和 Kling 等。

相对于 Flowith 的上一代智能体 Oracle,Neo 最大的提升在于,它将任务搬到了云端执行,智能体嵌套、上下文、工作步骤都得到了大幅的性能和稳定性提升。

这款新晋智能体产品主要有三个亮点:无限步骤、无限上下文和无限工具。

我们通过一系列测试来逐一展示这些特点。

1. 无限步骤

Neo 由于将任务的执行搬到了云端,现在的它几乎可以在任务中一直工作,即便用户关闭了网页,它对于用户本身网络环境的依赖已经不再是必需的了。

一个最明显的样本是:它可以帮你订阅大量平台的所有关键 KOL 或新闻媒体,并调用推理和相关模型撰写报告,发送到你的邮箱。用户还可以规定发送的频率,Neo 几乎会无限制地在云端跑流程,不断地重复工作步骤。

如果想要 Neo 完成此类任务,可以直接输入一段非常简单的 Prompt:

请你帮我找到 10 家最主流 AI 新闻媒体,并将它们最新更新的消息做成简报,每两小时更新一次,发送到我的邮箱。

Neo 会以非常快的速度处理用户的 Prompt,它此时的第一步就是在工作流程中与用户交互,确认我的电子邮件地址。

Neo 制定了一个非常详细的流程图,明确每个步骤的任务,为自己做出了一个清晰的整体视图。

Neo 会按步骤执行工作,收集所需知识和信息。信息来源十分广泛,并且会不断地检查信息内容是否与用户需求相一致。

以下就是 Neo 所找到的 10 家 AI 新闻信息源:

Neo 会从先前确定的 10 家 AI 新闻媒体的官方网站分别获取各自最新的 3~5 篇 AI 相关新闻报道的详细内容,并使用 browser 从每个网站上独立抓取信息。

Neo 会多线程同时处理 10 家媒体的信息抓取任务,并将所有信息整合做出一份简报:

第一份结构化的 AI 行业最新简报顺利地发到了我的邮箱,内容几乎占用了 12 页的 Word 文档。

后续,我的邮箱中陆续收到了几份来自 Flowith 在云端执行定时任务的稿件。

2. 无限上下文

从实际体验来看,Neo 的上下文非常之长,常常能达到数万甚至数十万字的地步。

这种超长的上下文能力使得 Neo 能够记住之前的对话内容,保持上下文连贯性,避免了频繁重复之前的叙述或信息,从而提升了交互的效率和质量。

在实际应用中,这意味着我们可以与 Neo 进行长时间、多轮次的深入对话,而无需担心它会 " 忘记 " 之前的讨论内容。

比如,我试着让它做了一个全球文科倒闭潮的可视化报道切片,提示词比较简略:

收集 2024 年至今中国大陆、新加坡、英国、美国、韩国、日本所有大学裁撤文科的情况,并在一张世界地图上进行可视化呈现。

拿到提示词后,Neo 会先在左侧的 workflow 面板里自行规划出一整套清晰的工作流程,然后按步骤一项项执行任务。

考虑到最终生成的内容可能过多导致混乱,它贴心地设置了一个 Files 面板,将所有生成的文件整理归类,便于随时查阅。

不到十分钟,它就收集好了九个地区的数据,并自动整合成了一篇结构完整的报道。内容不仅详实、分析有理,而且自带思辨性,与用户的意图进行了对齐。

Neo 设计的交互界面几乎是一步到位,呈现效果也非常流畅自然。

" 无限上下文 " 的 Neo 究竟能产生多少个文档?这是一个无法给出确切数字的问题。

在这一项任务中,它就累计了如此多的信息内容:

3. 无限工具

Neo 的操作流程兼容多种外部工具,并整合了 Flwith 自推出以来就广受好评的知识花园功能。知识花园其实就是我们一般所说的 " 知识库 ",但Flowith 会在你上传知识内容后,以 "Seed" 作为最小单元识别其中的知识。

为了增强 Neo 的检索能力,我会外挂知识花园中与 AI 相关的知识库,以增强 Neo 的检索能力,其中包含与人工智能相关的丰富信息。

然后输入 Prompt:

帮我找到 20 个非常专业的 AI 科技 X(原 Twitter)博主,做成网页。

然后,我又让 AI 模型自动丰富这些提示词,规定好了颜色显示等条件。

Neo 开始调用外挂工具,进行大量的相关信息搜索:

在 Neo 实际的工作步骤中,Flowith 将所有工作流搬到了 " 无限画布 " 中,很直观地显示出了一个 " 纺锤形 " 的思考样态。

在进行 HTML 网页任务的前期,Neo 会先进行知识积攒,这也是为何思维流程中体现出 " 两边细,中间宽 " 的形态。

经过三个版本的迭代,Neo 成功制作了一个 HTML 网页项目。

在这个网页中,它将奥特曼、杨立坤、吴恩达等一众 X 上的 AI 科学家和博主汇集在一起,为每个人贴上了标签,并实现了交互功能。每个名字下方还附有该博主在 X 上的链接,用户可以一键直接访问。

您目前设备暂不支持播放

可以看得出来,Neo 非常适合这类 " 需要调用多种工具并且高度复杂的任务 ",它对于大模型的调控和整体流程的把控都非常严谨。

比如,Neo 与其他 AI 智能体最大的一个区别就是:它会在工作流程中大量地嵌入审查机制,比如在每一个结果产出之前和之后都会进行自我反思。即便在所有项目结束后,也会给出好几份审查报告、项目总结报告等。

在每一个节点中,Flowith 都允许使用者进行单一节点的微调工具。

在文档文件中,Flowith 则允许用户使用文本编辑器,实时手动更改文件内容甚至是代码。无论是在编写程序代码还是修改文档内容方面,Flowith 都提供了一个直观且友好的操作界面。

这样将用户也视作参与者的操作,虽然有放权的嫌疑,但也能够让其后续的生成效果更好。

Neo 能将整个创作流程以可视化流程图的方式展示出来,我可以对其中任意节点 " 点选修改 "" 局部重启 ",真正实现模块化调用 " 无限工具 " 创作的自由调度。

这可能是 Neo 区别于传统 Agent 的关键能力:不是 " 从头再来 ",而是 " 就地优化 "。

二、Flowith,一家在 OpenAI o1 发布之前就早已深耕 Agent 赛道的选手

Flowith 最初在全网崭露头角的名称还只是 " 画布式 AI 创作平台 ",但却一直在探索智能体方向,第一代产品 Oracle 于 2024 年 8 月就已发布,甚至早于 OpenAI 的推理模型 o1 的发布。这款产品在各个社区都有一定的热度。当时的 Flowith 凭借 Oracle 甚至被誉为 " 让 Chatbot 式 AI 成为历史的下一代工具 "。

这家初创企业背后的团队也异常年轻,Flowith 由倪正民(Derek Nee)团队于 2024 年正式推出。这位 96 后 CEO 在 20 岁前就曾创立 X Academy、项目超过千万人民币 ARR 的 Realm 项目,都曾风动一时。

据 " 观察者网 " 心智观察,Flowith 的全体团队都是 95 后,市场负责人郭梓溢本人则是 00 后。这家团队在架构体系中几乎将任务导向做到了新高度:每周团队可能会有 100 个任务,而每个人只需摘取自己最适合的任务。他们在团队构建中抛弃了传统的任务分配机制,转而采用鼓励极致创新的开放式思路。

在这样的团队中孕育出来的 Oracle 显然也带有创新基因,这款产品最大的特色在于交互范式的创新。它没有沿用传统聊天框 + 黑箱执行的模式,而是开创性地引入了画布多线程交互理念。Flowith 没有自己训练大模型,而是专注于上层架构和交互创新:通过可视化工作流编排,把 LLM 的推理能力、搜索工具、插件能力组合起来。

这一理念的背后,其实代表了两种 AI 使用观念的差异:Manus 等追求的是 AI 完全自主行动,用户给出指令后 AI 自主完成一切;而 Flowith 则强调 " 用户 " 角色,等同于坦诚了一个事实:现在还不存在通用 AI 智能体,但是有了用户的参与,Flowith 能够表现得更好。

比如,在上面的操作演示中,我们可以清楚地看到,Flowith 为用户提供了微调和干预流程的能力,确保 AI 输出更精准地满足特定需求。例如,用户可以在 Flowith 画布的特定节点添加自定义数据源,使最终报告的关键信息往往能超越 Manus。

三、与大厂截然不同的思路

百度 Q1 财报的公众号文章中就把 AI 智能体放在了很重要的位置,不断地强化自家平台已经接入 " 几千 +MCP 组件 ",在未来更是会将通用 AI 智能体的任务类型扩展到数十万的水平。然而,Flowith 却走了条不同的路:研发了个 " 模拟人类大脑思维流程 " 的 AI 智能体工作流。

这或许仅是一种噱头,实际上更多地取决于使用者的个人偏好,这也反映了当前智能体市场所呈现的世界参差感:热爱者视之为真爱,可能是通向 AGI 的必由之路,而不喜欢者则觉得这玩意就是个噱头。

不过,不得不说的是,Flowith 仍然使用行业主流的 LLM,在智能能力上没有显著突破。它的优势在于速度更快、操作更流畅以及更强的反思能力。尽管如此,Flowith 还是成功地将智能体产品投入市场,因此建立了独特的竞争优势。

Flowith 所塑造的竞争壁垒主要在于用户社区和创新速度。前一代 Oracle 自发布以来,到今年 Neo 推出之前,一直在小众社区中保持了一定的热度,但也受到不少批评,比如多线程工作容易卡死、非云端导致用户过于依赖网络环境。

不过,Neo 的上线很大程度上解决了这些问题。

Flowith 的另一个潜在壁垒是团队一直想要构造的 " 社区 "。各网络平台上其实一直都有这么一句笑言:少玩产品,多搞社区。比如 Flowith 很早就搞了个 " 知识花园 " 功能模块,每个人跑完自己的工作流程还可以继续分享 Recipe 到社区里。这就会形成独特的知识共享网络,这会吸引新用户的加入。

总的来说,Manus、Lovart、字节的扣子空间、百度的心响,以及一些将 AI 智能体应用于自家搜索产品的公司,构成了整个智能体赛道。

但目前来看,与行业热度一起到来的还有些许乱象。

从 Manus 在 GAIA 上的综合成功率显著超过 OpenAI 的 DeepResearch 等系统,刷新了该基准的 SOTA 性能纪录开始,几乎所有大厂全部下场搞智能体。然而,没过多久,这些产品的宣传重点从智能体的能力转向了产品本身的能力,接着又开始宣传 MCP 工具的接入。

整个行业好像已经从 AI 能力优先,转化为生态优先。先将产品做出来,抢夺完用户,再煮酒论英雄。像 Flowith 这样的智能体在整体工作流程中几乎将自己的 " 肠子 " 都挖出来,向各位看官证明一下自己吃了几碗粉,仿佛成了一股清流。

前 OpenAI 副总裁 Lilian Weng 曾在博文中将智能体的标配总结为:Agent = LLM + Memory + Planning + Tool Use。

而在预训练大模型幻觉率仍居高不下的当今,我们将会看到这样一个局面:想要靠纯粹的 LLM 能力突围已经不再现实,从基础模型上挖掘不到更多的宝藏。各家厂商都在产品侧,以产品经理的思维寻找突破口。

本文来自微信公众号:直面 AI,作者:涯角,编辑:肖阳

相关标签
ai

相关阅读

最新评论

没有更多评论了
读览精华

读览精华

精致阅读,品味生活

订阅

觉得文章不错,微信扫描分享好友

扫码分享