关于ZAKER 合作
硅星人 11分钟前

养龙虾不如养骡子,MuleRun 想帮你 0 门槛认养一头会自进化的“ AI 骡子”

就在今天上午,我参加了一头 " 骡子 " 的产品体验会—— MuleRun,中文名是骡子快跑,这也是首个做到了自进化的个人 AI 产品。

结合最近的爆火的 OpenClaw,这次发布让我开始思考 "AI 员工哲学 "。

自从龙虾火了之后,各行各业的人都想养一个龙虾,做内容的、跑业务的、做研究的,甚至完全不关注 AI 的朋友,都在说:" 我也想养,但从哪里开始?"

当你真的去问这些人:" 你打算用它来干什么?" ——大多数人答不上来。他们只是觉得大家都在养,我也得养一个。至于养来干什么,养上了再说。

真正养上之后呢,崩溃时刻才是来了。

有人照教程部署了本地 Agent,跑了两天突然挂掉,报错看不懂,研究一晚没结果,最后直接删掉;有人找到了一个很具体的需求——自动抓取行业信息推送到飞书群——结果动不动烧掉大量 token,执行到一半就中断,手动盯着跑,省下的时间不如消耗的精力多;还有人任务跑到一半,AI 开始绕圈子,反复刷同一个页面,强制停掉,什么都没留下。

这些故事指向同一件事:让 AI 真正帮你做事、实现全流程自动化,在技术上是可行的,但大多数人还没找到方法,让它稳定地融入日常工作。

毕竟,龙虾这类开源的自由度高的开发者工具,能力越强,安装越复杂、出错风险越高、需要的技术背景越深,远超普通用户的射程范围。

但是,从个人电脑到智能手机,从搜索引擎到移动支付,每一种生产力工具真正大规模普及的节点,从来不是 " 用户学会了驾驭复杂系统 " 的那一刻,而是 " 把产品门槛降到普通人直接上手 " 的那一刻。

产品必须去适应用户,不是反过来。

3 月 16 日发布的 MuleRun(骡子快跑),就是一次试图把 AI 拉回普通人桌面的尝试。

这是一款主打 " 自进化 " 的个人 AI,去掉了复杂的部署和调试,核心逻辑就是让各行各业的人,能以极低的门槛雇佣自己的数字员工。

之所以叫骡子,是因为马跑得快,但成本高,普通农户养不起;驴便宜,但扛不了重活。而作为马和驴的后代,骡子解决的是一个很具体的问题:用更低的成本,把更重的活稳定干完。耐力好,脾气稳,不挑路,不需要你太多关注,活就做完了。

正如发布会上,MuleRun 创始人陈宇森提到的," 我们想做的是个人 AI。安全、稳定性、上手门槛低。它一直记着你,根据和你的交互而进化,主动提醒你但不打扰,一直在线。"

这个听起来很美的愿景能不能真的落地?我们实际测了测。

先搞清楚 MuleRun 是什么

坦白说,这一年主打 AI 自主操作的产品太多了,各家都在说 " 你只需要描述需求,AI 来执行 "。但用下来,大多数是同一个结果:你给任务,它踉踉跄跄地跑完,给出一份大差不差的报告和网页。

骡子快跑第一眼看起来也是这条路——打开网页,一个对话框,你说话,它干活。

它和 OpenClaw 的区别在于,它配置了云端的虚拟机,并非是本地优先的逻辑,由此缺失了一部分本地的用户 Context,无法直接管理终端文件,但也因此具有更高的独立性和安全性,操作也更便捷;

相似之处在于,它同样有 Heartbeat 功能,能够完成长期的监控、执行任务,并且能够从交互和任务执行中不断优化自己,适应用户的使用习惯。

我们先搞清楚它的两种工作形态。

第一种叫 Super Agent,是骡子快跑最直接的入口。你在页面的对话框里用自然语言描述需求,骡子会调用它背后封装好的工具和能力来完成任务——生图、做 PPT、建网站、批量处理文件,说清楚你要什么,它来想怎么做。

这类任务的特点是 " 做完交付 ":你要一个结果,它给你一个结果。

在这个过程中,你不需要选择模型,不需要限定任务类型,唯一需要选择的是,是否连接、使用、操作你的 GitHub 代码库。

第二种是 Computer 模式。它是一台专属于你的云端虚拟机,7 × 24 小时持续运行,就算你关掉电脑、睡觉、出门,它还在工作。

在 Computer 场景下,它内置了 "Heartbeat" 的主动触达机制,会在你开机一段时间后,主动汇报过去 24 小时的工作进展。

你可以给它布置定时任务,让它每天早上抓行业信息整理给你;可以让它持续监控某个数据,有变动就通知你;还可以配置它通过 Telegram、WhatsApp 或 Discord 主动联系你汇报进展。这类任务的特点是 " 需要一直跑着 ":人可以不在,它替你盯着。

我把几件很具体的事交给了它

分清了它的两种能力形态,接下来就是 " 拉出来干活 " 了,我们主要实测了三个场景。

测试一:批量处理一批图

有一类图片处理需求,单张做很容易,但在一段时间内保持高度的 " 品牌一致性 " 进行批量处理却极其困难。

比如,为一个电商店铺生成一系列符合品牌调性的配图,或者处理固定场景的系列文章插图。

以往,要么借助 Photoshop 进行批处理,这需要一定的专业门槛;要么在修图软件里套用固定的模板,缺乏灵活性;如果去求助常规的 AI Chatbot,那基本是在 " 抽卡 " ——每次生成的画风、细节可能都不同。

我想试试在 MuleRun 的 Super Agent 里,用自然语言把这种需要严格统一风格的批量需求描述出来,避免 " 抽卡式 " 的不确定性。

我先上传了一张图,描述了我想要的风格:涂色书风格,粗黑轮廓,无阴影,适合儿童,黑白线稿。

骡子读取图片后,自行扫描了可用的模型配置,选了一个适合风格迁移的模型,跑完了第一张转换。

结果还不错——圆脸、大眼、发型、耳环都保留了,整体确实是干净的线稿风格。

第二步,我说了一句:" 将这个过程沉淀下来,我要以后批量处理。"

于是,它创建了一个名为 coloring-book 的可复用技能,写了批量转换脚本,附上了参数说明文档,把一次性的操作封装成了下次可以直接调用的能力。

我尝试了下效果," 帮我搜索十张好看的风景照,然后全部转化成线稿。"

骡子开始自己拆解、依次执行——搜索并筛选了十张涵盖山脉、湖泊、海滩、花田的风景图,批量下载,调用刚才封装好的脚本,统一转换,最后把十张线稿一并呈现出来,还附上了每张图的主题说明。

测试二:让它帮我盯着一件我没时间盯的事

AI 短剧是最近增长最快的内容品类之一,各平台的数据每天都在变——哪些作品在涨,什么题材在跑,爆款背后有没有规律可循。这类事情,凭人工去跟踪既费时又低效,但它确实有价值。

我把这件事交给 MuleRun 的 Computer,设置了一个持续监控任务:7 × 24 小时监控 AI 短剧大盘,多平台、多维度,每 30 分钟出一次可视化 HTML 报告。

骡子开始探查哪些数据源真实可访问,B 站、今日头条、微博逐一测试,确认拿得到 API 的真实数据之后,才开始动手构建系统,最后给出的 HTML 报告看起来很专业,包含了大盘 KPI、题材热力榜、爆款排行、风格维度、AI 预测信号等模块,数据全部来自 B 站公开 API 和头条热榜,不是对历史报告的简单搜索。

过程中出现了一个插曲:第一次,MuleRun 给到的网页打不开,我提出 " 再给我一个百分百能打开的网页 ",它开始自己探索,找到了 cloudflared,打了一条公网隧道,直接给我一个 HTTPS 地址,任何设备浏览器打开即用。历史报告也有单独的存档路径。

这个测试和第一个的核心差别在于 " 时间维度 ",从结果来看,骡子执行的很好,但如果需要更专业细致的数据,还需要在 Prompt 阶段给出 DataEye 这样的数据源。

测试三:在广场上发现游戏,然后自己也试了一下

在 MuleRun 的 Use Case 广场逛了一圈之后,发现有相当多的用户在拿 MuleRun 做游戏。

于是,我们也来尝试做了做。我只给了一句话:" 做一个治愈系闯关游戏,画面唯美,配乐柔和。" 没有提任何技术参数,没有提美术风格,没有上传任何素材。

MuleRun 开始自己工作,给这个游戏起了个名字叫 " 星野漫步 " ——小狐狸在星空下的梦境森林里穿行,收集萤火虫。深紫星空加极光渐变的背景,樱花花瓣随风飘落,萤火虫有动态光晕,骡子用 Web Audio API 生成了五声音阶的柔和琴音循环,跳跃和通关各有专属音效。做完之后,它直接给了我一个链接,点开就能玩,发给朋友,手机上也能打。

一直以来,游戏开发在创意类工作里门槛算是最高的之一:美术素材、玩法逻辑、关卡设计、交互代码,每一块都是独立的专业方向。MuleRun 的能力里同时搭载了这些模块——不只是能写游戏代码,还内置了生图、视频等 API,可以批量生成美术素材,最后一键部署成可玩的在线网页。

对普通人来说,一句话能出一个能玩的 demo,这个门槛已经低到可以忽略不计了。

对专业游戏开发者来说,价值在别处:批量生产美术资产、快速搭出功能原型、把不同模块分工生成,代码也可以直接下载部署到本地,融进团队自己的开发流程里。

骡子说自己 " 越用越懂你 ",这件事是怎么做到的?

在测试 Super Agent 和 Computer 的过程中,我发现在任务完成之后,MuleRun 会主动复盘,将任务经验沉淀下来,下次可以重复操作,或者汇报下一次的任务监控进度,具有一定的主动性。

正如,陈宇森在发布会上提到,和市面上那些 " 用完即走、没有记忆 " 的工具不同,MuleRun 的核心机制在于 " 自进化 "。

让 "AI 会记住你 " 这句话,几乎每家产品都在说,但骡子在这件事上的设计逻辑,比大多数产品想得更深一些。它的自进化机制,主要在两个层面在运转。

在个体层面,它试图成为一个真正懂你的员工——深入学习并记住你的工作习惯、决策逻辑、知识积累甚至审美偏好,越用越默契。

具体来看,骡子会在你每一次使用中,积累特定场景的 AI 能力组合、行业认知、工作框架,并整理成结构化的知识存进来,记录在专属的云端环境里,随时调用、实时翻阅,在下次遇到类似场景时,提前做出判断。

此外,骡子还提供了几种预设场景模式,覆盖投资、设计、营销、开发、研究等方向。切换模式之后,系统会自动加载对应的工具包和能力。

而在群体层面,它构建了一个开放的 Agent 网络生态,别人踩过的坑、验证过的高效工作流,会被系统自动匹配给你。

这意味着,你不仅拥有了一个专属助理,还无差别共享了全网最聪明的 " 打工人 " 大脑。

具体来看,每一个用户在使用过程中沉淀出来的 Agent 任务,都可以一键发布到模板广场。骡子会根据使用频次、任务完成质量等维度,对这些 Agent 进行加权排序——被更多人验证有效的 Agent,会更容易被个人 AI 采纳。

我去广场逛了一圈。现有的 Knowledge Network 数量已经很多了,覆盖的场景也很广:风格化写作、股价监控、在 LinkedIn 上筛选潜在客户、短剧内容生成、视频脚本创作……翻都翻不完。于是,我也把我已经成功的线稿转化任务公开了出去。

对骡子快跑而言,用得越久、用得人越多,整个 Agent 网络的质量也越高,从而能够形成一个会自我增强的生态,而不是一个静止的工具库。

龙虾与骡子,两种 " 员工哲学 " 的分野

在 Agent 火爆的背景下,目前用户面临的问题,已经不是 " 要不要用 AI 员工 ",而是 " 什么样的 AI 员工更好用 " 了。

把 AI Agent 工具按照 " 使用门槛 " 和 " 控制粒度 " 两个维度做一个分类。那么龙虾代表的是高控制粒度、高使用门槛的路线——它给你最大的自由度,但代价是你要懂它、管它、救它。

换句话说,龙虾是一个能力极强但需要精细管理的顶级外包——你得写清楚需求文档、配置环境、处理各种报错,还要自己承担数据外泄的风险。

它的设计逻辑预设了一种特定的雇主画像:有技术背景、能承担风险、愿意花时间调教。

而另一种,则是门槛低、自动化程度高的 AI 员工,由它来自主承担 " 越用越懂你 " 的责任,而不是作为老板的你来适应员工。而这,也是大多数人的需求。

正如陈宇森提到的," 把 AI 的定义权,还给每一个人。骡子不是给大公司用的,就是给你用的。"

在 MuleRun 里,用户既不需要每次从零交代背景,也不需要本地安装、环境配置,只需要打开浏览器,一个对话框,就能让它干活。更重要的是,遇到问题,内置一键修复和快捷重启;如果还解决不了,会员提交邮件反馈,有专人响应。

工具遇到问题,骡子自己解决;骡子遇到问题,MuleRun 公司来兜底。

这两种 AI 员工,不是说哪个更好,而是它们适合两种不同的 " 雇主人群 ",代表着 Agent 行业里两条同时成立的路:一条路通向极致的能力上限,一条路通向真正的大众可及。

前者会让技术玩家越来越兴奋,而后者会让更多普通人第一次真正用上 AI 员工。

相关标签

最新评论

没有更多评论了
硅星人

硅星人

硅是创造未来的基础,欢迎登陆硅星球。

订阅

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容