关于ZAKER Skills 合作
雷科技 1小时前

突发!豆包深夜上线任务模式,实测干活超级靠谱,做不好 Agent 不是好 AI?

雷科技 AI 硬件组 | 编辑:三明治 | 监制:罗超

这大半夜的,字节豆包突然整了个大新闻,没有官方通知,只有功能推送:

感兴趣的大伙可以自己打开一下豆包,你会发现一个全新模式—— " 任务模式 " 已经大范围上线,雷科技编辑部小伙伴们连夜实测发现,基本上大部分用户打开豆包首页都能看到官方提示,免费。

(图片来源:雷科技)

要知道今年 AI 圈最热的词,肯定绕不开 Agent。

在 OpenClaw 爆火之后,ChatGPT 正忙着把 Codex 塞进更多工作流里,阿里千问、腾讯元宝也都在往能办事上靠。这帮厂商终于意识到,用户不是缺一个陪聊对象,用户缺的是一个能把活干完的工具。

但豆包不一样,一方面,它是国内最热闹的 AI 应用之一,月活、日活都很能打;另一边,很多人对豆包的印象还停留在 " 问答有乐子、语音挺自然、生图挺方便 " 的程度,但真要说它能不能帮你完整干一件事。

诶,争议就来了。

而现在,豆包希望通过多加一个按钮,把 Agent 这桌菜端到普通用户面前。

不想只当聊天搭子

先和大家说一下变化。

现在用户打开豆包 App 后,界面底边的模式切换选项已经从 " 快速、思考、专家 " 变更为 " 快速、专家、任务 "。

你别看就改了两个字,说实话,体验完全不一样了。

以前大伙用豆包,来来去去就是快速和专家模式。

就比如说问点游戏攻略、日常知识这种不用咋思考的,基本就是快速模式;要做点 PPT 或者文档报告啥的,可能就会用上专家模式,但归根结底操作是一样的:你说一句,它回一段,你再改,它再调。

而全新上线的任务模式,本质上就是个 Agent。

普通人可能不懂,但是说人话,就是你不再只是问豆包一个问题,而是直接丢给它一个任务。

比如 " 帮我做一份某行业调研报告 ",它会先拆任务,想想要查什么资料、去哪找信息、怎么整理结构,再一步步执行。能联网搜索,也能去调用浏览器,还能生成文档、报告,甚至处理 PPT、表格这种更像成品的东西。

不仅如此,在任务模式下,豆包还增加了定时操作功能,基本就是个全民龙虾了。

举个例子,我现在只需要对他说 " 每天上午 10 点,用浏览器浏览 IT 之家、快科技、知乎、微博,收集数码、PC、AI 方面的热点新闻,并设计一套客观的新闻价值评判体系,按照这套体系去给每条新闻进行评分,方便我后续进行筛选 "。

然后每天早上 10 点左右,豆包就会自己去操作浏览器,按照我的要求进行一系列信息收集工作,并汇成下面这样的表格反馈给我。

我大致掐表看了一下,整个过程需要 8-10 分钟。

最终整合出来的内容如图,其中评分第一的热点 SpaceX 上市,我们雷科技已经完成了内容创作,后续热点里的 HDC 相关选题也能在我们雷科技第一时间看到,至于豆包任务模式就更不用说了。

让我给这个结果打分的话,起码有个 85 分左右。

对了,我建议所有定时任务都先跑一次,以免出现下面这种情况。

而且不知道为啥,这次定时任务还触发了个 BUG,明明我登录了知乎却还是反复提示没有登陆,最终只能跳过整个过程。

诶,好笑的地方来了,点击跳过之后,豆包反而能正常收集知乎信息了。

只能说,目前任务模式还远没有大家想象的那么完美。

是个合格的「实习生」

接下来,为了帮大家搞清楚任务模式到底是不是噱头,雷科技试着给它安排了三件比较贴近日常的活。

第一件,是让它自行收集数据,做一份 PPT。

我给的题目不算太刁钻:整理国内 AI 应用竞争格局,重点看豆包、千问、元宝、DeepSeek,做成一份适合内部分享的 PPT。

这类需求非常适合任务模式。

因为它不需要什么灵感,考验的就是资料搜集、结构归纳和交付格式。豆包会先列出大纲,再去找公开数据,把几个产品的定位、用户规模、功能差异、商业化方向整理出来。

最终豆包花了 6 分钟去完成任务,成果远比我想象中完整。

它不是简单塞几页文字,而是会按照 " 行业现状、玩家对比、核心定位、趋势分析 " 去分层。

PPT 的设计也不算太死板,各种文本格式、表格设计、emoji 运用都挺像样的,至少比很多刚毕业同事的内容要像样一些。

但问题也有。

这 PPT 可以用,但不太能直接发。最大的问题不是内容不够,而是味道太 AI 了,页面逻辑有了,设计也有了,但缺少一点人类会写进去的主观判断。

在我看来,它更适合生成一份 60 分到 75 分的初稿。要变成能在会上讲的材料,还得人来收拾。

第二件,是让它操控浏览器做行业调研,这个任务之前雷科技用来测过 Workbuddy、悟空、QoderWork、OpenClaw 等等 Agent。

如果说普通联网搜索是大模型在黑箱里帮你找资料,那么浏览器操作则更像它真的坐在电脑前,替你打开网页、切换页面、提取信息。

我让它调研 "AI 手机助手最近半年有什么新变化 ",它就会自己去搜新闻、看厂商页面、整理不同公司的动作。

整个过程不算快,甚至有点磨叽,豆包甚至还出现了一些啼笑皆非的操作。

但这种慢,是可以理解的。

打开详细的操作过程,你会发现豆包可不会像之前那样梦到什么说什么,而是真的在逐个查资料,交叉整理、再完成输出。

成果方面,优点是信息面比较全。

它能把豆包手机助手、系统级 AI、超级 App 开放、厂商 Agent 这些线索串起来,也会自动区分 " 已经落地 " 和 " 还在技术预览 " 的东西。对于需要快速摸清一个陌生领域的人来说,确实省事。

不过,到了最后一步的作图还是不太行,只能说豆包图片生成的文字渲染能力确实有待提升。

缺点是,网页世界没那么欢迎 AI。

有些页面加载慢,有些内容抓不到,有些网站会挡访问。遇到这类情况,豆包任务模式真的会卡住的,这也是目前所有浏览器 Agent 绕不开的问题。

第三件,是让它设计某地的出行旅游攻略。

我选了一个比较现实的需求:三天两晚去长沙,预算中等,不想特种兵,想吃好一点,但别排太久队。

这个任务看起来轻,其实挺考验 AI。

因为旅游攻略不是把景点堆起来就完事了。交通顺不顺、饭点挤不挤、路线绕不绕、天气热不热,都会影响体验。

在跑了 12 分钟后,豆包任务模式给了一个让我想不到的结果。

神了,这可是你自己生成的网页耶。

我对编程一窍不通,只能让豆包自己试着去排查问题了,又过了 6 分钟,这次结果总算是出来了。

哦,这审美,有一点牛的。

它会按天安排路线,标出上午、下午、晚上,还会把餐厅、景点、交通方式塞进去,它也知道别把岳麓山、橘子洲、五一广场硬塞成一锅粥,路线安排至少没有明显折磨人。

但它依然有 AI 攻略的老毛病,那就是太稳,太像标准答案。

不管咋说,旅游攻略这块,我觉得它能解决 70% 的准备工作。至少大伙不用在小红书翻半天,也不用在地图上一个个收藏地点了,但最后要不要去那家店、几点出门、临时下雨怎么改,还得靠人自拍板。

几轮用下来,豆包任务模式给我的感觉是:还真挺好用,就像一个刚入职、态度很好、资料查得很勤快、PPT 也会做一点的实习生。你不能指望它独立负责一个项目,但你让它先把资料扫一遍、框架搭起来、初稿做出来,确实能省不少事。

而这种省事,对普通用户很重要。

只会陪聊的 AI 过时了

有人可能会问,豆包为什么要在这个时候推任务模式?

说到底,AI 只拿来聊天的时代快到头了。

聊天当然有价值,在可预见的未来,写文案、改标题、问问题、做陪伴,这些需求还会长期存在。

但问题是,只靠聊天,很难让用户付费。大家可以为一个真能省时间的工具花钱,却很难长期为一个 " 回答还不错 " 的聊天框掏钱。

任务模式的价值就在这里。

它把豆包从 " 你问我答 ",往 " 你说目标,我来干活 " 推了一步。做 PPT、查资料、跑网页、整理攻略,这些事情不一定多高级,但都足够具体,也足够接近日常工作和生活。

这也是为什么 ChatGPT 正在积极整合 Codex,因为这些厂商都看明白了,未来真正有价值的不是聊天框本身,而是能不能进入文档、浏览器、代码、表格和各种工作流里,把任务接过去。

豆包的优势,是离普通人足够近。很多人可能不会专门研究 Agent,但他们已经在用豆包,只要任务模式一上线,就等于把 Agent 递到了普通用户手边。

它现在还不完美,速度、稳定性、成品质量都还有提升空间。

但只要它能让更多人意识到,AI 不只是会说话,也能帮自己少干一点活,这个按钮就已经有意义了。

毕竟,大家真正想要的,可能是一个能把活接过去的豆包。

End

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容