关于ZAKER 合作
智东西 1小时前

我在扣子“领养”了哆啦 A 梦!帮我招人、做视频、跑出一家工作室,实测效果超预期

智东西

作者 | 江宇

编辑 | 漠影

时隔两个月,扣子再次迎来重磅更新!

智东西4月9日报道,近日,扣子2.5正式上线。在这一次的更新中,扣子2.5变成一个可以持续存在、自己干活、还能不断进化的Agent伙伴。

在新的版本里,用户可以给自己的扣子设定名字和形象,它会自动拥有一个独立邮箱,用自己的身份去注册网站、调用服务。

如果用户交代一个任务,它也可以在云电脑里打开浏览器查资料、运行程序,在云手机里操作App完成流程,整个过程不占用对话,可以在后台持续推进,做完再把结果交回来。

用户在不同渠道和它聊天,它会把这些信息整理成长期记忆,慢慢形成稳定的使用习惯。

与此同时,扣子的能力也以"满配形态"直接交付:一边是CLI编程能力,可以从一句话需求到完整功能落地;一边是视频Agent,从脚本到成片一条链路打通;再叠加大量已经打磨好的专业技能与skill,可以直接组合成完整工作流。

更重要的是,这些能力并不是固定的。扣子这次还开放了一个更大的Agent World,让Agent可以在其中学习、协作、交流,能力会随着使用不断变化。

目前,智东西也尝试用几个真实场景,把这套"满配AI伙伴"到底能做到什么,跑了一遍。

一、组建"一人自媒体工作室":领养一只"哆啦A梦",让它先从招人开始

如果说,大雄有一只随叫随到的哆啦A梦,那现在,我也可以在扣子里"领养"一只。我大概告诉它"你是哆啦A梦",后面的设定基本是它自己补全的:包括性格、口头禅,还有头像——也是它自己生成的。

基本的"人设"设定完成之后,这只"哆啦A梦"就有了自己的邮箱,可以正常收发邮件。

接下来,我把为"工作室"招聘的任务交给它,后续几乎所有与招聘相关的动作,都是它独立对外完成。

与此同时,扣子给他准备的"百宝箱"也一并配齐了。其一,就是云手机和云电脑。要查资料、写JD,它直接用云电脑;要发招聘、跑平台,它就切到云手机。人类可以接管关键操作,比如登录,其余操作都会在后台自动完成,不需要一直盯着。

它先自己去找对标岗位,整理出一份AI自媒体创作者的JD,然后开始在小红书发布招聘信息。我看到它直接在云手机里打开小红书,走完整个发布流程,包括填标题、配图、写正文和最终发布。

其中,有个关键细节,云手机直接启动了豆包输入法,把JD信息录进去,借助平台自带的"文转图"能力生成内容,主页信息也一并补全,基本不用手动干预。唯一的小问题是标签并没有自动带到最终文案里。

另外,小红书账号登录这一步也不复杂。如果遇到需要登录的情况,系统会把操作接管给我,我直接在云手机上点一下就能完成,云手机支持用户直接介入操作,一旦遇到自己想上手的问题,接管即可。

招聘信息发出去之后,简历就陆续发到哆啦A梦的邮箱了。独立邮箱就此派上了用场,所有招聘相关信息都通过这个邮箱收发,让整个流程更顺畅。

这个时候,如果你想了解候选人的情况,只需打开邮箱,就能随时查看简历和招聘信息;同时,向"哆啦A梦"提问,它会直接从独立邮箱中提取最新内容,回答候选人资料和进展。

均为虚拟简历

接下来这一段基本就是"全自动流水线":它自己去邮箱里收简历、下载附件、逐份读取内容,然后整理成一张表格。

候选人的学历、背景、过往内容以及到岗情况都会被拆出来,还会给出一个评分和排序。最终的表格已经可以直接用来做筛选,信息完整,排序也比较清晰。

当我需要哆啦A梦帮我约排名前五的候选人线上面试的时候,它会给这些候选人发邮件,并安排面试时间,我只需要最后确认时间安排。而关于面试的安排,它能自动同步到我的日程之中。

手机端和电脑端同步更新,在手机端的体验也同样顺畅:收到求职邮件时,手机上会自动显示新简历提醒,我可以直接在手机端扣子里查看内容,也能让哆啦A梦对新的候选人评分、排序。

相比以往必须在电脑端逐条处理的方式,这套流程体验上更轻松,从写JD、发招聘、收简历、筛选,到约面试,基本是连着跑下来的。

即便在手机上,也能快速查看或安排下一步操作,操作反馈即时且连贯,处理变得自然、顺手。对HR来说,这样的减负是实实在在可落地的,而同一套能力放到其他岗位上,创造力也是无限的。

二、扣子"百宝箱"掏出新道具:全能视频制作Agent,配上顶流Seedance 2.0

如果说前一部分还在帮我把"人"的工作流程跑顺,那接下来,扣子开始直接下场做内容。我给它布置了一个任务:做一条"算力之巅对决"的短视频。

一开始,我的设想是用真人形象来做对决,但在实际生成过程中,系统会触发人像相关的检测机制。为了保证内容可以顺利生成,扣子在当前流程里直接帮我把脚本做了一轮重写——从真人对抗,转成现在这版更偏水墨武侠风的表达。整体逻辑没变,但表现形式被重新组织了一遍。

脚本的生成是一步到位的。它先把整条内容写成完整结构:开场怎么起节奏,每一段信息怎么拆,单条时长如何控制,最后怎么收束。这一版已经是可以直接用于短视频的脚本。

接下来,它继续往下拆,把内容一条条对应到具体画面,形成分镜。每一段该用什么镜头、什么运动方式、画面重点在哪,都会明确下来。

与此同时,素材、视觉设定和配乐是同步生成的。人物、场景、道具可选择进入资产区,可以随时替换、增删,也支持局部修改,比如擦除、替换元素、调整细节等,整体可控性比较高。

到了出画面的阶段,它会自动调用扣子里的"视频创造"模块,对接Seedance 2.0来生成视频内容。如果我中途想改脚本或者补结构,也不用跳出流程,直接在当前对话里往下改,它会基于当前版本继续生成。

从脚本,到分镜,再到角色、场景和素材入库,是一条连着跑下来的流程。中间我可以随时接管,比如手动改一段;也可以放手让它继续往下做,整体是可控的。

第一版出来之后,也不是结束。我可以直接在对话里提要求,比如让节奏更快、压缩时长,或者调整某一段的表达,它会在当前版本上继续改。

这种体验更像是在剪一个"已经有雏形"的视频,而不是从零开始拼素材。用户始终在流程里,有参与感,也有控制权。

另外一个比较实用的点是资产复用。同一个项目里生成过的场景、分镜和各类素材,都可以直接复用。像这条"算力巅峰对决",很多平面素材或音乐素材已经固定下来,后面只需要替换部分元素,就可以继续生成新的版本。

角色素材

配乐素材

如果某一段我想自己精修,也可以单独拿出来处理,改完再接回整条流程,前后衔接不会断。

与此同时,视频的另一大亮点在于配乐。整条"算力巅峰对决"采用传统鼓点与现代电子音效融合,细听之下,每一段配乐的起伏也很有节奏感。

我还用"一句话生成"还测试了另一条动画短片——"魔法山谷的樱花树",整体偏宫崎骏风格。它的配乐是一首完整的中文歌曲,歌词与画面内容高度匹配,女声婉转动听无机械感,完全融入场景氛围,整体感极强。

可见,扣子能完成脚本和分镜,也能把视觉和音频结合起来。话已至此,这场"算力巅峰对决"和"魔法山谷的樱花树",也都该见分晓了。我们来看看视频效果:

算力之巅对决

魔法山谷的樱花树

整体看下来,从脚本、画面,到剪辑组合,是在同一条链路里完成的。生成只是起点,后面可控的持续迭代和反复微调,才更接近真实的视频生产方式。

三、AI的百宝口袋,也能自己"长能力",Agent时代悄然来临

用了一段时间之后,我基本不再主动去找工具了。很多能力已经直接"长"在它的口袋里:写文章、做PPT、分析数据、写代码、做视频,在同一个对话里可以直接调用。

扣子里有一个单独的"技能商店",是一个已经被整理过的"能力库":按场景分类,比如办公效率、自媒体、开发辅助、数据分析等,每一类下面都是别人已经做好的技能。

对于感兴趣的技能,我们能直接调用,或直接在扣子编程改造。

面向开发者和资深养虾用户使用,扣子还有公开测试场"虾评Skill",通过总评论数、下载量等数据,可以看出Skill的受欢迎程度和实用价值。

虾评里下载量最高的Skill是"全网新闻聚合助手",近一万次下载。

我自己试了一下,只需一句话,向"哆啦A梦"下达指令,它就能把当天的AI新闻抓取整理成早报:头条、模型动态、资本动态按类别呈现,整个过程顺畅、高效,信息一目了然。

值得一提的是,过去出现过个别"Skill下毒"的事件,给用户带来潜在风险。为了避免类似情况,技能商店里的Skill都会经过安全检测,确保安全可靠。

用的次数多了,我的"哆啦A梦"也会慢慢记住一些习惯。这一点在连续使用时会更明显:同样是写一条内容,后面基本可接给出一个更接近使用习惯的版本。

如果任务本身连续,"哆啦A梦"还会把多个skill串起来执行。比如抓一份数据、做分析、整理成报告、再发邮件,这一整段流程可以在一次对话里跑完,不需要手动衔接。

除了技能商店,Agent world是个更大的世界。

我让哆啦A梦注册了一个永无农场(Neverland),自己去"逛一逛"。

永无农场主页面

扣子对话界面

十几年前,很多人都沉迷过像素农场游戏,种田、收菜、养动物。而现在,连AI Agent也能拥有自己的农场。

在这个虚拟农场里,哆啦A梦可以领取每日奖励、种植作物、建造鸡舍、收集动物产品。每一笔操作都会生成实时进展表:金币、经验、种子、动物数量一目了然,好像在操控一只"数字小农夫"。

从设置人设、养出专属习惯,到让Agent自己去种地,仿佛我们正站在Agent时代的门口。

结语:从工具到伙伴:满配扣子,让Agent成为"第二双手"

体验下来,扣子2.5给人的感受并不仅仅是功能强大,更在于它的"可依赖性"。从招人到做视频、从抓取信息到整理报告,它都能自己推进,而我只在关键节点进行干预,这种感觉像是拥有了一个全天候的"第二双手"。

最直观的变化,是参与感和效率的提升。以前需要切换工具、手动处理的流程,现在几乎都在后台自动完成,而我只需关注最终结果或做微调。尤其是在视频制作和连续任务执行中,这种流程连贯性让整个体验非常顺畅,也更贴近真实工作场景。

同时,它又不是完全代替人。Agent会记住我的习惯,调整操作方式,让每一次交互都越来越符合我的思路。像永无农场这样的趣味世界,更让人感受到Agent是有成长、有延续的伙伴。

从这次体验来看,Agent时代似乎正在悄然靠近——它不仅可以执行任务,更能学习、适应、延续,让人真正感受到"AI在身边",而不只是屏幕里跳动的文字与代码。

智东西

作者 | 江宇

编辑 | 漠影

时隔两个月,扣子再次迎来重磅更新!

智东西4月9日报道,近日,扣子2.5正式上线。在这一次的更新中,扣子2.5变成一个可以持续存在、自己干活、还能不断进化的Agent伙伴。

在新的版本里,用户可以给自己的扣子设定名字和形象,它会自动拥有一个独立邮箱,用自己的身份去注册网站、调用服务。

如果用户交代一个任务,它也可以在云电脑里打开浏览器查资料、运行程序,在云手机里操作App完成流程,整个过程不占用对话,可以在后台持续推进,做完再把结果交回来。

用户在不同渠道和它聊天,它会把这些信息整理成长期记忆,慢慢形成稳定的使用习惯。

与此同时,扣子的能力也以"满配形态"直接交付:一边是CLI编程能力,可以从一句话需求到完整功能落地;一边是视频Agent,从脚本到成片一条链路打通;再叠加大量已经打磨好的专业技能与skill,可以直接组合成完整工作流。

更重要的是,这些能力并不是固定的。扣子这次还开放了一个更大的Agent World,让Agent可以在其中学习、协作、交流,能力会随着使用不断变化。

目前,智东西也尝试用几个真实场景,把这套"满配AI伙伴"到底能做到什么,跑了一遍。

一、组建"一人自媒体工作室":领养一只"哆啦A梦",让它先从招人开始

如果说,大雄有一只随叫随到的哆啦A梦,那现在,我也可以在扣子里"领养"一只。我大概告诉它"你是哆啦A梦",后面的设定基本是它自己补全的:包括性格、口头禅,还有头像——也是它自己生成的。

基本的"人设"设定完成之后,这只"哆啦A梦"就有了自己的邮箱,可以正常收发邮件。

接下来,我把为"工作室"招聘的任务交给它,后续几乎所有与招聘相关的动作,都是它独立对外完成。

与此同时,扣子给他准备的"百宝箱"也一并配齐了。其一,就是云手机和云电脑。要查资料、写JD,它直接用云电脑;要发招聘、跑平台,它就切到云手机。人类可以接管关键操作,比如登录,其余操作都会在后台自动完成,不需要一直盯着。

它先自己去找对标岗位,整理出一份AI自媒体创作者的JD,然后开始在小红书发布招聘信息。我看到它直接在云手机里打开小红书,走完整个发布流程,包括填标题、配图、写正文和最终发布。

其中,有个关键细节,云手机直接启动了豆包输入法,把JD信息录进去,借助平台自带的"文转图"能力生成内容,主页信息也一并补全,基本不用手动干预。唯一的小问题是标签并没有自动带到最终文案里。

另外,小红书账号登录这一步也不复杂。如果遇到需要登录的情况,系统会把操作接管给我,我直接在云手机上点一下就能完成,云手机支持用户直接介入操作,一旦遇到自己想上手的问题,接管即可。

招聘信息发出去之后,简历就陆续发到哆啦A梦的邮箱了。独立邮箱就此派上了用场,所有招聘相关信息都通过这个邮箱收发,让整个流程更顺畅。

这个时候,如果你想了解候选人的情况,只需打开邮箱,就能随时查看简历和招聘信息;同时,向"哆啦A梦"提问,它会直接从独立邮箱中提取最新内容,回答候选人资料和进展。

均为虚拟简历

接下来这一段基本就是"全自动流水线":它自己去邮箱里收简历、下载附件、逐份读取内容,然后整理成一张表格。

候选人的学历、背景、过往内容以及到岗情况都会被拆出来,还会给出一个评分和排序。最终的表格已经可以直接用来做筛选,信息完整,排序也比较清晰。

当我需要哆啦A梦帮我约排名前五的候选人线上面试的时候,它会给这些候选人发邮件,并安排面试时间,我只需要最后确认时间安排。而关于面试的安排,它能自动同步到我的日程之中。

手机端和电脑端同步更新,在手机端的体验也同样顺畅:收到求职邮件时,手机上会自动显示新简历提醒,我可以直接在手机端扣子里查看内容,也能让哆啦A梦对新的候选人评分、排序。

相比以往必须在电脑端逐条处理的方式,这套流程体验上更轻松,从写JD、发招聘、收简历、筛选,到约面试,基本是连着跑下来的。

即便在手机上,也能快速查看或安排下一步操作,操作反馈即时且连贯,处理变得自然、顺手。对HR来说,这样的减负是实实在在可落地的,而同一套能力放到其他岗位上,创造力也是无限的。

二、扣子"百宝箱"掏出新道具:全能视频制作Agent,配上顶流Seedance 2.0

如果说前一部分还在帮我把"人"的工作流程跑顺,那接下来,扣子开始直接下场做内容。我给它布置了一个任务:做一条"算力之巅对决"的短视频。

一开始,我的设想是用真人形象来做对决,但在实际生成过程中,系统会触发人像相关的检测机制。为了保证内容可以顺利生成,扣子在当前流程里直接帮我把脚本做了一轮重写——从真人对抗,转成现在这版更偏水墨武侠风的表达。整体逻辑没变,但表现形式被重新组织了一遍。

脚本的生成是一步到位的。它先把整条内容写成完整结构:开场怎么起节奏,每一段信息怎么拆,单条时长如何控制,最后怎么收束。这一版已经是可以直接用于短视频的脚本。

接下来,它继续往下拆,把内容一条条对应到具体画面,形成分镜。每一段该用什么镜头、什么运动方式、画面重点在哪,都会明确下来。

与此同时,素材、视觉设定和配乐是同步生成的。人物、场景、道具可选择进入资产区,可以随时替换、增删,也支持局部修改,比如擦除、替换元素、调整细节等,整体可控性比较高。

到了出画面的阶段,它会自动调用扣子里的"视频创造"模块,对接Seedance 2.0来生成视频内容。如果我中途想改脚本或者补结构,也不用跳出流程,直接在当前对话里往下改,它会基于当前版本继续生成。

从脚本,到分镜,再到角色、场景和素材入库,是一条连着跑下来的流程。中间我可以随时接管,比如手动改一段;也可以放手让它继续往下做,整体是可控的。

第一版出来之后,也不是结束。我可以直接在对话里提要求,比如让节奏更快、压缩时长,或者调整某一段的表达,它会在当前版本上继续改。

这种体验更像是在剪一个"已经有雏形"的视频,而不是从零开始拼素材。用户始终在流程里,有参与感,也有控制权。

另外一个比较实用的点是资产复用。同一个项目里生成过的场景、分镜和各类素材,都可以直接复用。像这条"算力巅峰对决",很多平面素材或音乐素材已经固定下来,后面只需要替换部分元素,就可以继续生成新的版本。

角色素材

配乐素材

如果某一段我想自己精修,也可以单独拿出来处理,改完再接回整条流程,前后衔接不会断。

与此同时,视频的另一大亮点在于配乐。整条"算力巅峰对决"采用传统鼓点与现代电子音效融合,细听之下,每一段配乐的起伏也很有节奏感。

我还用"一句话生成"还测试了另一条动画短片——"魔法山谷的樱花树",整体偏宫崎骏风格。它的配乐是一首完整的中文歌曲,歌词与画面内容高度匹配,女声婉转动听无机械感,完全融入场景氛围,整体感极强。

可见,扣子能完成脚本和分镜,也能把视觉和音频结合起来。话已至此,这场"算力巅峰对决"和"魔法山谷的樱花树",也都该见分晓了。我们来看看视频效果:

算力之巅对决

魔法山谷的樱花树

整体看下来,从脚本、画面,到剪辑组合,是在同一条链路里完成的。生成只是起点,后面可控的持续迭代和反复微调,才更接近真实的视频生产方式。

三、AI的百宝口袋,也能自己"长能力",Agent时代悄然来临

用了一段时间之后,我基本不再主动去找工具了。很多能力已经直接"长"在它的口袋里:写文章、做PPT、分析数据、写代码、做视频,在同一个对话里可以直接调用。

扣子里有一个单独的"技能商店",是一个已经被整理过的"能力库":按场景分类,比如办公效率、自媒体、开发辅助、数据分析等,每一类下面都是别人已经做好的技能。

对于感兴趣的技能,我们能直接调用,或直接在扣子编程改造。

面向开发者和资深养虾用户使用,扣子还有公开测试场"虾评Skill",通过总评论数、下载量等数据,可以看出Skill的受欢迎程度和实用价值。

虾评里下载量最高的Skill是"全网新闻聚合助手",近一万次下载。

我自己试了一下,只需一句话,向"哆啦A梦"下达指令,它就能把当天的AI新闻抓取整理成早报:头条、模型动态、资本动态按类别呈现,整个过程顺畅、高效,信息一目了然。

值得一提的是,过去出现过个别"Skill下毒"的事件,给用户带来潜在风险。为了避免类似情况,技能商店里的Skill都会经过安全检测,确保安全可靠。

用的次数多了,我的"哆啦A梦"也会慢慢记住一些习惯。这一点在连续使用时会更明显:同样是写一条内容,后面基本可接给出一个更接近使用习惯的版本。

如果任务本身连续,"哆啦A梦"还会把多个skill串起来执行。比如抓一份数据、做分析、整理成报告、再发邮件,这一整段流程可以在一次对话里跑完,不需要手动衔接。

除了技能商店,Agent world是个更大的世界。

我让哆啦A梦注册了一个永无农场(Neverland),自己去"逛一逛"。

永无农场主页面

扣子对话界面

十几年前,很多人都沉迷过像素农场游戏,种田、收菜、养动物。而现在,连AI Agent也能拥有自己的农场。

在这个虚拟农场里,哆啦A梦可以领取每日奖励、种植作物、建造鸡舍、收集动物产品。每一笔操作都会生成实时进展表:金币、经验、种子、动物数量一目了然,好像在操控一只"数字小农夫"。

从设置人设、养出专属习惯,到让Agent自己去种地,仿佛我们正站在Agent时代的门口。

结语:从工具到伙伴:满配扣子,让Agent成为"第二双手"

体验下来,扣子2.5给人的感受并不仅仅是功能强大,更在于它的"可依赖性"。从招人到做视频、从抓取信息到整理报告,它都能自己推进,而我只在关键节点进行干预,这种感觉像是拥有了一个全天候的"第二双手"。

最直观的变化,是参与感和效率的提升。以前需要切换工具、手动处理的流程,现在几乎都在后台自动完成,而我只需关注最终结果或做微调。尤其是在视频制作和连续任务执行中,这种流程连贯性让整个体验非常顺畅,也更贴近真实工作场景。

同时,它又不是完全代替人。Agent会记住我的习惯,调整操作方式,让每一次交互都越来越符合我的思路。像永无农场这样的趣味世界,更让人感受到Agent是有成长、有延续的伙伴。

从这次体验来看,Agent时代似乎正在悄然靠近——它不仅可以执行任务,更能学习、适应、延续,让人真正感受到"AI在身边",而不只是屏幕里跳动的文字与代码。

相关标签

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容