关于ZAKER 合作
量子位 12小时前

厉害了,智谱造了全球首个手机通用 Agent!人人免费,APP 甚至直接操控云电脑

就在刚刚,全球首个手机通用 Agent,来了!

现在,假如你正在开会,但只需要给手机打一句话,就能让它" 自己动起来 ",给你点外卖:

帮我在美团外卖上,找最近的瑞幸咖啡,点一杯大杯的冰美式。

可以看到,AI 在接收到任务的一瞬间,就开始 " 嗖嗖 " 地执行起了任务。

它会直接接管你的手机,不需要在各种 APP 之间跳来跳去,就可以把点外卖的活儿给干完。

嗯,非常直观的感受就是:够方便,够智能。

那么这个 Agent 到底是什么来头?

它就是智谱刚刚发布的全球第一个手机通用 Agent,就好比把 Manus 的能力搬到了手机一样。

划个重点:免费,人人可用!

或许这时候有小伙伴要说了,让手机自己动的 Agent 不是已经有了嘛?

非也非也,这次真的有点不太一样。

因为智谱的这个 Agent,所有任务都是在云端执行,也就是相当于给你的设备安了个云手机或云电脑,不仅任务执行得流畅,更不影响你使用其它 APP!

更重要的是,这也是全球第一个大众消费级的 Agent,不只手机(安卓、iOS 均可),甚至可以操控云电脑帮你干活哦 ~

或许,这是你真正免费接触、感受 Agent 的最佳时刻。

还能做什么?

我们先简单介绍一下 AutoGLM 的操作方式。

在进入 APP 之后,可以看到有两个大类别的任务可选,一个是 " 生活助手 ",另一个是 " 办公助手 "。

以生活助手为例,点进来后是一个正常跟 AI 对话的窗口,但我们需要先点击右上角的" 手机 "

然后我们再点击底部的" 接管手机 ",就来到了之前我们提到的 " 云端智能手机 " 界面了:

在这里,我们可以像操作正常手机一样,进入到任务可能需要的 APP 里,登录并设置咱们自己的账号等。

设置完毕后,我们就让它 auto 起来了,这一次,我们来个复杂一点的任务:

我要买一个 200 块钱左右的保温杯,帮我在淘宝、京东和拼多多上比一下货。

可以看到,对于 " 货比三家 " 这样繁琐的任务,AutoGLM 都可以 " 嗖嗖 " 地自主跨 APP 且精准地执行。

而我们所要做的,就是" 发起任务→静候结果 "即可。

除了这些日常生活中能用到的功能之外,AutoGLM 还特别擅长把工作、学习场景中的任务给 auto 起来。

而且不同于现在 PC 网页端的 Agent,AutoGLM 是直接在手机里调用一台云电脑给你干活!

我们先切换到" 办公助手 "这个模式,界面是这样的:

可以看到,在输入栏的上方,便很方便地展示了 "AI 视频 "、"AI PPT"、"AI 网页 " 等功能的入口。

这一次,我们先小试牛刀,让 AutoGLM 生成一份关于 Agent 的调研报告:

帮我生成一份关于 Agent 的调研报告。

同样的,我们无需做任何操作,就能看到 AutoGLM 自己用 " 云电脑 " 搜集、整理资料,在静候几分钟之后,一份基于近 100 份参考源、数千字的报告就水灵灵地出来了:

进一步的,我们可以要求 AutoGLM 把文字的结果做成一份 PPT:

把这个报告做成一个精美的 PPT。

不得不说,原先需要我们耗时起码一天的工作,到了 AutoGLM 这里,真的仅仅需要几分钟的时间。

怎么做到的?

以上种种实测不难看出,相比传统聊天机器人只会 " 告诉你怎么做 ",AutoGLM 已经进化到" 直接帮你做 "

而且最重要的一点是,它几乎不占用本地资源。

这也是本次 AutoGLM 的关键升级之处——为每位用户准备了一台云手机和一台云电脑,类似于云端备用机(里面提前装好了一堆 APP)。

有了这个东西,用户无需安装任何应用、无需额外连接,就能直接调动 AutoGLM 执行各种任务;而且,AutoGLM 干活时不会影响用户正常使用自己的设备,二者互不干扰。

更妙的是,一些不常用但不得不装的应用,也可以直接放到云端备用机中,从而释放更多本地存储,让设备运行更流畅。

总而言之,AutoGLM 之所以能在手机、PC 等设备上流畅运行,背后实打实离不开云端执行这一底层设计。

从更广的视角来看," 云端执行 " 不仅精准击中了行业痛点,还顺应了当下正在兴起的一股趋势。

今年以来,Agent 的火爆有目共睹,但一到落地环节大家就开始集体头疼:

第一,本地设备算力有限,普通手机电脑根本无法支撑高并发、高算力需求的 Agent 任务。换句话说,偶尔跑跑简单任务还行,一遇到复杂任务就容易 " 宕机 "。

第二,即便是执行一些简单任务,Agent 在运行时也会持续占用本地 CPU、内存甚至操作权限,严重影响用户正常使用自己的设备,体验感差。

而 " 云端执行 " 恰好对症下药——既不占用本地资源,也不干扰用户对真实设备的操作。

正因如此,目前已经能看到有越来越多的行业玩家开始布局云端 Agent。

例如互联网大厂这边,阿里云就在世界人工智能大会论坛上推出了专为智能体打造的 " 超级大脑 " ——无影 AgentBay,以云端电脑形态执行各项任务。

另外,PPIO 等云厂商也推出了 "Agent 沙箱 " 等产品,为 Agent 提供专门的云端运行环境。

这些动作都说明,行业内部已经认识到云端执行对于 Agent 发展的重要性,并开始积极投入资源进行布局。

而智谱此次推出的 AutoGLM,正是依托这一设计,从只能跑跑简单任务的初级 Agent 中脱颖而出,切实融入了普通人的工作与生活中。

万物皆可 AutoGLM

与此同时,AutoGLM 并不局限于手机和电脑,还能被集成到更多载体中——

如智能音箱、车载系统甚至毛绒玩具里,主打一个 " 万物皆可 AutoGLM"。

为实现其广泛应用,智谱即日起还上线了移动端 API 申请通道及「AutoGLM 开发者生态共建计划」,通过开放 API 将 AutoGLM 的能力赋能给更多开发者的智能产品。

显而易见,智谱在 AutoGLM 上的布局,有着自己的节奏和长远考量。

从成立的第一天起,这家公司就将通用人工智能(AGI)作为追求目标,并在后续提出了 " 让机器像人一样思考 " 的愿景。

围绕这一目标,智谱规划了 L1-L5 的 AGI 路线图:从预训练大模型,到对齐推理、自我学习、自我认知,直至最终的意识智能,一步步循序推进。

而 AutoGLM,正是智谱通往 L3" 自主学习智能体 " 的关键一步——通过将 Agent 能力带给更广泛的普通用户,不仅验证了当前技术的可行性,还能在真实应用中不断积累经验与反馈,推动模型自主学习。

这种自我学习能力,使机器能够突破单纯依赖历史数据获取知识的局限,在与用户和环境的持续交互中发现新知识、总结新方法,并反过来提升自身能力,形成技术与应用的正向飞轮。

一旦这个飞轮持续运转,自然也能进一步夯实智谱在 Agent 领域的领先位置。

而且这一次有个比较新的变化是,和 GPT-5 类似,AutoGLM 也实现了能力 " 大一统 " ——

背靠智谱最新开源 SOTA 语言模型 GLM-4.5 与视觉推理模型 GLM-4.5V(纯国产 Agent),首次将推理、非推理、编码、研究、Agentic、GUI Agent 等能力整合进一个模型。

这也代表着智谱对 AGI 的早期理解:

具备通用完整的多模态和思维能力的模型是通向 AGI 的一个重要里程碑,AutoGLM 是其对 AGI 的又一阶段性探索成果。

另外从行业角度来看,AutoGLM 更重要的意义或许在于,它用真实产品验证了 " 云端执行 " 这一路线的可行性与可靠性。

不过有一说一,AutoGLM 在给行业提供新解法的同时,也为本就竞争激烈的 Agent 赛道再添一把火。

因为 Agent 发展到现在这个阶段,拼的已经不只是能否完成任务,而是能否从简单的执行者,升级为能够处理更复杂场景、更稳妥应对不确定性的 " 全能型选手 "。

当然,抛开厂商们之间的 " 腥风血雨 ",对普通用户而言,AutoGLM 这一新工具无疑正在真实改变我们和机器之间进行交互的方式——

手中的大模型不再只是 " 会聊天 ",而是能直接操作系统,真正帮忙完成任务。

更进一步,智谱还提出了从 Agent 迈向 AGI 应始终追求的 3A 原则

Around-the-clock(全时):24 小时待命与持续执行,在用户睡觉 / 离开 / 设备黑屏时仍可运行与产出。

Autonomy without interference(自运转、零干扰):Agent 在云端设备运行,不占用用户屏幕 / 算力。

Affinity(全域连接):跳出浏览器对话框,连接手机、电脑、手表、眼镜、PIN、家电等多种设备与服务,覆盖数字与物理世界。

可以预见,随着技术的持续迭代与生态的不断丰富," 问一句,剩下全交给 Agent" 的时代离我们真的不远了。

传送门:

开发者生态共建计划:https://autoglm.zhipuai.cn/misc/developer-apply

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

点亮星标

科技前沿进展每日见

相关标签

相关阅读

最新评论

没有更多评论了