文 | 窄播,作者 | 李威(北京)
今天,库克宣布现任硬件工程高级副总裁 John Ternus 将在今年 9 月出任苹果公司 CEO。他选择了一名在苹果体系内成长了 25 年的资深工程师和产品人,来带领苹果走进 AI 时代。
这意味着,库克认为苹果接下来会需要更多「让产品更好、更大胆、更美好、更有意义」的创新。而这次官宣也恰好处于龙虾爆发,引发智能手机创新思考的时间节点上。
虽然在本周发布的华为 HUAWEI Pura 90、OPPO Find X9s Pro、REDMI K90 Max 等手机上都还是在强调 AI 对拍摄、记忆等具体能力的强化,但是我们认为手机需要开始从 AI 赋能具体能力,进入到 AI 主导系统性重构的新阶段了。
龙虾和 Skill 的出现是我们做出这个判断的前提条件。一个有意思的尝试是,前些天金谷园饺子馆的老板突发奇想,vibe coding 出了一个「金谷园饺子馆 · SKILL」,然后将其上线,并利用饺子馆的公众号进行了推广。
如果有人为自己的龙虾安装了这个 skill,就能和龙虾对话获取到金谷园饺子馆的详细营业信息,比如几点开门、能否外卖、WiFi 密码是多少等。现在,金谷园老板已经在和美团的团队合作,探索排队取号能力的落地方案。

当移动互联网时代依赖手机和 APP 形成的一整套到店就餐体验,因为龙虾的出现而有了新体验。当人们不再依赖图形界面和触摸操作完成任务,交互的终点变成一个对话框,手机这个统治了人类数字生活近二十年的核心硬件产品,也会随之发生变化:
第一,尽管正在面临来自 AI 硬件的挑战,但未来的手机依然会是一个主要的社交娱乐中心,提供影音游戏等娱乐能力,承载用户的线上社交需求,让用户能够聊天、刷抖音、玩游戏和看剧;
第二,手机仍然是一个相对安全的用户数据存储硬件,和一个综合能力更强的任务执行中心。
第三,面向 AI 时代,手机作为人身边最复杂的传感器集群,会增加一个重要的感知中心功能——感知、学习用户的行为习惯、身处环境、意图等,为 AI 提供个性化的上下文信息。
第四,手机需要适应新的交互方式,搭建一个更适合 Agent 时代的操作系统,不能再用「App 时代的脑子」处理 Agent 时代的任务。
龙虾带来了新的探索方向
手机厂商对 AI 的探索并不晚,从机器学习阶段到大模型阶段,再到龙虾出现之后,手机厂商一直在紧跟技术进步,积极探索 AI 在手机上的应用。
这种探索大致可以被分为三类:
第一类是对具体能力的增强。这是手机厂商做得最早,落地应用最多的 AI 尝试。
比如我们早已熟悉的一键消除背景杂物、自动剪辑视频、生成记录摘要等能力,还有刚刚看到的 XMAGE 智拍、AI 一键闪记等功能。这类探索的本质是用 AI 提升单点体验,但护城河较浅,与独立 AI 产品形成竞争,用户选择使用的可能性不大。
第二类是为安卓的图形界面搭建 AI 执行外挂。努比亚与豆包手机助手的合作就是一次最激进的 AI 外挂尝试,此外,荣耀等厂商也在进行类似的尝试。这种方案利用 AI 的视觉识别能力(VLA 模型)和底层权限获取,模仿人在手机中进行操作,以此来解决 APP 的孤岛问题。

但这种「外挂」路线会面临一个核心问题:在第三方应用不愿进行深层开放的情况下强行拆墙,往往会遭遇迅速而激烈的封禁。冲突的根源还是互联网巨头之间的入口之争,豆包手机助手想依托 AI 建立新入口,但微信、淘宝等老入口产品并不想让自己沦为给新入口打工的人。
目前,虽然有传出豆包 AI 手机二代产品将在第二季度发布,且有两家 TOP5 手机厂商也在与其进行接触,但这种强行与互联网巨头竞争的路径,也不是最符合手机厂商长远发展诉求的选择。外挂方案更像进入 AI OS 之前的过渡产品,且很难诞生出与 Agent 相匹配的商业模式。
如果手机厂商一定需要拥抱 AI 化,那第三类探索——手机 Claw,可能会更契合手机厂商的发展诉求。小米和华为都在测试自己的手机 Claw 产品,小米的 MiClaw 是手机厂商最早推出的手机龙虾产品。华为的小艺 Claw 也很快在手机上实现了开箱即用,多端协同的养虾体验。
龙虾元年到来之后,手机交互的 Agent 化共识正在加速形成。雷军认为,龙虾对小米来说可能是 AI OS 的一种新形态。vivo 总裁胡柏山也表示,Agent 将全面重构产品交互范式,手机将从 Smart Phone 向 Agent Phone 演进。
抛弃图形界面的制约,从交互体验出发构建一套新的 AI OS,意味着手机厂商有机会不再受限于互联网巨头的恩惠,而是要通过重建交互体验与规则,吸引互联网巨头参与到一个更开放的 Agent 系统的构建中来。
新手机 OS 有四个特征
这种手机上的 Agent 化交互还处在探索的早期。我们可以从手机厂商的近期动作中,来尝试总结它的几个关键特征。
第一,更 Agent 化的助手。小米的超级小爱、华为的小艺、荣耀的 YoYo 等手机自有的助手,都在强化 AI 能力,甚至可能会逐步龙虾化。它们不再是简单的语音控制器,而是具备了主动规划能力的智能体。
同样的,苹果也在围绕 Siri 的 AI 能力提升做更多努力。已经公布的消息显示,今年的 WWDC 将会聚焦 AI 进展和全新软件与开发者工具。我们也可以期待,到 9 月苹果新 CEO 上任,是否会带来更大胆的手机 AI 体验创新。
第二,对个人知识库建设的强调。手机是一个承载个人数据、记忆的载体。厂商都在不断提升手机的记忆能力,这是在为 AI 理解和执行任务积累个性化的上下文。
荣耀选择端侧 Memory-in-Context 路线,构建一套「长期记忆 + 短期记忆 + 瞬时记忆」的仿生策略。Nothing 的 Essential Memory 则可以从用户保存的内容中提取重要信息,自动补充个人化背景信息。小米的超级小爱可以通过「小爱记忆」功能收藏屏幕内容。

荣耀研发团队通过导入多模态模型,让 YOYO 更能看懂屏幕上的内容,甚至看懂摄像头里的物理世界。vivo 则在强调影像是 AI 感知物理世界的核心「眼睛」,要让手机成为一个拥有感知力的数字伙伴。
第四,对基础模型能力的强调。小米 3 月发布了 MiMo V2 Pro、MiMo V2 Omni 及 MiMo V2 TTS 三款模型,其中 MiMo V2 Pro 参数量超万亿,支持 100 万 token 上下文窗口。苹果一方面在与谷歌合作,基于 Gemini 模型和 Google Cloud 技术构建下一代 Apple Foundation Models(AFM),另一方面也在继续自研基础大模型。
这四个特征分别对应了执行、记忆、感知、思考能力,意味着新 OS 不再是卖软硬件服务,而是要售卖一种养成个人 Agent 的土壤。
新系统还需要建两个生态
手机进行 Agent 化的过程中,构成其体验的硬件生态和应用生态也在随之发生变化。
硬件生态方面,硬件与助手的更紧密结合,会共同构成一个服务用户的交互体验。这意味着,手机要和 AI 眼镜、AI 戒指、AI 项链以及家庭的 IoT 设备组成连接更紧密的硬件网络,承载 Agent 化所需的需求沟通、数据感知和流动。
Vivo 在将资源投入到三个核心的 HUB 型产品:手机、头显、机器人,并以此为基础将「影像 +AI」的能力进行普及——手机是感知源头,端侧记住每一个用户的个性化特征与习惯;MR 头显是空间计算的训练场;而家庭机器人作为智能的终极形态,将汇聚感知并作用于物理世界。
应用生态层面,App 可能会被更原子化的 Skill 取代。荣耀 CMO 关海涛在小红书发文指出,「移动时代的技术主体是 Apps 应用,而 AI 时代的技术主体是 Agents 智能体。」App 是更固定的,在寻找执行任务的最大公约数;Agent 和 Skill 是更灵活的,能够满足个性化的细小需求。
我们看到的一个比较有意思的探索是手机厂商 Nothing 推出的 Essential Apps。用户可以围绕自己的使用习惯、日常需求快速创建今日穿搭推荐、首屏展示小组件等应用。然后用户还可以将自己创建的 Essential App 发布到 Nothing 的 Playground 平台上,让其他用户来发现和下载。

Nothing 对此的判断是,个人计算正在进入一个全新的阶段——设备开始适应人,而不再是人去适应设备。
「App 多年来一直要求人们遵循预设的应用、菜单和操作流程。如果没有现成的功能,人们只能等待别人去开发;如果功能不完全符合需求,也只能将就使用。在由 AI 塑造的新世界里,这种模式已经不再合理。」
由此可能还会探索出探索一种新的商业模式。从「下载 - 使用」转向「需求触发 -Agent 调用 -Skill 执行」,意味着要调整过去 APP 以流量为核心的商业运作逻辑,针对 Agent 用完即走的特点提出新的商业运作逻辑。现在这种模式是什么并不明朗,但很有可能会是一种免费基础流量与按需增值服务的组合体。
1987 年,苹果前 CEO 约翰 · 斯考利构思出了「知识导航仪」(Knowledge Navigator),预言了一个能与人对话、处理复杂任务的智能助理,智能手机是为承载这个助理而生的载体。
近四十年后,随着各种龙虾、类龙虾产品的落地,这个构想正在完成闭环,也让手机的交互更加贴近于人的直觉。
在这个转折点上,手机厂商正在面对两个机遇:一个是更深度参与重构 AI 交互系统的机会,另一个是真正实现万物互联,发挥出手机、AI 眼镜等硬件更直接的入口优势。二者的交集有可能会让手机厂商的 AI 助手成为 AI 时代的关键入口和能力分发渠道。
苹果的变阵,华米 Ov 的持续迭代,都在指向这个新的发展阶段。