AI 加持的个性化 Siri 究竟何时才能全面上线?这或许是相当多 iPhone 用户最想知道的一个问题,毕竟 iOS 的大版本从 18 跨越到 26,个性化 Siri 的上线时间依旧还是 " 未来一年 "。如今,苹果似乎终于准备着手来解决这个问题了。

为了让新版 Siri 得以在明年春季如期上线,苹果这次也是无奈选择了 " 造不如买 "。因为按照相关说法,苹果只是希望将 Gemini 作为过渡方案,直至自研模型的能力可以满足要求。除此之外,Gemini 为 Siri 提供的 AI 服务均将通过苹果的私有云完成,用户数据会完全隔离,谷歌无法获取,这一点与此前苹果与 OpenAI 的合作也保持了一致。

其实有问题不可怕,苹果如今真正的难关,是短期内还看不到解决相关问题的希望。当下,苹果 AI 团队的现状只能用 " 风雨飘摇 " 来形容,以苹果基础模型团队(AFM)负责人 Ruoming Pang 的离开为标志,在今年夏季,苹果已经失去了 AKI(Answers, Knowledge and Information)团队负责人 Ke Yang、首席机器人专家 JianZhang,以及 John Peebles 等数位大语言模型(LLM)的研究员。

可是被寄予厚望的 V2 架构版 Siri 迟迟难产,苹果所宣称 Siri 能更好地理解用户在对话中可能出现的错误或自我纠正,通过应用程序意图调用设备上更广泛的操作,以及利用个人知识进行语义索引等功能依然还处于 "PPT" 状态。

事实上,在敲定引入谷歌 Gemini 前,据称苹果曾测试了 OpenAI 的 ChatGPT 以及 Anthropic 的 Claude。那么为何来自直接竞争对手的 Gemini,最终会成为苹果为 Siri 选择的支撑?当然是因为在一众第三方 AI 大模型里,Gemini 最契合苹果的需求。
在 lmsys 大模型竞技场等榜单里,谷歌最新的 Gemini 2.5 绝非在各个方向中都拔尖的存在。而关于 Claude 3、GPT-5、Gemini 2.5 这三个 SOTA(当前最先进)模型中谁最聪明,如今海外社交平台上被高票赞同的说法是三者各有千秋,其中 Claude 3 的代码能力独树一帜、GPT-5 在搜索上一骑绝尘,Gemini 2.5 则赢在写作能力上。

生成图片、总结文档、写作文字,恰恰是普通用户既缺乏又没办法假于外物的场景。如果没有 AI,想要在网络上指点江山,写出合乎逻辑且通顺的大段文字,就需要有一定的语文能力,诸如 "666"、" 绝绝子 "、" 破防 " 等互联网黑话的出现,就是因为当下网民群体的本科率不足 10%。

换而言之,Gemini 最擅长的写作、生图具有一定稀缺性。不仅如此,谷歌还有一个 OpenAI 和 Anthropic 不具备的优势,那就是他们是一家存在了二十余年的跨国巨头。" 全球视野 " 虽然对于 AI 大模型的高度毫无意义,却能拓宽它的广度。

模型的长处恰好契合消费级市场的特质,又具备全球化能力,同时一年只需要 10 亿美元,这样看来,苹果让 Gemini 成为 Siri 的大脑可以说是一点也不亏。
【本文图片来自网络】