关于ZAKER 合作
三易生活 10分钟前

找来谷歌 Gemini 做外援,苹果的 Siri 有救了

AI 加持的个性化 Siri 究竟何时才能全面上线?这或许是相当多 iPhone 用户最想知道的一个问题,毕竟 iOS 的大版本从 18 跨越到 26,个性化 Siri 的上线时间依旧还是 " 未来一年 "。如今,苹果似乎终于准备着手来解决这个问题了。

日前有海外媒体援引知情人士透露的信息称,苹果公司将以 10 亿美元 / 年的价格获取谷歌 Gemini 模型的使用权,为其承诺已久的个性化 Siri 提供技术支持。具体来说,谷歌的 Gemini 将负责处理 Siri 的摘要生成和任务规划等复杂功能,据称苹果所引入的 Gemini 模型参数量达 1.2 万亿,规模是其自研 1500 亿参数模型的 8 倍。

为了让新版 Siri 得以在明年春季如期上线,苹果这次也是无奈选择了 " 造不如买 "。因为按照相关说法,苹果只是希望将 Gemini 作为过渡方案,直至自研模型的能力可以满足要求。除此之外,Gemini 为 Siri 提供的 AI 服务均将通过苹果的私有云完成,用户数据会完全隔离,谷歌无法获取,这一点与此前苹果与 OpenAI 的合作也保持了一致。

其实不是苹果不想用自家产品,而是目前 Apple Intelligence 实在是 " 扶不起的阿斗 "。虽然 Apple Intelligence 上线已经有一年多时间,但真正落地的功能还寥寥无几,并且已经实装的功能表现也一言难尽,诸如文档抓不住重点、不会合理使用标点符号等问题。

其实有问题不可怕,苹果如今真正的难关,是短期内还看不到解决相关问题的希望。当下,苹果 AI 团队的现状只能用 " 风雨飘摇 " 来形容,以苹果基础模型团队(AFM)负责人 Ruoming Pang 的离开为标志,在今年夏季,苹果已经失去了 AKI(Answers, Knowledge and Information)团队负责人 Ke Yang、首席机器人专家 JianZhang,以及 John Peebles 等数位大语言模型(LLM)的研究员。

核心团队几乎被 " 掏空 " 是苹果 AI 部门的现状,但在当下的 AI 市场的竞争中,算力不再是桎梏,人才才是重中之重,因为算法的迭代更依赖天才的灵光一闪,所以离职潮就让苹果可能本就不足的 AI 研发能力雪上加霜。这也是为什么此前在 WWDC25 上,负责 AI 部门的高管 Craig Federighi 承认,Siri 当前版本(即 V1 架构)还无法满足客户的期望,也达不到苹果的标准。

可是被寄予厚望的 V2 架构版 Siri 迟迟难产,苹果所宣称 Siri 能更好地理解用户在对话中可能出现的错误或自我纠正,通过应用程序意图调用设备上更广泛的操作,以及利用个人知识进行语义索引等功能依然还处于 "PPT" 状态。

即便苹果在核心 AI 研发人员出走后也开始补强,但 Apple Intelligence 想要名副依旧还需要时间。可偏偏苹果在 AI 竞赛中缺的就是时间,所以引入谷歌 Gemini 作为外援就能立竿见影地让 Siri 从智障变智能。

事实上,在敲定引入谷歌 Gemini 前,据称苹果曾测试了 OpenAI 的 ChatGPT 以及 Anthropic 的 Claude。那么为何来自直接竞争对手的 Gemini,最终会成为苹果为 Siri 选择的支撑?当然是因为在一众第三方 AI 大模型里,Gemini 最契合苹果的需求。

在 lmsys 大模型竞技场等榜单里,谷歌最新的 Gemini 2.5 绝非在各个方向中都拔尖的存在。而关于 Claude 3、GPT-5、Gemini 2.5 这三个 SOTA(当前最先进)模型中谁最聪明,如今海外社交平台上被高票赞同的说法是三者各有千秋,其中 Claude 3 的代码能力独树一帜、GPT-5 在搜索上一骑绝尘,Gemini 2.5 则赢在写作能力上。

显而易见,对于普通用户而言,代码生产能力可以被忽视,毕竟绝大多数人不需要一个效率出色的代码草稿生成器,那么剩下的搜索和写作能力里,显然后者对普通用户意义更大。让 AI 帮助你从互联网世界纷繁复杂的数据海洋中找到需要的内容,确实很有意义,但它的问题就是可替代性强,因为传统搜索引擎也能做到这一点。

生成图片、总结文档、写作文字,恰恰是普通用户既缺乏又没办法假于外物的场景。如果没有 AI,想要在网络上指点江山,写出合乎逻辑且通顺的大段文字,就需要有一定的语文能力,诸如 "666"、" 绝绝子 "、" 破防 " 等互联网黑话的出现,就是因为当下网民群体的本科率不足 10%。

当然,得益于全球主要国家中普遍存在的计算机基础教育,打字几乎属于人人都会的技能,但绘画就不一样了。如果没有进行专门的学习,普通人可能都不知道如何动笔,这也是为什么 " 画师 " 能成为互联网上一个热门职业的原因。

换而言之,Gemini 最擅长的写作、生图具有一定稀缺性。不仅如此,谷歌还有一个 OpenAI 和 Anthropic 不具备的优势,那就是他们是一家存在了二十余年的跨国巨头。" 全球视野 " 虽然对于 AI 大模型的高度毫无意义,却能拓宽它的广度。

Gemini 对于多语言的支持应该是如今一众大模型中表现最好的,不仅是英语、汉语、西班牙语、法语等主流语言,就连泰语、马来语、瑞典语这些小语种的适配它也相当出色。这一点,对于业务遍及全球的苹果无疑十分重要。

模型的长处恰好契合消费级市场的特质,又具备全球化能力,同时一年只需要 10 亿美元,这样看来,苹果让 Gemini 成为 Siri 的大脑可以说是一点也不亏。

【本文图片来自网络】

相关标签