关于ZAKER Skills 合作
雷科技 8分钟前

小米开炮华为盘古的背后:拆解八大手机巨头的 AI 底牌

最近数码圈的一场口水战,直接把各大厂在 AI 时代的滤镜给震碎了。

小米工程师在微博上公开吐槽:" 现在做大模型,某些公司只会比嗓门、比情怀、搞捆绑。" 吃瓜群众都觉得,这枪口对准的就是刚在 HDC 2026 大会上高调宣布余承东重新挂帅、发誓要拿下行业第一的华为盘古大模型。

图源(雷科技)

在外行眼里这不过是日常互怼,但在雷科技(ID:leitech)看来,这几句吐槽刚好戳中了 2026 年手机 AI 战场的集体焦虑。

大家都发现云端堆参数、跑分冲榜的戏码已经不吃香了,现在的手机 AI 想活命,就得看这两个趋势:

一个是端侧 AI 能不能在本地硬扛住算力压榨;

二是系统级的智能体(Agent)能不能真正帮用户干活,把 App 之间那堵墙给砸穿。

顺着这两条线,雷科技(ID:leitech)结合近半年的实测体验和行业观察,把各大厂的底层猛料全翻了出来,看看这场 AI 新战事里,各家手里到底攥着什么牌。

拆解八大手机巨头 AI 真实底牌

1、华为:手握全栈自主体系," 软硬芯云 " 筑起围墙

在 HDC 2026 大会上,华为所展现出的打法不仅是单点技术的突破,更是目前行业内极其罕见的 " 全栈全场景 " 体系化作战。

从底层的算力芯片到最上层的 AI 应用,华为正在用一条完全自主的技术链条筑起生态壁垒。

依托昇腾算力架构和完备的云端算力基础设施,为大模型的持续演进提供了源源不断的数据吞吐保障。

在端侧,华为深度融合了 " 麒麟芯片亲和 " 技术,遵循能效比与算力协同的 " 韬定律 ",成功将原生 30B 入端模型(包含 2B 激活参数)常驻在常规运存中。借由量化剪枝和专家预测算法,手机在本地运行时不仅做到了高频小任务的低时延响应,还避开了发热功耗红线。

作为整套体系的智力中枢,openPangu 2.0 大模型今年再次展现了技术厚度。不仅支持高达 512K 的长上下文,还计划陆续开源 7 大核心组件,实现了端云协同。

系统层面,Harmony OS 更是国产唯一的全自研系统,最新发布的 HarmonyOS 7 将 "Agent 亲和系统架构 " 放在了核心位置,直接重构了应用与系统的关系,能直接将传统应用拆解、重组为可随时调用的 Skills 和智能体,实现服务的一语直达。

站在最前端的小艺系统智能体,日均唤醒已高达 30 亿次,具备 2100+ 系统级能力和 500+ 伙伴精选 Skill。在 HarmonyOS 7 的加持下,小艺变成了一个拥有空间感知、能跨设备执行复杂流转任务的超级调度官。

华为最大的优势,是它终于有机会把芯片、系统、生态和 AI 串成一套闭环,为拥有多设备的用户提供了高度连贯的 Agent 流转体验,也进一步夯实了鸿蒙生态的壁垒。

2、苹果:放弃自研 AI 请外援,借力打力的超级玩家

WWDC 2026 上亮出的 Apple Intelligence 和全新 Siri AI,虽然对国行用户来说依旧是海市蜃楼,但它把系统层融合玩出了高段位。苹果的核心大模型 AFM,本质上是找谷歌买了一份 Gemini 的食谱,拿回来自己魔改私有化的产物。

苹果把交互和系统权限挖得极深,Siri AI 不仅有了独立的交互历史 App,还长出了多模态屏幕感知能力。它能看着屏幕上的账单直接算 AA 制每个人给多少钱,能跨 App 翻找私人邮件并自动规划三天两夜的行程。

在应用层,Safari 和快捷指令玩起了 Vibe Coding。相册甚至能利用端侧模型将 2D 照片重新渲染,拓展出带有 Z 轴深度信息的空间构图壁纸。

靠着严苛的私有云计算(PCC)架构,苹果守住了的隐私底线。借谷歌的大脑帮自己充值智商,同时牢牢捏住系统调度大管家的地位,苹果依然精于算计。

加上苹果在软件生态的号召力,Siri AI 可能会是成长最快的 Agent。

3、小米:深耕自研技术基座,模型与算力两手抓

小米在 2026 年是深耕端侧算力的代表。今年他们直接投了 160 多亿元搞 AI,刚发布的 Xiaomi MiMo-V2.5-Pro 旗舰基座,端侧激活参数直接飙到了 42B。

为了让如此庞大的模型适配更多设备,小米专攻 FP4(4 位浮点数)量化技术。它在极限压缩模型体积的同时最大化保留原生推理精度,其特调版甚至在通用 GPU 上把生成速度飙到了 1000 tokens/s。

有了算力兜底,小米之前开启了移动端原生智能体 Xiaomi miclaw 的小范围封测。它直接深入系统底层,能调用 50 多种系统级工具。比如收到购票短信,它能自动完成读短信、建日历、设闹钟、查天气甚至提前打开乘车码等 7 步操作,全程只需你最后确认。

更狠的是,它完整接入了米家 IoT 生态,能读取并调度超 10 亿台智能设备。

不拼纯软件应用,而是用 Agent 去盘活庞大的米家硬件生态,这才是小米独有的护城河。

4、OPPO:让 AI 不炫技只干活,一切围绕用户需求

两年前高调官宣 "all in AI 手机 " 的 OPPO,在 ODC25 和 ColorOS 16 上,终于用一套 AI 思路重构了系统。他们没走堆参数的路线,而是推出了三大技术底座:

On-Device Compute(端侧智能计算)在本地跑出了峰值 300 tokens/s 的理论性能和 128K 长上下文;

PersonaX 记忆共生引擎为用户构建了多模态的 " 终生记忆 ";

Agent Matrix 智能体生态框架则赋予了小布跨设备执行任务的能力。

在功能层,刷 B 站时激活 " 一键闪记 ",AI 不仅能近乎实时生成大纲和思维导图,点击大纲时间轴还能一键跳回视频对应段落。利用图像识别的一键记账和一键记录取餐码功能也很实用,甚至配有专属动态图标。

比起模型算力和各种技术细节,这种能帮你省掉日常麻烦、越用越懂你的 " 小确幸 ",对普通用户来说才是最容易感知的。

5、vivo:深耕端侧轻量化,回归最真实场景

作为国内最早深耕自研大模型矩阵的厂商之一,vivo 从 2023 年发布蓝心大模型开始,就一直在端侧轻量化这条路上狂奔。

vivo 深知用户的痛点:如果断了网,AI 是不是就变成废品了?通过小 V 记忆 2.0,vivo 在手机本地直接构建起了一张完全离线的知识图谱。在不联网、绝对保护隐私的情况下,依然能让蓝心小 V 从海量照片和复杂文件中精准检索。

前文雷科技(ID:leitech)实测提到,虽然千元机跑大模型被折磨得够呛,但在旗舰机 vivo X300 Pro 上仅用 32 秒就能搞定复杂的图片识别。这种算力调度的深厚功底,让人对即将发布的端侧 AI 折叠屏 vivo Fold 6 充满期待。

6、荣耀:AI 手机激进派,不卷参数卷交互

荣耀在 2026 年基本不提自家大模型参数,而是走了一条讨巧的路线,把精力砸在了重构底层交互和硬件形态上。

在硬件形态上,MWC 2026 展示的 Robot Phone 背部搭载了微型三轴机械防抖云台,镜头能像脖子一样自动追踪主体,甚至随音乐律动,给同质化的影像旗舰提供了一种物理交互思路。

在系统侧,YOYO 智能体基于 AHI(个人 + 全局 + 边端协同)战略,可自动执行场景突破 3000+,并且带头首发接入微信 A2A 协议。

荣耀这种避实就虚的打法,用系统级的调度去连接第三方垂域大模型,反而让他们在打破 App 孤岛这条路上跑得相当顺畅。

7、谷歌:将 Gemini 塞入安卓,建立端侧生态霸权

作为安卓生态的亲爹,谷歌在 AI 时代的野心绝不仅限于做个 App,而是要彻底掌控系统底座。

在端侧下沉方面,谷歌推出了主打完全离线运行的 Gemma 4 模型,并在 Google AI Edge Gallery 中测试 Mobile Actions 功能,试图让自然语言指令直接转化为系统级操作。

虽然前文雷科技(ID:leitech)实测它在千元机上表现不佳,但这其实是谷歌在给全行业 " 立规矩 ",用系统级软件生态的硬性要求,倒逼高通、联发科等芯片厂商加快中低端 NPU 的算力迭代下放。

谷歌最恐怖的底牌在于其生态的统治力,上有谷歌全家桶,下有安卓生态,Gemini 本身也有很强的实力,当苹果需要找 Gemini 深度融合,当各家安卓旗舰将其作为全场景 Agent 的核心大脑,谷歌其实已经赢麻了。

谷歌不仅在制定端侧 AI 的系统级调度标准,更是在重新发放未来十年移动生态的入场券。

8、三星:坚持 " 外包 " 路线,全球化左右逢源

在端侧大模型和 Agent 这条赛道上,三星的走法相当务实,起步太晚,不如直接找外包。

在海外市场,三星深度绑定谷歌,Galaxy S26 系列直接用 Gemini 大模型做底座。在 MWC 展会演示中,其 Agent 能直接在后台扫描家庭群聊,检测到大家讨论点披萨,就会自动在后台打开外卖 App 把商品塞进购物车,直到付款前一步才停下来让用户确认。

而在国内市场,为了合规,三星灵活地接入了百度文心一言、美图等国内大厂的 AI 服务。

听起来像是在吃百家饭,但我必须承认三星在体验打磨上的功力。

无论是即圈即搜、通话实时翻译,还是相册智能修图,三星把这些看似东拼西凑的能力缝合得极其顺滑。只要能配合自家顶级的硬件让消费者用得舒服,用谁家的引擎并不重要。

旗舰机可以了,如何让 AI 下沉到中低端?

把大模型直接塞进手机本地运行,听起来很好,不依赖网络、零延迟、还绝对保护隐私。

但现实是,旗舰机跑本地 AI 是在享受科技,中低端机跑本地 AI 纯粹是在受刑。

今年 4 月谷歌推出了主打完全离线运行的移动端模型 Gemma 4,网上拿万元旗舰机跑测试全在叫好。

但雷科技(ID:leitech)拿搭载天玑 7400 中端芯片、配有 NPU 655 的 vivo Y500 Pro 去跑,结果直接让人看傻眼。

回答成了无效信息的重灾区:让它推荐长途高铁看的电影,它在本地哼哧哼哧跑了 500 字,足足花了 2.8 分钟,最后还废话连篇地提醒我记得带耳机。

逻辑题直接整不会了:做一道排座位的逻辑推理题,它在本地亮屏算了 3.3 分钟(期间还不能退后台),结果最后给出的还是个错误答案。

识图直接卡到死机:丢一张大商场的图,它认不出图里那么大一个 Apple Store 招牌;再丢一张绿植图,它直接在原地转圈加载了 5 分钟,直接卡死。

作为对比,同款模型在旗舰机 vivo X300 Pro 上,1.6 分钟就能跑完逻辑题,图片识别只要 32 秒。

这就是冰冷的行业现实,没有强大的硬件算力兜底,端侧大模型纯粹就是折磨用户的营销噱头。

为了解决本地运存和带宽被挤爆的痛点,大厂们开始在底层魔改算法。

比如小米专攻 FP4(4 位浮点数)量化技术,在极限压缩模型体积的同时最大化保留原生推理精度,在通用 GPU 上把生成速度飙到了 1000 tokens/s。

传音则走实用路线,把离线模型压缩进手机,在网络不好的非洲和中东地区,实现了多种复杂方言的离线实时翻译,实打实地用端侧 AI 消除了数字鸿沟。

不只是搜索画图,智能体手机要帮你干活

2026 年的 AI 手机,本质是在抢操作系统入口。

大厂们集体患上入口焦虑,电源键、负一屏、侧边栏全塞满了 AI,甚至有些厂商开始测试实体 AI 按键。

但入口堆得越多,用户越懵。真正实用的 Agent,是要手机自己能完成操作,帮用户减少操作步骤。

行业过去最头疼的是 App 之间的孤岛效应,手机助手想发个微信,得靠暴力读屏和模拟点击,稍微碰上风控就得卡壳,比如说去年的豆包手机。

而最近微信终于把大门打开了一条缝,联合华为、荣耀、小米等大厂推出了 A2A(Agent-to-Agent)协议。大模型不用再装作听不懂,而是手机助手直接把工单发给微信 Agent,由微信自己执行并返回结果。

雷科技(ID:leitech)拿荣耀 Magic8 RS 实测,唤醒 YOYO 后说一句 " 给三明治发微信说原神启动 ",系统能一句话跨越生态壁垒直接执行。

而没接入 A2A 的手机助手遇到这指令,最远只能走到 " 打开微信 " 这一步,然后就被系统弹窗拒绝。

微信这次开放,给全行业提供了一个大厂智能体之间高效协作、互不抢流量的基建范本。

在 MWC 2026 上,我们也看到不少优秀样本,努比亚 M153 则通过端侧 Nebula-GUI 在后台开虚拟机,直接模拟人类手指去各种没 API 的 App 里操作,完成一句话跨平台比价和预订。

结束语

盘完 2026 年这一整圈大厂的真实底牌,不难发现,不管高管们在台前怎么唇枪舌剑,真到了落地的层面,大家都朝着相同的方向发展:

模型必须向端侧压缩,否则低配算力纯粹是在折磨用户;

AI 必须进化为多模态 Agent,从 AI 手机到 Agent 手机,未来的智能手机必须长出眼睛和手去打破 App 之间的围墙;

隐私安全必须成为不可动摇的底线。

AI 手机真正的战争,不在于谁的模型名字更长,在于谁能让普通人每天省出多少时间。毕竟,手机不是论文答辩现场,最后决定胜负的,不是参数表,而是每天拿起来的那几分钟。

相关标签

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容