今天(2026 年 1 月 29 日),对于中国 AI 产业,乃至中国芯片产业而言,是一个很有意义的日子:平头哥(阿里巴巴集团芯片业务主体)官网公布了一款名为 " 真武 810E" 的高端 AI 芯片。在此之前,关于平头哥自研 PPU 的说法,早已在市面上广为流传,还曾登上《新闻联播》——其中出现的少量技术参数,引发了国内芯片圈子的热烈讨论。现在,平头哥自研 PPU" 真武 ",终于正式出现在外界视野之中了。
请注意:虽然这是 " 真武 " 的第一次公开亮相,但是在此之前,它早已投入实用了,规模还颇大:迄今已经在阿里云实现了多个万卡集群部署,服务了国家电网、中科院、小鹏汽车、新浪微博……等各行各业的 400 多家客户。它不是一款停留在 PPT 上的芯片,也不是一款还在早期试用阶段的芯片,而是已经扎扎实实地积累了大量客户案例、形成了一定的生态系统。早在半年多以前,我的一位阿里云的朋友就表示:" 我觉得平头哥自研芯片的水平不比市面上的主流方案差。" 当时我半信半疑,现在我差不多能理解他的自信了。
" 真武 " 的水平究竟有多高?对这个问题,我让 Gemini 大模型总结了主流英文媒体的报道,大致结论如下:
96GB 显存、700GB/s 片间互联,具备与 H20 类似的竞争力;
已经大规模使用于阿里千问大模型的训练和推理流程之中;
ICN 片间互联技术,以及 AI 产品软件栈,均为平头哥自主研发、独立知识产权。
下一代产品的研发也早在如火如荼的进行之中了。
我的个人观点是,在 AI 推理任务上," 真武 " 显然胜任,并且在一定范围内具备较强的性价比;在训练任务上,目前可了解的信息还太少,但应该也只是时间问题。如果未来一段时间内,千问大模型的新版本部分乃至全部使用 PPU 训练,我也不会感到奇怪;当然这个过程会很复杂,不能急于求成。

不过,今天我想聊的,不仅是芯片这个话题。毕竟 AI 是一个很长的产业链,芯片是其中的重要一环,但不是唯一一环。从上游的算力硬件(以芯片为核心),到中游的云服务,到下游的基础大模型——至少在这三个环节都有布局,才算是布局了整个产业链。而放眼全球,哪些科技公司堪称在三个环节都有较强的技术实力呢?我数来数去,也只有两家:谷歌、阿里巴巴。
先说谷歌:自研芯片 TPU 的实力有目共睹,而且已经向第三方大规模出货;谷歌云的增长势头极快,而且大部分新增收入来自 AI;基座大模型 Gemini 最近一年多高歌猛进,大有反超 GPT 的势头。谷歌的 " 全栈技术实力 ",在硅谷无人能敌,而且三个环节之间形成了良好的协同效应:TPU 降低了 Gemini 的训练和推理成本,Gemini 与谷歌云共同构成了 "AI+ 云 " 生态,而谷歌云和 Gemini 的成功又构成了对 TPU 最好的广告。谷歌因此成为了 2025 年股价表现最好的硅谷科技巨头,市值突破了 4 万亿美元。
反观另外两个云计算巨头——亚马逊和微软,其布局都谈不上完整。亚马逊的自研芯片 Trainium 有一定的技术实力,但是比谷歌 TPU 落后很多,外部客户群也尚未建立起来;亚马逊的自研基座大模型也是水平一般,主要依靠对 Anthropic 等外部开发商的投资。至于微软,自研芯片的发展程度还不及亚马逊,至于基座大模型更是基本依赖对 OpenAI 的投资。这两巨头的 AI 战略,都是聚焦于云平台一个环节,另外两个环节则只投入有限资源,依靠投资和合作进行布局。这是一种 " 聪明 "、" 省力 ",但是对全产业链掌控能力不足的路线。
而阿里则选择了与谷歌一致的那条更艰难的路线:全栈自研,在 AI 芯片、云计算和基座大模型三个环节均追求顶尖的自主研发。大模型端的通义实验室,云平台端的阿里云,再加上 AI 芯片端的平头哥,共同构成了所谓 " 通云哥 " 的 AI 大三角,或曰 " 三位一体 " 的 AI 全栈技术能力。这个模式,投入巨大、研发周期长、风险集中,但是一旦成功,其回报十分可观,而且可以构筑起难以撼动的竞争壁垒。在我看来,谷歌 AI 帝国从 2023 年的风雨飘摇,嬗变到 2025 年的春风得意,其中发挥决定性作用的就是全栈自研能力。

在基座大模型环节,通义实验室的水平同样不需要证明。就我个人而言,用的最多的两个国产大模型,就是千问和 DeepSeek。沙利文 ( Frost & Sullivan ) 的研究显示,2025 年上半年中国企业级大模型调用市场,千问的占比名列第一。在海外,千问的开源版本尤其受欢迎,是 Hugging Face 等平台上讨论最多的开源大模型家族之一(或许还可以去掉 " 之一 ")。就在去年,新加坡国家人工智能计划 ( AISG ) 放弃了 Meta 的 LLaMA 系列大模型,转向了千问开源架构。从这个角度看,千问比 Gemini 和 GPT 更加全面,因为后两者基本都聚焦于闭源赛道。
至于芯片环节,在 " 真武 " 公布之前,市面上对阿里的真实水平,其实并不了解。AI 圈子的很多朋友都告诉我:" 平头哥在国产 AI 芯片厂商当中处于第一梯队,甚至可能是最先进的之一。" 然而,在今天之前,大家对于 PPU 的技术参数、应用范围,还是只有模糊的认识。现在官方信息来了,相信今后还会有更多、更全面的信息披露。无论从什么角度看,平头哥 PPU 在国产芯片当中的领先位置,从现在开始应该无人能质疑了。
2025 年,是谷歌 TPU 的爆发之年,Gemini 的成功促使越来越多的外部客户订购 TPU;未来几年,谷歌很可能超过 AMD,成为全球排名第二的 GPU 厂商。同样的事情完全有可能发生在平头哥身上——千问大模型越先进、其中的 "PPU 比例 " 越高," 真武 " 以及后续的 PPU 产品就越好卖。如果外部客户产生了兴趣,可以先通过阿里云租用 PPU 算力,再决定是否采购 PPU。在长期,PPU 的外部需求肯定是 " 两条腿走路 ",通过阿里云交付的算力以及客户直接采购的算力,其规模都会很大,带动每 token 的边际成本越来越低,形成 " 通云哥 " 的生态正循环。
" 通云哥 " 的黄金三角已经成型,从今往后,对于阿里的 AI 战略,外界不应采取孤立的研究方式,而是应该将其视为一个有机整体去研究。所有大厂都在讲 "AI 生态 ",但是迄今为止,真正构筑了完整全面的自研 AI 生态的,在国内也仅有阿里一家。人类才刚刚进入 AI 时代,迈向 AGI(通用人工智能)的长征才开了一个头,未来五年、十年乃至更长的时间里,阿里的 AI 生态将为全世界的 AI 产业带来什么样的贡献和影响?没人知道答案,我只知道肯定是十分巨大、深远的。