9 月 18 日,上海举行的华为全联接大会(HC 大会)上,华为轮值董事长徐直军一上台,就提起了年初由 DeepSeek 引起的这场全民狂欢。
" 从今年春节开始到 4 月 30 日,经过多团队的协同作战,终于使昇腾(Ascend )910B/910C 的推理能力达成了客户的基本需求。" 徐直军说到,DeepSeek 横空出世吼,一时间众多政府机构、央企响应接入 DeepSeek,作为算力提供商,华为也必须跟进响应。
华为自 2018 年首次发布昇腾 310 芯片、2019 年推出昇腾 910 芯片以来,持续投入 AI 基础算力的研发与创新。虽然 DeepSeek 开创的模式大幅减少了算力需求,但徐直军认为,要走向 AGI 和物理 AI,华为认为,算力,过去是、未来也将继续是人工智能的关键。
1、华为发布多款芯片产品,规划已经设到了 2028 年
徐直军宣布,面向未来,华为已规划三个系列的昇腾芯片,包括950、960 和 970 系列。
其中,昇腾 950 系列包含两颗芯片:950PR 和 950DT,950PR 将于 2026 年一季度上市,950DT 将于 2026 年四季度上市。
昇腾 960 芯片将于 2027 年四季度上市,昇腾 970 芯片则预计是 2028 年四季度上市。
与上一代相比,昇腾 950 在多个方面实现根本性技术提升:新增支持 FP8/MXFP8/HIF8、MXFP4 等低精度数据格式,算力分别达到 1 PFLOPS 和 2 PFLOPS,大幅提升训练与推理效率;大幅提升向量算力,支持更精细粒度内存访问;互联带宽提升 2.5 倍,达到 2TB/s;并搭载自研 HBM 技术 HIBL1.0 和 HIZQ2.0。
在通算领域,华为规划了鲲鹏 950与鲲鹏 960,分别将于 2026 年第四季度和 2028 年第一季度上市,围绕支持超节点和更多核、更高性能持续演进。
此外,华为正式发布了面向超节点的互联协议——灵衢,并开放灵衢 2.0 技术规范。自 2019 年开始研究,灵衢 1.0 已开启商用验证,如今灵衢 2.0 的开放,旨在邀请产业界基于灵衢研发相关产品和部件,共建灵衢开放生态。
2、发布全球最强算力超节点
由于国际政治等复杂原因,徐直军也在发布会上直言,华为单片芯片的算力表现比不过英伟达," 但华为有三十年在连接技术的积累,华为的超节点计算机,能做到世界上算力最强,满足全世界在 AI 训练推理上的巨大需求。"
超节点(SuperPod)是眼下是智算发展的重要趋势。徐直军认为,超节点在物理上由多台机器组成,但逻辑上以一台机器学习、思考、推理。
在具体的超节点业务进展上,华为发布了 Atlas 950 SuperPoD 和 Atlas 960 SuperPoD。其中基于昇腾 950 芯片的 Atlas 950 超节点支持 8192 卡规模,由 128 个计算柜和 32 个互联柜组成,占地面积约 1000 平方米,FP8 算力达 8EFlops,FP4 算力达 16EFlops,互联带宽高达 16 PB,相当于当前全球互联网总带宽的 10 倍以上。
昇腾 950 超节点将于 2026 年第四季度上市,徐直军强调,Atlas 950 超节点将是 2026~2028 年间全球算力最强的 AI 超节点。
而另外的Atlas 960 超节点,支持 15488 卡,由 176 个计算柜和 44 个互联柜组成,算力、内存和带宽在 Atlas 950 基础上再度翻番,计划于 2027 年四季度上市。
徐直军特别提到,超节点的价值不仅限于制造、通信和计算等传统业务领域。在互联网产业广泛应用的推荐系统方面也有重要作用。华为基于泰山 950 和 Atlas 950 可构建混合超节点,为下一代深度推荐系统开创全新的架构方向。
不过,大规模超节点虽然将智能计算和通用计算能力大大提升,但其中的互联技术仍有不成熟的地方。
例如,如何实现 8192 卡乃至 15488 卡规模的可靠互联,就是行业亟待解决的技术难题。目前产业界许多已发布的超节点方案未能实现大规模部署,其核心瓶颈并非芯片本身,而是互联技术尚未成熟,具体体现是两方面的挑战:
一是如何做到长距离而且高可靠。大规模超节点机柜多,柜间联接距离长达 1000 至 2000 米。当前电互联技术在高速信号传输时距离受限,最多仅支持两个机柜互联;而光互联技术虽能满足长距离连接需求,却无法达到单一计算机系统所要求的高可靠性。
二是如何实现超大带宽与超低时延。当前跨机柜卡间互联带宽与超节点需求存在 5 倍以上差距,时延最好仅能达到 3 微秒左右,与 Atlas 950/960 设计目标仍有 24% 的差距。在时延已逼近物理极限的情况下,每 0.1 微秒的提升都极具挑战。
徐直军阐述了两方面的解决途径。
首先,为了解决长距离且高可靠问题,华为在互联协议的物理层、数据链路层、网络层、传输层等每一层都引入了高可靠机制;同时在光路引入了百纳秒级故障检测和保护切换,当出现光模块闪断或故障时,让应用无感;并且,华为重新定义和设计了光器件、光模块和互联芯片。这些创新和设计让光互联的可靠性提升 100 倍,且互联距离超过 200 米,实现了电的可靠和光的距离。
其次,为了解决大带宽且低时延问题,华为突破了多端口聚合与高密封装技术,以及平等架构和统一协议,实现了 TB 级的超大带宽,2.1 微秒的超低时延。
" 正是因为一系列系统性、原创性的技术创新,我们才攻克了超节点互联技术,满足了高可靠、全光互联、高带宽、低时延的互联要求,让大规模超节点成为了可能。" 徐直军说到。