关于ZAKER 合作
硅星人 7分钟前

传说中的 6G,挑头的居然不是高通而是英伟达

Cloud is where AI is born;

Device is where AI acts;

Edge will be where AI lives。

如果要在 GTC DC 大会上,寻找一个英伟达身上最 " 性感 " 而非最 " 实感 " 的故事,不同人或许有不同的答案,但有一个技术品牌可能真的要新加入候选人名单了。正是为了它,英伟达刚刚花费了 10 亿美元入股了老牌电信厂商诺基亚。它就是英伟达 AI-RAN 的核心技术品牌:

Aerial。

Aerial,今天是一个带有点工业气息的词语。但词源来自拉丁语 aerius,意指 " 空气的、轻盈的、高耸的 ",在古时也用来形容虚幻的、轻盈优雅的美。它让人联想起另一位硅谷 " 帮主 "OpenAI 的视频产品:

Sora。

Sora 在日语中的本意是 " 空 ",可以是天空,也可以是想象遥远地方时的一种心境。

无论英伟达还是 OpenAI 都把自己的旗舰产品指向天空,这不是一种偶然,也不仅是一种硅谷审美乐趣上的趋同。或许它们将讲述的是相似一个东西,但现在我们先暂时按下不表。

所谓 AI-RAN,用大白话理解就是在通讯基站上加入算力,让未来海量的场景计算可以不用进入云,直接在基站计算完以后就能够返回给终端的场景设备。

这样的方式有两个最显而易见的好处:

一个是节省大量的传输成本,降低云算力中心的压力。

微软 CEO 萨提亚 · 纳德拉(Satya Nadella)在前两天与 OpenAI CEO 山姆 · 奥特曼(Sam Altman)对谈时就提到了这种 AGI 困境:他说他的仓库里还有 GPU,但没有足够的算力中心容纳,也缺少足够的电力使用。那么其实 AI-RAN 把算力分布式地放在全球的各个基站里,就可以成为以上的解决方案之一。

第二个则是大幅降低算力的时延。

打过在线游戏的读者都知道,有 50 毫秒以内的时延都属于 " 流畅 ",但如果把这个延迟复用到自动驾驶上,高速路上将到处都是被撞烂的废铁,这也是今天高精地图方案被边缘化的重要原因。但如果将算力中心推进到用户周围,那么延迟可以降低 90% 以上,从毫秒级变成微秒级,大量高时延要求的场景就会跑通了。

根据目前可考的公开资料,Aerial 最早出现在英伟达的资料里是在2019 年洛杉矶世界移动通信大会那时它还只是一套 SDK 工具,目的是支持 GPU 加速与软件定义的 5G 无线接入网。

没错,2019 年,正是 " 何同学 " 拍 5G 视频获得三千万播放量的梦幻之年。

所以从这个角度来说,Aerial 大概也能算是一个 "5G 原生 " 的工具,正是通讯带宽的快速增长让英伟达看到了一个未来世界的影子,于是 Aerial 诞生了。

而在过去五年时间里,5G 逐渐让不少人失望,但 Aerial 一直在默默发育。

在这期间,Aerial 的定位脱离了最初的 SDK 工具箱的数据,而转变为一个为 " 产学研 " 服务的平台。

2021 年 3 月,NVIDIA 在 IEEE 的 5G 分论坛上发了一篇论文《NVIDIA Aerial GPU Hosted AI-on-5G》,介绍 5G 连接和移动边缘计算(MEC)的 NVIDIA 超融合(hyper-converged )平台,那时他们的案例目标是工业 4.0。

在这篇论文的摘要里,NVIDIA 明确表示:

Aerial 是一个为研究人员提供下一代无线和人工智能研究平台,从而实现行业转型开放平台(As an open platform Aerial is positioned to be industry transformational by providing researchers with a platform for next generation wireless and AI research)。

一个月后,NVIDIA 在 2021 GTC 大会上推出 Aerial A100即 NVIDIA AI-on-5G 计算平台

Aerial A100 其实是将,NVIDIA Aerial 软件开发套件与 NVIDIA BlueField-2 A100 芯片结合起来的产品,后者很大程度脱胎自是英伟达 2020 年刚完成收购的 Mellanox 的 DPU 产品线。虽然是这是一个拼凑起来的产品,一张包括了"5T FOR 5G" 解决方案、集成 GPU 和 DPU 的融合型卡,但它为 AI-RAN 提供了宝贵的计算平台,得到了包括谷歌云、富士通的支持。

是的,他们甚至没有在名字里放入 AI ——所谓 5T,指的是 " 时间触发传输技术 "(Time-Triggered Transmission Technology for Telco)。顾名思义,这其实就是要解决精确时间戳和高时钟准确性的问题,但这其实是大规模边缘计算的基础。

有趣的是,而那年媒体对 2021 GTC 的标题是:"NVIDIA 推出首款 CPU,狂推 ARM 生态。" 虽然服务器业务依然重要,但今天已经不太有人想起 CPU 了,更不会用 ARM 的视角来看待 NVIDIA 了。

随后 Aerial 迎来了一个小的高峰,这从英伟达的 " 技术博客 " 可见一斑,在 2022 年以后有体积 Aerial 的技术博客数量快速增加。

2022 年到 2023 年间,英伟达陆续陆续推出的 DOCA GPUNetIO 、Sionna 库、Aerial Research Cloud 等一系列加速 AI-RAN 的工具。

DOCA GPUNetIO 让 GPU 绕过 CPU 实现直连网络,降低了时延和成本、提高了吞吐量;

Sionna 库则是一个 GPU 加速的开源库,用于通信系统研究,官方说它可以实现 " 自动微分框架 "," 通过整个通信系统反向传播梯度 ",非常适合 " 神经网络集成 ";

Aerial Research Cloud 是第一个完全可编程的 5G 和 6G 网络研究沙盒。

但你依然可以将英伟达对 Aerial 做的所有事情,都重新回到 2021 年的那个论文标题上:

GPU Hosted AI-on-5G

2024 年是英伟达 Aerial 的生态大年。

2 月,著名的 AI-RAN Alliance 成立,牵头单位是英伟达和软银,其他创始单位分别是爱立信、诺基亚、三星、T-mobile、微软、AWS、Arm、DeepSig、美国东北大学。

AI-RAN Alliance 成为了英伟达希望重新改写 6G 定义模式的重要一步,因为它囊括了(除了华为和中兴以外)几乎最重要的通信相关的公司。其组织目标就是要让 AI 与 RAN 结合,从而让 6G 变成真正的 AI 原生网络。

3 月,英伟达还推出了包含 Omniverse 生态系统和 Aerial CUDA 的 6G 研究平台。

而直到 9 月份, 英伟达在 GTC Paris 2024 才宣布正式推出 NVIDIA AI Aerial。

这是它在官方介绍中,它已经成为了一个优化无线网络和提供全新生成式 AI 体验的一站式平台

英伟达官方的通讯稿里是这样介绍 AI Aerial 的

NVIDIA AI Aerial 平台提供了全套功能,包括高性能软件定义的 RAN 以及训练、模拟和推理,以便电信运营商能够参与下一代无线网络从开发到部署的所有阶段。

NVIDIA AI Aerial 平台提供的功能包括:

NVIDIA Aerial CUDA 加速 RAN:包含使合作伙伴能够在 NVIDIA 加速计算平台上开发和部署高性能虚拟化 RAN 工作负载的软件库。

NVIDIA Aerial AI 无线电框架:包含基于 PyTorch 和 TensorFlow 的软件库,用于开发和训练能够提高频谱效率并为 5G 和 6G 无线电信号处理添加新功能的模型。该框架还包含 NVIDIA Sionna,该链路级模拟器可用于开发和训练基于神经网络的 5G 和 6G 无线电算法。

NVIDIA Aerial Omniverse 数字孪生(AODT)是一个系统级网络数字孪生开发平台。AODT 能够以物理学精度模拟无线系统,无论是单个基站,还是由大量基站组成的覆盖整个城市的综合网络都不例外。它包含软件定义的 RAN(Aerial-CUDA 加速 RAN)和用户设备模拟器,以及物理世界的现实地形和物体属性。

这里包含了英伟达对下一个 6G 的很多定义和想象:

高性能的算力、神经网络的分布式网络能力、数字孪生的虚拟世界开发能力。

也从此开始,英伟达开始加速推进整个 AI-RAN 的生态建设的扩容,不仅与 Vapor IO 这类边缘计算服务商在拉斯维加斯开辟实验田,也不断开源新的工具,推进新的头部合作伙伴。

而这一系列生态动作,在 2025 年 10 月的 GTC DC 大会上达到了一个阶段性的峰值。

Aerial 冲刺 CUDA 时刻

在 10 月 GTC DC 大会期间,英伟达终于对着 AI-RAN 暗流涌动的湖面上扔下了两个大石头:

第一,开源 Aerial 软件。

开源后的软件,将可以运行于包括 NVIDIA DGX Spark 在内的多种 NVIDIA 平台。

DGX Spark 就是黄仁勋之前亲手交付给马斯克和李在镕的小 " 便当盒子 ",是目前全球最小的 "AI 超级电脑 ",可以在本地执行最高 2000 亿参数的 AI 模型推理和 700 亿参数的模型微调,可以说完美匹配像 AI-RAN 场景多元的开发生态需求,非常适合高校研究者和个人开发者参与。

第二,英伟达宣布以 10 亿美金入股诺基亚,达成战略合作。

入股后英伟达将占比 2.9%,英伟达的 AI-RAN 生态产品将进入诺基亚的 RAN 产品组合里,双方共同推进 6G 的 AI-RAN 落地。

第三,英伟达推出了 Aerial RAN Computer Pro (ARC-PRO)平台。

如果说曾经的 Aerial 平台还是一个带有研发起步性质的小平台,这次的 ARC-PRO 就是为顶级合作伙伴预备的产业级大跑道,它可以直接和基站结合,既能服务 5G 实现 AI-RAN 功能,还能帮助 5G 向 6G 的平滑过渡。介绍稿里的标题也从 AI-RAN,正式切换成了 "6G AI"。英伟达对这个 6G AI 平台的口气也变得很大,甚至在中国读者看来可能是很具有侵略性的:

" 驱动美国重返电信领导地位 "。

如果了解英伟达历史的读者,至此可能已经有一种似曾相识的感觉。 Aerial 的发展历程很像 CUDA,几乎是一种关于技术的商业美学复刻。

黄仁勋力推 CUDA,因为它看到 GPU 不止局限于游戏图像,而有通用计算能力的潜力;推 Aerial,因为 RAN 不止是通信,还可能是未来的 AI 基础设施。

CUDA 从高校生态起步,花了十年时间培养,最终形成了独有的生态护城河;Aerial 也是从小的研发性质开发平台起步,一步步变成一个 AI-RAN 生态,总共花了五年时间,成为了英伟达基站算力业务的护城河。

从单点工具 → 通用平台 → 生态护城河,这是英伟达与时间的经典故事。

但如果细究,则会发现两者在商业细节上不完全相同。

这种差别不是在节奏的快慢上,Aerial 是含着金钥匙出身的孩子,节奏自然更快。最大的区别是英伟达对生态伙伴的态度上。

以算法生态为例,CUDA 是闭源为主,Aerial 是开源为主。

在合作方面,CUDA 的开放主要是积累开发者的习惯和口碑,Aerial 虽然也拥抱大量中小开发者,但核心战略目标直指生态中的顶级玩家。

英伟达若要复刻 CUDA 时刻,第一个 " 北极星指标 " 实际上是让自己的标准与生态被 " 大玩家 " 接受。没有通信行业错综复杂的利益生态的支持,AI-RAN 就无从谈起。在通用计算方面,GPU 对 CPU 是从无到有的降维打击。但 Aerial 对 RAN 则是从无到有的合作升维。

从这个角度来说,虽然贵为 5 万亿美金的硅谷新宠,在通信市场里,英伟达依然在扮演 " 仰攻 " 和 " 说服者 " 的角色。

"10 亿美金入股 " 就是其中最有力的说服方式。

诺基亚可能是今天 Aerial 所能找到的最完美合作伙伴。

抛开华为外的欧美国家市场,诺基亚的 5G 基站市场份额已经落后爱立信,且在趋势上与后者的差距越来越大。尤其在美国的基站市场,诺基亚丢单 Verizo 以后,一度传出仅剩的 T-Mobile 也将不保。与英伟达的合作或许可以帮助诺基亚在美国市场重新站稳脚跟。

2023 年,诺基亚出台过一个 "2030 年计划 "。该计划与英伟达的喜好高度吻合,它将 AI 放在了所有战略的第一条,将 " 云连续体 " 放在了第二条。所谓云连续体,其实就是将 " 云 - 边 - 端 " 无缝融合,背后最大的市场机会其实就是 " 边缘云 " 市场。

而如果按照英伟达的技术构想,今天的通信公司未来都可以成为新的云计算公司。这点我们放在最后细说。

最后,诺基亚是一个股权分散的上市公司,大股东系芬兰政府旗下资金,不直接干预公司经营。因此,英伟达 2.9% 的持股,既不会过度引发其他基站公司的抵触和担忧,也能直接对诺基亚施加影响。

对于英伟达而言,入股诺基亚有两大战略优势。

第一,6G AI 的部署速度会领先行业,假如英伟达率先将部署了 Aerial 的基站设备推向市场,再在 Aerial 基础上形成应用生态,率先做成生态的增长飞轮。

这有点像安卓之于塞班、Windows Mobile 等系统,先发优势会形成操作系统的重要优势。

第二,则是关于传统 RAN 市场格局中非常重要的投票机制:3GPP。

3GPP 是全球移动通信技术标准的核心制定组织,组织内有上百个不同产业链的关键企业。3GPP 在中国算半个网红,因为它曾在几年前爆发过一个科技行业非常出圈的新闻,即华为主推的 Polar 码和高通主推的 LDPC 码的 " 投票门 "。投票过程被花边演绎,结果对某投票的企业形成了极大的公关创伤。

其实像编码提案是需要 71% 的投票率通过,因此并不存在严格意义的 " 关键少数 ",而是以技术共识为主、投票为辅的决策形式。但 3GPP" 权力修罗场 " 的形象已经被深刻留在了互联网里了。

英伟达虽然有 AI-RAN 作为行业联盟,但 3GPP 才是规则的制定者。坏消息是,由于没有传统的通信业务,英伟达在其中的权重很低,存在感很弱。所以英伟达也需要一个具有生态协同能力的策动能手,而诺基亚便是在 3GPP 中与华为、爱立信、高通并驾齐驱的第一梯队权重的投票者,对上下游的其他投票权企业也有很深的影响力。

而今年和明年的 3GPP 讨论 release 20 和 release 21 刚好是 5G 转向 6G 的重要节点。

其中 2025 年的 release 20 被认为是 5G-Advanced 的最后一站,也是迈向 6G 的第一站。而大概率在明年召开的 release 21 则将是 6G 标准的第一站。英伟达需要抓住更多的时间窗口,来为自己的 AI-RAN 生态获得更好的站位。

谁的 "6G"?

英伟达是今天 RAN 生态不可忽视的变量,高通也是。

如果将 AI-RAN 粗暴地分成 AI 和 RAN 两个维度,再将二家半导体巨头放在一起比较:显然英伟达是 AI 强,RAN 弱;高通则是 RAN 积累更深,AI 相对英伟达处下风。

在 6G 时代,高通当然也会是重要的参与者。但这涉及到一个话语权的重新争夺:

6G 的本质到底是倾向于 AI 还是 RAN ?

最简单的做法是算账。

我们暂时无法给出准确的数据,但是有一些相近的数字可以参考。DGX Spark 128G 的定价是 3999 美元,折合人民币近 3 万元;算力中心的大芯片 A100,大内存的单卡价格在 1.5 万美金往上,折合 10 万人民币。

5G 基站方面,此前有媒体通过中国移动的总 5G 投资和总 5G 基站部署量,计算出整体的基站平均部署成本大约 40 万人民币(含安装、土地等综合成本)。不过近几年随着产业链成熟,5G 基站成本也在快速下降,有相应集采价格已经跌到 16 万人民币。

不过 5G 基站的类型包含了大基站、微基站等不同种类大小,功率和覆盖范围差异很大,所以不能一概而论。但 6G 的基站相应会比 5G 更密集,大基站空间更少,微基站更多。不过早期技术普及期,整体价格也可能会高一些。

有两件事情是确定:

第一,芯片算力会在基站业务中占据非常重要的成本比例;

第二,这个成本占比在未来是存在弹性的:

如果算力的使用频率越高,场景对算力的需求就会越大,那么芯片在基站中的成本占比也就越高。换言之,相比于 RAN 业务的规模,算力芯片业务的收入想象可以是很宏大的。

而黄仁勋从来没有放弃过的东西,就是对算力 " 想象 "。

这时我们就不得不搬出 NVIDIA 的另一个杀手锏级的技术品牌:

Ominverse。

这个产品曾经是元宇宙热潮时候的宠儿,名字也带着元宇宙的气息(Omni 是 " 所有 " 的意思,连起来就是 " 全宇宙 ")。2021 年,黄仁勋用它做了一个数字分身做发布会演讲,成了 Metaverse 时期的一道独特风景。

如今,Meta 的时代已经远去,Omni 却留了下来。

今天 Omnivesre 成为了英伟达与场景的重要链接器,许多跟落地相关的业务都在这里。如果你想知道,算力将在未来改变哪些场景,最简单的方法就是直接看 Omniverse 的业务线。

比如这次 2025GTC DC 披露的重头戏自动驾驶业务,背后是 Omniverse 为主导的团队。

英伟达宣布将要在 2027 年前部署超过 10 万台自动驾驶车队,部署 NVIDIA DRIVE AGX Hyperion 10 自动驾驶平台。这是除了特斯拉以外,目前最庞大的部署计划。

在 L4 期间,AI-RAN 似乎不那么重要,但是 L5 几乎必须 6G 以上的 AI-RAN 网络支持。

因为 L5 意味着无方向盘的无人驾驶,要在所有路况、所有时间都能够稳定运行,而如此庞大的车流网络就必须要边缘算力支持、配合高精地图的全局规划能力。

L5 自动驾驶对于 AI-RAN 是堪称教科书级别的场景,因为它满足了 AI-RAN 背后三个场景强烈的需求:

超高的低时延要求、端侧难以承载的算力要求、类似 " 群体智能 " 一般的 AI 算力调度能力。

马斯克在近期接受采访时,有个 " 大胆 " 的预言。

他说," 未来不会有操作系统,不会有 APP,你的手机只是显示像素和发出声音,它预测你最想看到和听到什么,然后实时生成,我们会尽可能地将 AI 集成到这个设备中。

" 不会再有传统意义上的手机了,我们所谓的手机,实际上是一个用于 AI 推理的边缘节点,配备一些无线电模块进行连接。"

而服务器端的 AI 会与用户设备(以前被称为手机)上的 AI 进行通信,并生成用户想要的任何实时视频。

马斯克观点的本质,其实是 AI-RAN 能力和大模型能力叠加,将取代所有的终端算力。算是最激进的一种 AI-RAN 的愿景,如果这个愿景实现,那么 AI-RAN 就是宇宙级的大生意。但许多研究机构都认同,在 6G 时代 " 云电脑 "、" 云手机 " 会从小众走向大众。而其中的 " 云 " 很可能就是 AI-RAN 能力加持的 " 边缘云 "。人们不再需要花昂贵的价格占有设备,只需要在有高算力需求的时候租用即可。

不过我们如果回到现实,有两个场景是相对近在眼前的:

一个是机器人与 XR 设备。

目前所有的机器人都面临 " 端侧 " 对话太智障,但是 " 云 " 对话缓慢且昂贵的体验困境。智能眼镜厂商,面临的则是大算力芯片做不进小眼镜,小设备撑不起长续航的困境。但未来 AI-RAN 可能会成为潜在的解决方案。

一个是 " 元宇宙 " 级别的数字孪生场景。

无论是消费级的游戏应用,还是工业、手术台、能源、国防都可以做场景的延展。

今年 3 月,NVIDIA 出过一个数字孪生平台,正是叫 Aerial Omniverse Digital Twin(AODT)。官方说,它可以实现从单个塔到城市规模的完整 6G 系统进行物理级准确的模拟。

读到这里,我猜你其实已经想到了 AI-RAN 的终局。

一个由边缘计算节点组建的超级计算机,一个地球 ONLINE 的超级服务器,一个 AI 打破世界的所有链接壁垒、又模糊掉所有边界的线上线下同构的世界。

当然,地球 ONLINE 还很遥远。但在此之前,你可能需要最后知道,AI-RAN 可能还将改变两件事情:

一件是好的。

云服务器厂商的格局可能会变化," 边缘云 " 会从小众需求变成一件主流的超大生意,而通信服务商则可能会天然成为新的云服务商。下一个 AWS,可能未必出自亚马逊。

一件是坏的。

如果你打开英伟达 Aeiral 页面,你会看到一个页面,写着:主权 AI 基础设施。

当然,算力原本也是脱敏的信息,但如果当 5G 通信网络都无法实现基站生意顺畅的跨国竞争。那么在 AI-RAN 时代,你可能更难以想象,欧美的政客会采用其他国家的基站设备。尽管华为可能是这个世界上,唯一既有 AI 芯片能力,又有基站能力的厂商。

这就是 6G 和它的 AI。

它诞生在一个复杂的世界,所以也催生世界的复杂。

相关标签

相关阅读

最新评论

没有更多评论了
硅星人

硅星人

硅是创造未来的基础,欢迎登陆硅星球。

订阅

觉得文章不错,微信扫描分享好友

扫码分享