关于ZAKER 合作
差评 1小时前

在英伟达的这场发布会上,游戏佬只占了 2 分钟。。。

就在昨天凌晨 2 点,英伟达召开了一年一度的 GTC ( GPU 技术大会)。

与市面上厮杀激烈的各家大模型不同,老黄根本不担心自家的显卡没人用,所以这次的大会还是那么硬核,没有太多的弯弯绕绕,只有肌肉感爆棚的性能数据。

而作为将英伟达市值推向世界第一的推手,AI 仍然是这次大会的核心。

还是两个小时拉满的时长,还是那个皮衣老黄。不过么,他已经彻底不是什么刀客了。

看完整场演讲,发现世超还是低估了英伟达的野心,老黄不止想当卖显卡的算力军火商,他还想整合出一个贯穿 AI 行业的基建—— " AI 工厂 "。

首先,伴随着一阵强劲的音乐,老黄闪亮登场:Welcome to GTC!

虽然这次主题还是 AI,但是开头的第一个新产品居然是游戏相关的 DLSS 5。

其实也能理解,当初是 GeForce 游戏显卡一刀一刀将 AI 带给世界的,怎么着也该轮到 AI 来反哺一下游戏了。

作为之前 DLSS 4.5 的升级版,DLSS 5 引入了 " 实时神经渲染 ",直接把 AI 接入渲染流程中,根据渲染时的运动和矢量信息,实时地给场景注入更接近真实世界的光照和材质表现。

简单点说,之前是根据画面,来生成帧插入进去,现在是直接加入渲染流程,成为渲染的一部分。

得到的效果就是让游戏视觉逼近了电影级的真实感,同时还能保持较高的帧率运行。

效果这么好,算力需求也是蹭蹭涨, DLSS 5 的秋季首发只在 50 系显卡上,不少玩家估计还得等后续的适配和优化才能体验到。

除了算力门槛,网友们对这个 AI 效果的强度其实也有点担忧,就比如下面的演示图,开启与关闭后效果差别非常大,除了细节,连风格都会受到很大影响。

所以英伟达也在博客中提到,效果的最终呈现会交给游戏开发者进行打磨,防止破坏掉原来的美术风格。

而在整整 "2 分钟 " 的介绍落幕后,游戏玩家们就能关掉屏幕了,接下来是 AI 的主场。

老黄打造 "AI 工厂 ",蓝图规模相当宏大,从底层的算力芯片,到中间的大模型,乃至末端的 AI 应用,都有新产品,几乎是全产业链的覆盖。

首先当然是 CES 刚刚亮相的 Vera Rubin 新平台,作为继 Blackwell 后的新一代架构,这是未来几年英伟达 AI 算力的核心王牌。

而在这张王牌打出来前,老黄可以说是煞费苦心,铺垫了半天的 "AI 工厂 " 建设。

先是说 Token 是新时代工业产物;接着忆往昔从 Geforce 到 CUDA,RTX 的荣耀过往;然后商务一波夸了夸 Claude Code、Codex 这类智能体工具,以及它们带来的巨量 Token 需求;最后才顺理成章的掏出了 "Vera Rubin" 这套 AI 工厂的标准生产设备。

不过看数据,Rubin 还是相当能打的,在主力 Vera Rubin NVL72 机柜中,单机架能塞进 72 颗 Rubin GPU + 36 颗 Vera CPU,训练 MoE 模型只需上一代 Blackwell 的 1/4 GPU 算力,效率飞升,而且已经量产,预计是下半年出货。

但话说回来,老黄也不是白铺垫的,除了 Rubin,他更想卖的其实是整合了算力产业的捆绑包,里面除了 GPU,还有英伟达自家的 CPU,用于信号传输的 NVLink 72,以及液冷机架,存储系统,网络系统,安全管控,机架级集成等配套设施。

他甚至怕你买了不会使,特地致敬了一波隔壁的 Meta,用 "Omniverse" 这个数字孪生技术搞了个虚拟 AI 工厂,让你先把设备,网络,运营等等全部跑通,再进入现实建设。他真的,我哭死。。。

当然,除此之外,其实最值得关注的就是推理效率极高的 "LPU"(Language Processing Unit)了。

LPU 是语言处理器,是专门针对 AI 模型推理设计的算力芯片,原本是初创公司 Groq 研发的,跟 GPU 走了不同的路子,一度威胁到了英伟达的护城河。

也正因如此,英伟达去年豪掷 200 亿美元买到了 Groq 的核心资产,开始自己研发了。

这次老黄也没藏着,直接宣布已经把 LPU 集成到了 Vera Rubin 平台,推出了 NVIDIA Groq 3 LPX 作为推理加速器。

NVIDIA Groq 3 LPX Rack 的单机架能塞 256 颗 Groq 3 LPU,总规格炸裂,AI 推理算力能达到 315 PFLOPS,而且最为恐怖的是内存带宽,足足 40 PB/s,是这次 Rubin GPU 机柜的 25 倍,推理速度直接起飞。

这下,短板补足补成了长板。Groq 3 专攻超低延迟的推理,Rubin GPU 主打量大管饱的训练,正好拼凑出英伟达从训练到推理的生态闭环。

硬件的肌肉秀完了,显然老黄还不满足,AI 相关的应用和模型继续一个一个的往外掏。

其中就有差友们最近耳熟能详的 " 龙虾 " 产品,没错,老黄也在搞龙虾。不过是更高规格的企业级代理平台,叫做 "NemoClaw"。

它被称作是 Linux 一样的 " 新操作系统 ",内置安全层,支持自主进化和全天候运行,并用 NVIDIA Agent Toolkit 加固了安全性。

老黄说这是 Token 商品化的软件基础,推理市场万亿级需求就靠它驱动了。要世超说,还真是,要不这些天的 API 账单怎么这么长呢。。。

除了龙虾,英伟达还发布了 Agent 配套的软件设施。

比如开源分布式推理平台 Dynamo 1.0(AI 工厂分布式 " 操作系统 "),用于统一管理 GPU/ 内存资源,提升 Agent 的推理效率。

接着推出了 120B 参数的混合 MoE 模型 Nemotron 3 Super ,说是 OpenClaw 的最佳开源模型,支持百万上下文和多 Agent 协作。

这次英伟达也是赶上龙虾的热度了。

当然,在此之外,老口号也是得强调的。随着老黄高声宣告 " 物理 AI 时代已来 ",大伙儿的视角又被拉向了未来。

这次的核心产品是具身智能模型 "Isaac GR00T N 系列 " 以及世界模型 "Cosmos"。

具身智能的模型好理解,其实就是机器人的大脑。

现在的机器人,虽然看起来很灵活,但大多是提前录制的动作模组,做不到和人一样能够实时反馈。

而训练一个好用的具身智能模型可能比大语言模型还要难。

就比如宇树科技 CEO 王兴兴也在这次 GTC 发表了演讲,介绍了一下最近在具身智能方面的进展。

他表示看好在未来 2-3 年内跨过具身智能的 "ChatGPT" 时刻,但现在最大的瓶颈是还没有出现一个真正具备强泛化能力,在陌生场景中稳定执行任务的具身智能模型。

也就是缺一个能够灵活指挥的机器人大脑。

语言模型训练有现成的大规模数据集,但具身智能模型需要的数据是跟世界的真实交互,这些交互数据非常难采集,现有的数量还远远不够。

所以说实话,英伟达这次的 GR00T N1.7 模型算是阶段性常规发布,至于预告里更好用的 GR00T N2 预览版,虽然目前在 MolmoSpaces 和 RoboArena 基准上排名第一,但要在 2026 年底才会发布。

更有看头的是反而是后面这个世界模型 "Cosmos"。

它能够以高度真实的物理模拟合成虚拟的现实世界,用于训练机器人进行时空感知。

再加上自家的软硬件组合,大规模塑造真实 + 模拟的数据会更加容易,这有可能是解决现实世界交互数据采集困难的一条出路。

咱也期待一手,毕竟真的物理 AI 实现了,那工作起来效率就更高了(摸起鱼来就更爽了)。

总的来说,老黄还在带领英伟达朝着他理想中的 AI 时代大步迈进,而他背后这些密密麻麻的机构名称也提醒着我们,AI 时代的下一幕可能不远了。

而在下一幕的舞台上,除了在竞技场角力的巨头们,你我的衣食住行可能都会被搬到台前。

撰文:风华

编辑:江江 & 面线

美编:素描

图片、资料来源

NVIDIA 官网,机器人前瞻

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容