财联社 3 月 17 日讯(编辑 史正丞、牛占林)北京时间周二清晨,英伟达创始人兼首席执行官黄仁勋在超过两个小时的 " 全栈 AI" 演讲中,勾勒出算力巨头未来一年的发展蓝图。
作为今天最重要的数字,黄仁勋给出了更为激进的算力芯片营收预测:到 2027 年可能达到 1 万亿美元。
硬件层面,英伟达展示了新一代 Vera Rubin 平台及 Rubin Ultra 架构,以及 CPO 共封装光学交换机以及与 Groq 合作的LPU 推理系统。新的架构将 GPU 用于模型预填充与主要计算,而 LPU 负责低延迟 Token 解码,以显著提升 AI 推理效率。英伟达还展示了一款用于太空数据中心的芯片模组。
在软件与生态方面,英伟达推出DLSS 5和" 一键养虾 " 平台 NemoClaw,并宣布成立 Nemotron 联盟,与全球 AI 实验室合作开发开放基础模型,同时发布开源智能体工具链,推动企业构建自定义 AI 代理。公司认为,未来企业软件形态将从传统应用转向 "AI 代理平台 "。
应用生态方面,英伟达宣布多家车企加入其 robotaxi ready 自动驾驶平台,并展示与迪士尼合作的机器人项目。
以下为直击实录:
02:00 在黄仁勋登台前,英伟达股价涨超 2%,依然在去年 8 月至今的股价中枢上波动。黄仁勋似乎来晚了一些,演讲并没有准时开始。

02:19 黄仁勋登场!GTC 主题演讲正式开始

黄仁勋表示,今天是一场科技大会,我们将探讨诸多议题,包括人工智能、AI 工厂、硬件设备以及更多精彩内容。
02:30 黄仁勋开场回忆了一番公司历史,例如 CUDA、RTX、GeForce 等产品的发展史。
02:34 今天的第一个新品:DLSS 5
英伟达宣布推出新一代 AI 图形技术 DLSS 5,通过实时神经渲染模型为游戏画面注入更真实的光照和材质效果,被公司称为继 2018 年实时光线追踪后的最大图形突破。该技术利用游戏的颜色与运动向量数据生成接近电影级的画面效果,并保持实时交互性能,预计今年秋季上线,支持 4K 游戏,并获得多家大型游戏厂商支持。

02:50 黄仁勋谈应用加速(application acceleration)
黄仁勋表示,加速计算并不是一个系统层面的难题。" 加速计算 " 这个说法其实少了一个词,只是现在很少再提起——那就是应用加速(application acceleration)。
如果我能让一台计算机把所有事情都运行得更快,那其实就是 CPU 的工作,但这种方式已经走到了尽头。未来我们能够继续提升应用速度、实现巨大性能提升并大幅降低成本的唯一方法,就是通过针对应用或特定领域的加速。

03:06 黄仁勋:过去三年 AI 产业的 3 个里程碑产品分别是 ChatGPT、o1 推理模型,以及 Claude Code 智能体,象征着推理需求的激增。


他进一步表示:" 不过我要告诉你们的是,现在在我所站的位置,我看到的是到 2027 年将达到至少 1 万亿美元的规模。"
03:11 黄仁勋:事实上,我们很可能仍然会供不应求。我确信计算需求将远远高于这个数字。
他进一步介绍称,英伟达约 60% 的业务来自超大规模云厂商(hyperscalers),也就是那些正在建设数据中心、需要大量 AI GPU 的公司。另外 40% 的业务来自其他领域,包括云服务、企业客户、机器人、游戏以及超级计算等。
03:22 黄仁勋开始强调每瓦 Token 数(Tokens per watt)这个指标。他强调,英伟达的 Token 成本目前是世界级的,基本无人能及。之所以能够做到这一点,是因为进行了极端程度的协同设计(co-design)。
黄仁勋还摆出了一个 "Token 之王 " 的姿势。


黄仁勋表示,Vera Rubin 系统已经实现 100% 液冷。过去需要两天安装的系统,现在只需要两个小时就能完成安装。这同样是一台采用 45 ℃热水冷却的超级计算机。这种方式减少了数据中心的压力,显著降低了冷却成本,并释放出更多可用电力。第六代 NVLink 系统也是完全液冷的。

与 Rubin GPU 协同运行时,GPU 和 LPU 会共同计算 AI 模型每一层,从而提高生成 token 的解码速度。


黄仁勋也展示了单独出售的 Vera CPU 系统。在后续的新闻稿中,英伟达表示 Vera CPU 的产业合作伙伴包括 Meta、甲骨文、阿里巴巴、字节跳动、Nebius 等。


03:45 黄仁勋进一步讲解 LPU 的价值。
他表示,如果你的工作负载主要是高吞吐任务,那么只使用 Vera Rubin 就很好。但如果你的工作负载包含大量编程任务或高价值工程任务(例如 Token 生成),应该在数据中心中加入 Groq 芯片。

英伟达正在重新设计推理流程,其中 Vera Rubin 负责 Prefill(预填充)与主要计算,Groq 负责低延迟 Token 解码生成。目前 Groq LP30 芯片由三星制造,已经进入生产阶段,预计今年下半年发货。







英伟达同时发布开源智能体软件套件,为企业和开发者提供构建与运行 AI 智能体的软件平台。该工具支持智能体自主完成复杂任务,并通过安全与策略机制保障部署。英伟达表示,企业未来将通过大量专业化 AI 代理提升知识工作效率,推动软件行业向 " 代理平台化 " 转型。




