AI 在这数年间发展迅猛,尤其是从 2025 年开始的 AI 风潮,更是让整个科技行业迎来了前所未有的机遇。其中 NVIDIA 自然成为了这场 AI 盛宴的最大赢家。伴随着小龙虾的火爆,代理式 AI 已经成为了目前 AI 发展的最新阶段,代理式 AI 的火爆也让大企业以及个人对于 AI 算力的需求达到了前所未有的程度,像是 NVIDIA 这样的 AI 企业也正不断地推出海量的硬件产品来满足行业的需求。
本届 GTC Taipei 于 6 月 1 日至 4 日在台北国际会议中心举办,NVIDIA CEO 黄仁勋也在 6 月 1 日举办主题演讲,展示和介绍 NVIDIA 是如何围绕 AI 工厂、代理式 AI、物理 AI 以及机器人去打造硬件产品以及建立相关的 AI 生态,很显然 NVIDIA 希望能够成为代理式 AI 时代的掌舵者。
首先是 Vera Rubin AI 超算,NVIDIA 表示这款产品专门为代理式 AI 设计,在之前的 GTC 大会上已经正式发布,不过经过 NVIDIA 的打磨与合作伙伴的适配。如今 NVIDIA 已经正式出货 Vera Rubin,这是专门为代理式 AI 打造的一整台计算平台,与以往 NVIDIA 的计算平台有所不同的是,Vera Rubin 平台实际上是由多款产品共同打造的 AI 解决方案,包括 Vera Rubin NVL72、Vera CPU、Groq 3 LPX、BlueField-4 STX 以及 Spectrum-6 这五个互联的机架构成,能够借助强大的算力让企业获得无与伦比的 AI 体验。
在如今的 AI 推理年代,CPU 已经愈发重要,甚至在一定程度上成为了制约 AI 推理的重要因素,因此 NVIDIA 这一次选择了自研的 Vera CPU,拥有最高 88 颗核心以及 176 个线程,最高拥有 1.2TB/s 的内存带宽,与传统的 X86 处理器相比,带宽提升 2 倍,并且 Vera CPU 在代理式 AI 上的性能比 X86 高出了 80%,延迟也更低,Token 的消耗量能够减少 10 倍,从而降低企业的算力成本。目前 Vera Rubin 平台已经陆续销往客户手中,这些客户也正使用 Vera Rubin 平台助力 AI 推理以及训练。
在软件上,NVIDIA 也推出了 Nemotron 3 Ultra 这款开源模型,最高实现 5 倍的 AI 推理速度,同样可以提升企业的推理效率,并且 NVIDIA 表示借助 Open Shell 安全沙盒,可以让企业在使用 Nemotron 3 Ultra 的时候有效地保证数据的安全,并且 NVIDIA 也严格遵守数据隐私,从而让企业能够更加安心地使用这款模型。NVIDIA 也提供了丰富的 CUDA X 库,通过海量的技能来让 AI 代理变得更加高效。
当然上述都是 NVIDIA 面向企业所打造的产品,针对普通消费者尤其是 AI 学习者或者开发者, NVIDIA 也与微软深度合作,推出了 RTX Spark 处理器。该处理器融合了 NVIDIA Grace CPU 以及 Blackwell RTX GPU,拥有 6144 颗 CUDA 核心,基于第五代 Tensor Core 最高可以实现 1PFLOPS 的 FP4 AI 算力,Grace CPU 与联发科共同打造,最高拥有 20 核,NVIDIA 借助 NVLink-C2C 芯片互联技术让 CPU 与 GPU 之间实现高速互联,借助 128GB 统一内存实现超大 AI 模型的本地化运行。NVIDIA 与微软和其他合作伙伴一起,让 AI 模型能够更加高效、安全地在 RTX Spark 平台下运行,这也是解决目前 AI 开发者的一个痛点。
NVIDIA 将 RTX Spark 定义为三种不同的形态,包括笔记本、台式机和工作站, 三种形态应对不同的使用场景,不过都需要满足数据中心 AI、游戏以及专业创作等复杂任务。开发者可以轻松地在 RTX Spark 平台上从事 90GB 超大 3D 场景的渲染,120B 大小模型的推理,玩家也可以在 2K 分辨率下以 100 帧率的速度畅玩 3A 大作,专业用户也可以在 RTX Spark 上高效运行数字生物、地震处理、天体物理等应用。华硕、戴尔、惠普、联想等企业已经顺利研发基于 RTX Spark 平台打造的笔记本,在 COMPUTEX 2026 期间会陆续发布,大概率在秋季正式发售。老黄也将借助 RTX Spark 重新定义 AI PC,并预言称未来的 PC 将会成为工作流中的超级计算机。
目前 NVIDIA 的 AI 硬件不仅仅满足于传统的 PC 以及高性能计算,像是智能汽车以及智能机器人都使用 NVIDIA 的硬件与 AI 模型,在本次的 GTC 大会上,NVIDIA 也推出了 Cosmos-3 世界模型,能够有效地解决人形机器人以及自动驾驶中数据稀缺的情况,Alpa Mile-2 模型也可以让智能汽车变得更加智能,满足在高速以及城市道路中复杂场景下的自动驾驶。同时 Isaac GR00T 还可以让人形机器人变得更智能,自由度也更高,已经有包括宇树等企业采用 NVIDIA 的最新解决方案研发人形机器人。
毫无疑问在代理式 AI 年代,AI 已经不仅仅是一款娱乐工具,它已经开始为企业创造价值,极大程度地提升企业的工作效率,同时也让开发者的编程效率大幅提升。整个行业此时对于高算力 AI 硬件的需求也达到了前所未有的程度,对于提供工具的 NVIDIA 来说,显然对旗下产品进行快速迭代更新才能在这场 AI 盛宴中站稳脚跟,并且在代理式 AI 时代仍然成为行业瞩目的掌舵人,也让自家的 AI 生态与标准牢牢地与行业绑定,从而支撑公司业绩的快速成长。