关于ZAKER 合作
全天候科技 1小时前

英伟达争霸“推理时代”,新 Rubin CPX GPU “ 1 亿美元投入,50 亿美元推理收入,50 倍回报率”!

本文作者:董静

来源:硬 AI

英伟达重磅推出专为长语境推理设计的全新 Rubin CPX GPU,承诺为客户带来前所未有的投资回报率!

9 月 9 日,花旗在最新研报中称,英伟达在 AI 基础设施峰会上推出专为长语境推理设计的全新 Rubin CPX GPU,承诺为客户带来前所未有的投资回报率——每投入 1 亿美元可获得 50 亿美元的推理收入,实现约 50 倍的投资回报率,远超 GB200 NVL72 的约 10 倍回报率。

英伟达超大规模与高性能计算副总裁 Ian Buck 在 AI 基础设施峰会上重申,公司致力于通过 GPU 驱动的数据中心加速生成式 AI 的采用。此次发布的 Rubin CPX 专门针对超大规模上下文处理的最高性能而设计,相比 GB300 NVL72 系统,在注意力机制方面性能提升高达 3 倍

除新 GPU 发布外,英伟达还宣布其 GB300 NVL72 机架级系统在最新的 MLPerf 推理基准测试中创造了新的推理基准记录。据花旗研究指出,通过在产品路线图中插入 Rubin CPX,英伟达正在 ASIC 竞争加剧的背景下加速其一年一度的产品发布节奏,这标志着 " 推理时代 " 已经到来

革命性的 Rubin CPX:专为推理时代打造的盈利引擎

英伟达 Rubin CPX 代表了 GPU 设计的全新类别,专门针对长语境推理进行优化。这款芯片能够处理百万级 tokens 的软件编程和生成式视频,在速度和效率方面实现突破性提升。

花旗在研报中指出,最引人注目的是其经济效益:

Rubin CPX 相比英伟达 GB300 NVL72 系统,注意力处理能力提升高达 3 倍。更重要的是,该芯片与英伟达 Vera CPU 和 Rubin GPU 紧密配合,构成全新的英伟达 Vera Rubin NVL144 CPX 平台,能够让企业以前所未有的规模实现投资变现——每投入 1 亿美元可产生 50 亿美元的推理收入,投资回报率约为 50 倍,远超 GB200 NVL72 的约 10 倍回报率

花旗称,英伟达通过在产品路线图中插入 Rubin CPX,正在加速其一年更新节奏,这一举措明显是为了应对日益激烈的 ASIC 竞争。

英伟达 GB300 NVL72 机架级系统在最新 MLPerf 推理基准测试中创下新的推理基准记录,相比 GB200 NVL72 系统,可提供高达 1.4 倍的 DeepSeek-R1 推理 throughput。

该平台还在 MLPerf Inference v5.1 套件新增的所有数据中心基准测试中创下性能记录,包括 DeepSeek-R1、Llama 3.1 405B Interactive、Llama 3.1 8B 和 Whisper。

花旗表示,这些系统级性能表现是在英伟达已经在 MLPerf 数据中心基准测试中创下单 GPU 记录基础上的进一步提升。

花旗分析师指出,这些发布表明推理时代已经到来,正如谷歌最近所说的其推理所处理的 Tokens 数量同比增长超过了 50 倍以上所反映的趋势。英伟达正通过 GPU 驱动的数据中心加速生成式 AI 的采用,这一战略定位使公司能够充分捕捉推理市场的爆发性增长机遇。

花旗研究维持英伟达 " 买入 " 评级,目标价 200 美元,基于 2026 财年预期每股收益的 30 倍市盈率。分析师指出,30 倍市盈率与公司 3-5 年平均水平一致,预期股价回报率为 17.1%。

分析师认为,英伟达通过发布 Rubin CPX 和创造 MLPerf 新纪录,展现了公司在 AI 基础设施领域的持续创新能力。随着 AI 推理需求的快速增长,特别是长语境推理需求的爆发,英伟达的新产品组合将为公司带来显著的收入增长机会

全天候科技

全天候科技

提供专业快速完整的科技商业资讯

订阅

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容