关于ZAKER 免费视频剪辑 合作 加入
驱动之家 04-19

GPU 延迟对比:AMD RDNA2 完胜 NVIDIA 安培

CPU 缓存与内存延迟测试,相信大家都有所耳闻,但是 GPU 同样的测试却几乎没人做过。

Chips And Cheese 就做了一次特别的测试,对比考察了 AMD、NVIDIA GPU 架构的缓存、显存迟问题。

首先是 AMD RDNA2、NVIDIA Ampere 两家最新架构的比拼,代表是 RX 6900 XT、RTX 3090,前者在几乎所有阶段都完胜。

RNDA2 架构创新性地加入了 Infinity Cache 无限缓存,提升带宽的同时,延迟也可圈可点,二级缓存命中率上只增加了大约 20ns 的延迟,明显低于 Ampere。

更惊人的是,RDNA2 显存延迟和 Ampere 几乎一模一样,但是别忘了,Ampere 只有两个层级的缓存,RDNA2 却有四个。

Ampere 的缓存架构更加传统,SM 阵列私有一级缓存到二级缓存要增加超过 100ns 的延迟,RDNA2 从零级缓存到二级缓存则只增加了约 66ns。看起来,GA102 核心面积过大,也直接增加了延迟。

这正好可以解释 AMD RDNA2 架构在低分辨率下性能、能效更优秀,因为二级缓存、三级缓存延迟很低,更适合执行较小的负载。Ampere 则相反,高负载下优势明显,比如说 4K 分辨率。

说完了 GPU 之间的对比,那么 GPU、CPU 放在一起怎么样呢?这里以 RX 6900 XT、Intel 四代酷睿 i7-4770 为例来看看。

CPU 的缓存自然不是一个级别的,所以这里 Y 轴用了线性数据,可以看到全程大大低于 RDNA2,搭配 DDR3-1600 CL9 内存延迟只有 63ns,RX 6900 XT、GDDR6 的组合则有 226ns,另外末级缓存平均延迟分别是 53.42ns、123.2ns。

再看看前几代的 NVIDIA GPU,包括 Maxwell 架构的 GTX 980 Ti、Pascal 架构的 GTX 1080、Turing 架构的 RTX 2060 Mobile。

Maxwell、Pascal 其实差不多,前者整体略高一些,可能是受制于芯片面积较大、核心频率较低。

Turing 则已经有了 Ampere 的样子,一级缓存延迟低得多,二级差不多,奇怪的是显存延迟在 32MB 之后偏高,原因未知。

AMD 考察了 TeraScale 架构的 HD 5850/6950、GCN 架构的 HD 7970,再加上 RX 6900 XT,很明显在逐代降低,而且是各级缓存都在同时进步。

以上内容由"驱动之家"上传发布 查看原文
相关标签

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容