关于ZAKER 免费视频剪辑 合作 加入
超能网 06-16

GeForce RTX 3080 Ti 创作性能测试:与 RTX 3090 差距不到 5% 的多面手

在很多用户的固有印象里,只有游戏型 PC 才需要性能强大的独立显卡,生产工作只要集显就足够了。这样的观点如果放在 10 年前或许问题不大,然而在今天还这样认为的话,那显然就是放弃了提升工作效率的大好机会,因为如今的显卡已经不仅仅是在游戏领域可以大显神威,在生产创作方面也可以起到很好的加速效果,可以让创作者在更短的时间里完成作品。也就是说如今的独显已经不仅仅是游戏玩家的专属,它们更是担负起了提供更强生产力的任务。

当然并不是所有的独立显卡都能很好地同时完成这两项任务,早期大家熟悉的独显产品特别是高端独显大都只专注于优化游戏领域应用,创作生产方面是由俗称的 " 专业卡 " 负责,基本上很少会涉及对方的领域,直到近年来两者才开始合二为一,如今一个 GPU 就能很好地兼顾游戏和创作,而在这里面的佼佼者则是 NVIDIA 的 RTX 系列 GPU 产品。如今 NVIDIA 的 RTX 30 系列 GPU 已经配备了第三代 AI 核心以及第二代 RT 核心,不仅支持光线追踪的硬件加速,可以在各种光追游戏中提供优秀的效能,最高 24GB 的大容量显存也是让 RTX 30 系列 GPU 在生产力软件中足够给力。

NVIDIA 新近发布的 GeForce RTX 3808 Ti 则是 RTX 30 系列 GPU 中的次旗舰,其基本规格与 RTX 3090 接近的同时,也配置有 12GB 容量的 GDDR6X 显存,在我们的评测中其综合游戏性能领先 RTX 3080 接近 10%,对于游戏玩家来说是一款非常理想的 GPU 产品。那么对于创作者用户来说,RTX 3080 Ti 是否也有着足够的吸引力呢?

NVIDIA 的 RTX 30 系列 GPU 采用了全新的 Ampere 架构,在通用计算的 SM 单元、专为光线追踪运算的 RT core 以及专门用于 AI 运算的 Tensor core 这三个主要部分相对于上一代的 Turing 架构都做了大幅度的改进。而在 RTX Studio 支持的创意应用中,目前已经有 50+ 主流创作软件利用上了 RTX 系列 GPU 的这三大特性,比如视频剪辑软件 Premiere Pro 支持基于 CUDA 的水银硬件加速,3D 动画制作软件 Blender 可利用 RT core 来提高渲染速度,还有 DaVinci Reslove、Photoshop、Lightroom 在 Tensor core 帮助下,实现更快更准确的 AI 功能。

相比上代 Turing 架构,这次在全新 Ampere 架构的内部,新的 SM 单元翻倍了 FP32 运算核心,使得 CUDA 数量大增;而第二代 RT core 增加了翻倍了光线与三角形求交的计算效率,从而获得了 1.7 倍的光线追踪运算性能,并显著提升了动态模糊效果的加速,最后第三代 Tensor core 也采用新的设计,大幅提升了离散运算能力,使得整体 AI 运算速度提高 2.7 倍。

所以 RTX 30 系 GPU 这三个大提速,相应地也会帮助那些有利用到这三个特性的创意应用,获得更快速度处理速度,而且不仅如此,一些应用还获得新的功能特性。比如 Blender 支持了第二代 RT core 的动态模糊加速,在渲染带有高速运动场景的 3D 动画中,能更好处理其中的动态模糊效果,还有就是广泛应用于游戏中的基于 AI 的深度学习超级采样技术(DLSS),现在也可以应用到创意工作的应用中了。

大容量显存与 8K 视频硬件解码

另外 RTX 30 系列 GPU 的其它一些新硬件特性也是对创意工作更加友好,新一代 GPU 支持到最大 24GB 的 GDDR6X 显存,这已经在 RTX 3090 上应用,而最新发布的次旗舰产品 RTX 3080 Ti 也同样配置有 12GB 容量的 GDDR6X 显存,在应对需要超大显存的 3D 渲染和超高分辨率视频剪辑工作时有着比肩专业卡的充裕容量。同时 PCI-E 4.0 在高负载的创意应用中,也更能利用上高传输带宽的优势,进一步提升运算的效能。

最后 RTX 30 系 GPU 还升级了内置的 NVDEC 到第五代,支持最高 8K 分辨率 HDR 视频的 AV1 硬解码,配合 HDMI 2.1 接口的 8K 单线显示输出,这对于有 8K HDR 视频回放需要的视频后期工作者也会有很大帮助,加上本来的第七代 NVENC 硬件编码器,最高提升了五倍的视频导出效率,并且能在直播串流中分担更多的编解码工作,减少对其他硬件资源的消耗。

Studio 驱动与 NVIDIA Broadcast

NVIDIA 在 RTX Studio 中除了提供硬件特性,在软件方面还有 Studio 驱动和套件做软硬结合,除了为创意应用提供功能和稳定性的驱动优化支持,Sutdio 还做了一些可以利用到 RTX GPU 特性的应用软件给创作者们,例如为直播主们推出 NVIDIA Broadcast,这用到 RTX GPU 的 AI 能力来对直播主的背景消除或替换,还有摄像头重构图,甚至帮助麦克风进行背景噪音消除。

在安装了 NVIDIA Broadcast 软件后,它会在摄像头、耳麦与直播软件之间建立一个中间者的角色,让外置设备可以利用到 RTX GPU 的 AI 能力来做一些 AI 增强效果,耳机和麦克风现在支持了降噪功能,AI 会分析出哪些是主要音频,哪些是背景杂音进行降噪,给直播主和观众呈现清晰、有用的声音。

而摄像头现在有了自动重构图以及背景处理能力,从摄像头采集到画面,可以设置经过 Broadcast 进行处理,再传到 OBS 这些直播软件中,这可以让直播主的背景变得更为生动灵活,同时也可以降低直播场景的搭建成本。此外在最新的 Broadcast 软件中,NVIDIA 已经实现了两种画面效果同时运算的能力,例如主播可以在开启背景虚化的同时叠加自动聚焦的功能,进一步增加了直播的专业性。

对于游戏开发者,用于快速构建动画 CG 的平台 Omniverse Machinima 将支持多个游戏和第三方插件,能更快帮助游戏开发者制作游戏里面的故事剧情动画,并可以利用 AI 技术配合摄像头,把现实姿势和脸部动作采集导入到 3D 动画建模中。另外 NVIDIA 还提供了一个基于 GPU 加速的 Texture Tools,让材质艺术师和开发者可以更方便管理材质包。

最后游戏玩家们熟悉的 GeForce Experience,其内置的录制功能在新版本里面,将可以最高支持到 8K30P 的 HDR 视频采集,而无需额外的硬件视频采集设备,这让一些做游戏实况的视频 UP 主,或者需要采集高分辨率视频的视频后期工作者可以更方便的获取超高画质的原始素材。

NVENC 加入到 Premiere Pro 工作流

在 Premiere Pro 的视频制作工作流当中,主要分为了原始素材导入、剪辑与添加效果,以及最后的成片导出三个主要阶段,对于硬件来说,在第一阶段的素材导入时,目前主要是利用 CPU 来进行解码(decode)工作的,而到了第二阶段的视频剪辑过程,处理这些操作的仍然主要是 CPU,但如今的视频制作不仅仅是对素材进行简单的修剪、拼接,还会有各种转场、字幕、调色、颗粒化等等进阶效果,如果这些全靠 CPU 来回放预览,处理起来会非常卡顿和缓慢,所以在过去有不少视频工作者,会对原始素材进行生成代理文件,以降低对 CPU 资源的占用。

为此 Adobe 与 NVIDIA 一起合作,在 PR 中加入了支持利用 GPU 来处理回放、效果、多轨道预览等操作,以提升处理效率。这便是 Mercury Playback Engine,它可以利用 GPU 来显著加速视频剪辑阶段的工作效率。

在目前最新版本的 Premiere Pro 里面,NVIDIA GPU 已经支持非常多的效果加速,包括大家常用的变形稳定器、模糊、裁剪,以及 Lumetri 调色等等,这些在过去都是需要 CPU,耗费大量时间去做分析和运算,但现在有了 GPU 的帮助,可以更快完成这些效果的合成速度,让剪辑工作变得更顺畅。

最后当大家把素材剪好、加完效果后,就要到第三阶段的导出视频了,而这次 Preimere Pro 的大升级,便是针对这一部分引入了额外的硬件加速,因为过去这个环节,其实也是更多采用 CPU 来进行编码(encode),由此可见现阶段 CPU 性能提升已经不足以满足视频处理的需要了。而 GPU 则将很多工作一点一点的接了过来,在整个工作流中扮演着越来越重要的角色。

目前的创作者用户主要以 3D 动画渲染和高分辨率视频剪辑为主,因此我们这里的测试也是以这两类创意应用为主,我们将在多款应用中对比 RTX 3080 Ti 与 RTX 3080、RTX 3090 显卡的创作效能。

我们基于 AMD 锐龙 7 5800X 处理器搭配了测试平台,锐龙 7 5800X 是目前在游戏性能以及创造性能上都兼具的性价比 CPU,使用这颗 CPU 进行 GPU 的生产力测试不会产生瓶颈。

3D 渲染类

Blender

目前 Blender 可以依靠两种 API 来实现 RTX 3080 Ti 的 GPU 加速,一个是一直以来都有良好支持的 CUDA 加速,另一个则是使用 OptiX API 来调用到 RTX GPU 的硬件加速能力,包括支持光线追踪和 AI 降噪功能多种功能的加速。从成绩上可以看到,由于 Optix API 可以调用 RTX GPU 中的 RT Core 等诸多特有单元,因此其渲染速度相比常规的 CUDA 加速可以说是大大提升,往往只需要后者不到一半的时间即可完成。同时得益于更高的基本规格和更大容量的显存,RTX 3080 Ti 在渲染速度上相比 RTX 3080 也有明显的提升,可以缩短 10% 的时长。

而 RTX 3080 Ti 与 RTX 3090 的差距则很小,两者的成绩差距基本上都控制在 5% 以内,有部分测试甚至可以跑出与 RTX 3090 相同的成绩。

V-Ray

在 V-Ray 同样可以实现常规的 CUDA 加速以及 RTX GPU 加速,后者是 RTX 系列专享的加速模式,从成绩上看规格更高的 RTX 3080 Ti 在两项测试中都领先 RTX 3080,领先幅度超过 10%,明显拥有更高的运作效能,而与 RTX 3090 之间的差距则小得多,RTX 3080 Ti 的表现要更接近于 RTX 3090.

在接下来的 Octane 以及 Indigo 测试中也是类似的结果,RTX 3080 Ti 在渲染效能上相比 RTX 3080 均有 10% 到 15% 的优势,与 RTX 3090 之间的距离则不到 5%,这也就意味着比 RTX 3080 更高的基础规格以及更大的显存容量为 RTX 3080 Ti 带来的不仅仅游戏性能的大幅提升,对于创作者应用也有明显的加速,而且与 RTX 3090 之间的差异是非常小的,在日常应用中甚至肯说两者的差距几乎可以忽略。

Octane

Indigo

视频剪辑类

Adobe Premiere Pro 作为视频后期工作中最流行的软件,Premiere Pro 很早就支持了 CUDA 运算的水银加速,帮助加快视频剪辑操作,而且 Adobe 还利用上 RTX GPU 的 AI 运算能力,来解决一些重复繁琐的工作,比如 AutoReframe,这大大提高了如今流行的竖屏视频制作效率。另外从 2020 版本开始,在视频最后的导出阶段,现在还支持利用 NVENC 来加速编码,相比传统的软件编码,大大缩短了导出时间。

Premiere Pro 的测试分为渲染和导出两个项目,在渲染中测试中 RTX 3080 Ti 用时相比 RTX 3080 更低,而且在视频时长越长、所需素材越多的情况下,优势会愈加明显,从整体来看可以比 RTX 3080 节约 10% 的时间,对于长视频来说这个幅度会变得相当可观。

RTX 3090 在测试中速度肯定是最快的,但是就实际体验来说 RTX 3090 并没有比 RTX 3080 Ti 快很多,大部分时候都只有数秒的差别,需要渲染的视频时长越短两者之间的差距也同样会越小,也就是说 RTX 3080 Ti 在 Premiere Pro 中的渲染速度是接近于 RTX 3090 的。

在导出测试三者的差距则都不明显,短视频的导出上三者所用时间几乎一致,只有时长比较长的视频在导出时,三张显卡相互之间才会拉开一些差距,从体来说依然是 RTX 3080 Ti 领先与 RTX 3080,同时表现与 RTX 3090 几乎一致,也就是说对于专业剪辑的人员来说,RTX 3080 Ti 的工作效率基本上就是 RTX 3090 的相同水平。

创意类软件的应用一方面是速度,另一方面是稳定性和专属工作流的优化。之前在 GPU 领域一直是分为游戏 GPU 以及设计专用 GPU 两个部分,现在 NVIDIA RTX Studio 和 CUDA 把创意类软件的生态和游戏生态融合的非常好,不同需求的用户可以通过切换不同的驱动来满足游戏与创造的双加速,不少生产力软件也十分依赖于 RTX 生态以及 CUDA 生态。

作为最接近 RTX 3090 的次旗舰,RTX 3080 Ti 在这两方面同样有很好的兼顾,其不仅可以实现游戏效能接近于 RTX 3090、领先 RTX 3080 达 10% 的目标,同时在创作者应用上同样实现了接近于 RTX 3090 且相比 RTX 3080 明显更高的工作效率,同时售价比 RTX 3090 要便宜 3000 元,因此如果说 RTX 3090 更倾向于提供最佳的创作者效能的话,那么 RTX 3080 Ti 则是更适合于创作与游戏都要兼顾的用户,对他们而言后者才是更合适的选择。

以上内容由"超能网"上传发布 查看原文
一起剪

一起剪

ZAKER旗下免费视频剪辑工具

一起剪
相关标签
科技频道

科技频道

科技改变世界

订阅

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容