开始的地方
如今想要组装一台心仪的电竞主机,玩家们的钱包往往要面临不小的考验。随着近期供应链波动带来的硬件价格普遍上浮,如何在有限的预算内压榨出最大的性能潜力,成为了当下装机圈最热门的话题。在这个讲究"把钱花在刀刃上"的时间节点,大家都在急切寻找一款既能稳守主流画质防线,又不必为溢价买单的"版本答案"。正是带着这样的期待,我们将目光投向了今天的主角:INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙。
提起"超级冰龙(iCHILL)",老玩家脑海中浮现的关键词往往是扎实的散热堆料以及极致的静音表现。在全新的Blackwell架构加持下,INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙不仅继承了台积电先进的定制工艺,更带来了革命性的DLSS 4多帧生成技术。在显存价格波动、装机预算普遍收紧的当下,这款8GB版本的超级冰龙试图通过极致的散热效能和稳定的高频输出,在2K分辨率与高画质3A大作的博弈中,为玩家提供一个兼具性价比与使用体验的平衡点。
规格介绍开始前,照例讲讲新显卡的规格。GeForce RTX 50系显卡采用了此前NVIDIA在AI领域推出的Blackwell架构,以大卫·布莱克威尔命名,其是一名受人尊敬的数学家和统计学家,在博弈论和统计学领域留下了不可磨灭的贡献,NVIDIA用其名字命名这一架构反映了新平台的开创性和先进的计算能力。Blackwell可以说是NVIDIA近年来更新幅度最大的GPU架构了,相比起之前的架构来说,划时代的引入了神经网络着色器,力图为游戏开创先进、高效更有逼真的渲染方式,带给玩家全新的游戏体验。
相比前代Ada架构,Blackwell的升级聚焦于四大方向:分别是AI算力的爆发、光线追踪技术的革新、显存能效的提升以及划时代的神经网络渲染。
第五代Tensor核心
其中AI算力的爆发就不得不提到Blackwell架构上的第五代Tensor核心,新一代Tensor核心添加了对FP4浮点运算精度的支持。FP4是一种较低的量化方法,类似于文件压缩,可以减小模型推理过程中数据存储和计算量大小,提高计算效率,降低该过程对显存的要求。与大多数模型默认使用的FP16相比,FP4使用的显存不到其一半,并使GeForce RTX 50系列GPU的性能相比上一代提升高达2倍。
第四代RT核心而光线追踪技术的革新则仰赖于第四代RT核心的加持,相较于第三代RT核心来说,Blackwell架构的第四代RT核心主要提升了检测光线、路径与三角形相交的效能,过往在检测时往往只能检测单个三角形,一旦场景复杂,检测能力不足就容易导致渲染出错等问题,而现在检测能够以簇集方式进行,检测效率更高。同时还有三角形簇集解压缩引擎加持,其新增了Linear-swept Spheres(LSS)功能,可以减少渲染毛发所需的几何图形数量,并使用球体代替三角形以获得更准确的毛发形状拟合,能够让显卡发挥更好的性能但只消耗较小的显存占用。
综合来看,Blackwell架构的光线追踪多边形相交效率是上一代Ada架构的2倍,是Turing架构的8倍,同时还可以节省25%的显存使用率。
第四代RT核心的改进主要是为实现更好的光追效果。其中有两项新技术能够受益,第一项是RTX Mega Geometry技术。随着光线追踪游戏场景的几何复杂性不断增加,游戏画面中几何图形的计算量也呈现出快速增长的趋势。而RTX Mega Geometry技术能够加速构建边界体积层次结构(BVH),使得在实时渲染中可以处理多达100倍的三角形数量。
该技术的出现,也使得开发者能够在游戏场景中使用更复杂的几何图形,而不会影响游戏帧率。过去需要一个个算BVH,现在RTX Mega Geometry能够智能地在GPU上批量更新三角形簇,减少了CPU的负担,既保证了性能,也兼顾了图像质量。相信随着这些技术的不断发展和应用,未来的游戏将能够呈现出更加逼真和细腻的视觉效果,同时保持高效的性能表现。
另外一个能够受益的技术则是Curve Primitive,方便光追在曲面中的应用,例如一位男士的头发可能需要多达400万个三角形,再加上光线追踪技术,画面所需要的运算负载极大。NVIDIA则通过第四代RT核心中的Linear- Swept Spheres(线性扫描球体)技术有效减少了渲染头发所需的几何体数量,以球形代替多边形,更贴合头发的形状,从而将
内存占用量大幅缩减至三分之一,并进一步提升了实际帧数,让头发的渲染效果更加自然流畅。
GDDR7显存第三点改变则是显存效率的提升,Blackwell架构中还首次加入了对GDDR7显存的支持,此前GDDR6显存的信号编码为NRZ/PAM2,而RTX 40系上的GDDR6X则是PAM4编码。最新的GDDR7显存,信号编码改成了PAM3,NRZ/PAM2每周期提供1位的数据传输,PAM4每周期提供2位的数据传输,而PAM3每两个周期的数据传输为3位。说人话就是,新的编码机制可以使杂讯失真比减小,信号品质更清晰,同时还能带來更高的显存运行频率以及更低的电压,根据NVIDIA的介绍,使用GDDR7显存后,数据传输速率可达GDDR6时的2倍,并且功耗接近GDDR6的一半,经典加量还减价。
神经网络着色器接着我们再细说一下这一代架构最大变化,NVIDIA这次将Blackwell架构的SM单元直接称为神经网络着色器。相比较于之前的可编程着色、CUDA统一着色、通用计算着色来说,其最大的变化就是引入了AI,AI将会彻底改变GPU的着色方式。
在Blackwell架构中,NVIDIA 进一步拓展了神经网络渲染的范畴,引入了诸多创新元素,包括神经网络纹理压缩(Neural Textures)、神经网络材质(Neural Materials)、神经网络体积(Neural Volumes)、神经网络辐射场(Neural Radiance Fields)以及神经网络辐射缓存(Neural Radiance Cache)等,这些元素共同构成了神经网络渲染中神经网络着色的重要呈现方式。
这里举个例子让大家能够更简单的理解神经网络渲染,过去复杂的物品或大量异材质的贴图往往会占用相当大的内存空间,如果叠加光追的话,计算量将会更大。然而,得益于神经网络渲染技术中的神经网络材质功能,这一问题得到了显著改善。开发者可以先在离线渲染出物品的光照数据,然后再用这些数据训练一个小的AI模型,游戏运行时只要实时调用这个AI模型当场推理就好了,这样就能还原出想要的光照效果了,再配合神经网络纹理压缩技术,就能显著降低实际生成的材质数据量,从而在占用更少显示内存的同时,实现了细节更丰富的材质表现,达到了实时生成如电影般细腻素材的效果。
目前神经网络渲染技术已经得到了微软的大力支持,未来也将会加入到DirectX中,玩家能够体验到更真实的游戏世界。
而在硬件层面,由于神经网络渲染的加入,Blackwell架构的SM单元相较于RTX 40系的Ada架构还是有不小变化的,Ada架构内的SM内,SM单元会拆分成一半的CUDA专门用于处理FP 32(单精度浮点数),另一半则依需求动态调整去处理FP32和INT32(32位整数)。而在Blackwell架构上,SM单元则改成了CUDA核心可以完全依需求动态处理FP32和INT32的形式。
另外一个改进是,过往的着色工作往往只有SM单元的Shader在处理,而Blackwell架构上引入了神经网络渲染以后,使得Blackwell架构上的第五代Tensor核心也能共同分担着色工作,大大提高了着色效率。
这样改进的好处是,Blackwell架构能够进一步针对神经网络渲染工作进行排序,即把传统的着色工作分配给Shader,而需要动用神经网络渲染的工作负载则可以给到Tensor核心上,两种核心同时运用,效率最高可以提升2倍之多。并且得益于Tensor核心也加入了可编程渲染管线,现在开发者或API也能更好的调用Tensor核心,未来游戏内我们能见到的AI技术势必越来越多。
先进的AI管理处理器此外,AI的应用也越来越多,不仅游戏中应用AI技术,现在连可编程渲染的过程里也引入了AI,因此如何去分配显卡内部多样化工作就成了一个问题。如过往显卡在开启DLSS玩游戏时,其中应用到的语言模型和游戏引擎需要同时与GPU的不同核心交互,生成游戏帧,但是往往很难做到每一帧都有一致的生成时间,亦或者是游戏AI对话的响应不够及时,这些情况都会造成游戏体验不友好。
而Blackwell架构为了解决这一问题,引入了AI管理处理器(AMP)。它能够实时调度资源,确保在神经网络渲染、帧生成和 AI 驱动的游戏交互中实现智能化的任务分配。这种设计不仅带来了更高效的性能输出,还让显卡在游戏渲染和 AI 运算之间实现了绝佳的平衡,确保帧的间隔均匀,对话类型的AI能够及时响应,玩家的游戏体验一致性能够比较好的保障。
GeForce RTX 5060 Ti 8GB规格说了这么多,接下来给大家介绍一下GeForce RTX 5060 Ti 8GB的硬件规格,作为RTX 50系的一员,核心采用了新的GB206芯片,核心代号为GB206-300-A1。在架构上拥有3个GPC,但每个GPC包含的TPC并不相同。GeForce RTX 5060 Ti 8GB上总共集成了18个TPC,36个SM单元,144个TMUs纹理单元,48个ROPs光栅化处理单元以及4608个CUDA核心。
在工艺制程方面,新的GB206芯片沿用了TSMC 4nm 4N NVIDIA Custom Process工艺。核心面积为181mm2,内部晶体管数量则有219亿,虽然在芯片面积以及晶体管数量上相比上代少了一些,不过得益于更先进的架构设计,GeForce RTX 5060 Ti 8GB的CUDA核心数比上代多出了5.8%。基础频率与Boost频率也有小幅上升,由原来的2310MHz与2535MHz提升至现在的2407MHz以及2572MHz,想必性能也有不小的长进。
除此之外,GeForce RTX 5060 Ti 8GB还配备了全新的GDDR7显存,显存等效频率可达28Gbps,同时视频输出接口也进行了升级,能够兼顾高分辨率与高刷新率,后续开箱显卡时我们会详细介绍。
显卡外观赏析
首先让我们一起看看这款显卡的外包装,有一说一,作为旗舰系列,INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙的包装相当扎实,透露出一股浓厚的"重装武力"气息。外盒延续了经典的硬核科技美学,以极具质感的哑光黑为底色,封面上那枚硕大的"iCHILL"冰银色Logo在冰蓝流光的映衬下显得格外冷峻,左侧醒目的"X3"标识直观地宣告了其三风扇的豪华散热配置。
包装正面左下角整齐排列着"OC(超频)"、"LOW NOISE(低噪)"等特性标签,与右侧NVIDIA标志性的"GEFORCE RTX 5060 Ti"翠绿涂装相得益彰,瞬间拉满了电竞氛围。
翻转至背面,映众更是硬核地印制了散热模组的详细结构爆炸图,从复合热管的走向到大面积铜底的覆盖,每一个散热细节都清晰可见,这种"把堆料画在包装上"的自信语言,让人未拆封便能感受到这款非公版显卡的满满诚意。
INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙的正面外观极具视觉冲击力,完美诠释了"冰龙"系列的硬核基因。映入眼帘的是三枚硕大的定制散热风扇,扇叶中心统一嵌有"iCHILL"Logo,霸气十足。深灰色的导流罩采用多重棱角切割设计,搭配银色的金属质感饰条点缀,营造出一种冷峻而强悍的机甲风格。整卡厚度达到了扎实的3槽位,这种敦实厚重的体量感,直观地展现了其内部蕴含的庞大散热规模。
视线转向显卡背面,全尺寸的金属背板不仅起到了加固PCB、防止弯曲的作用,在颜值上也毫不妥协。背板表面经过细腻的磨砂处理,左侧覆盖着大面积的几何冰裂纹理,极具动感;右侧则印有醒目的白色"iCHILL"雪花标识,品牌辨识度拉满。最为关键的是,背板尾部设计了标志性的大面积镂空开孔,气流可直接穿透散热鳍片排出,这种贯穿式风道设计能显著提升散热效率。
视线来到显卡顶部,这也是玩家在装机后透过侧透玻璃最常注视的视角。映众在这里采用了极具层次感的装甲设计,银灰色的金属饰板上印有清晰的"GEFORCE RTX"字样,彰显其身份。紧邻其侧的是独立的"iCHILL"Logo区域,与普通的印刷字体不同,这块区域明显是为了RGB灯效而预留的导光层,点亮后能呈现出深邃的流光质感。
显卡的尾部设计同样没有被忽视,映众在此处运用了全包围式的护甲结构,并模印了硕大的立体"iCHILL"浮雕Logo,赋予了显卡360度无死角的工业美感。值得注意的是,在尾部角落处还预留了一个小巧的ARGB同步接口。这一人性化的设计允许玩家通过线材直接连接
主板的5V ARGB接针,实现显卡灯效与整机风扇、水冷系统的完美神光同步。
至于供电接口方面,不同于其他RTX 50系显卡,INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙为单8Pin接口,熟悉的感觉又回来了,应对180W的TGP完全足够。
当然,参与供电的不止8Pin接口,显卡底部的PCIe金手指也会参与部分供电。并且这一代显卡的PCIe接口升级成为了5.0速率,这也是首次在RTX 50系显卡上应用,能够带来更高的传输速率,另外仔细看金手指的形状,它和上一代的显卡也有些微的变化。
最后再看看显卡的IO接口,显卡的视频接口为3个DisplayPort 2.1b和1个HDMI 2.1b,挡板为标准的2槽,可以看到导风罩比挡板高出1槽左右,正常来说支持4槽的机箱都能够装下,但仅支持2槽厚的A4背靠背机箱恐怕就不行了。
显卡拆解赏析当我们卸下背板与散热器的固定螺丝,小心翼翼地分离PCB与散热模组那一刻,INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙的"内在肌理"便毫无保留地展现在眼前。最先夺人眼球的并非核心电路,而是那个体积庞大、分量感十足的散热系统。映众为这款甜点级显卡配备了旗舰级的散热规格,整个散热模组的长度几乎达到了PCB板本身的两倍。
在散热底座的设计上,映众采用了大面积的镀镍纯铜底座,不仅能够完全覆盖GPU核心,更通过精密的公差控制,将周围的GDDR7显存颗粒也一并纳入了直接接触散热的范围。这种一体式散热设计极大地降低了热阻,确保了显卡在高负载运行时,不仅核心凉爽,对温度敏感的显存也能维持在最佳工作区间。
深入观察散热器的导热结构,我们可以清晰地看到4根直径为6mm的复合纯铜热管横贯其中。映众的工程师在这里展现了细腻的布管智慧:中央的两根热管采用了独特的回弯设计,这种布局能够缩短热量传导至散热鳍片边缘的路径,从而更高效地利用鳍片的每一寸散热面积。热管与鳍片之间采用了高标准的穿Fin与回流焊工艺结合,连接处严丝合缝,没有丝毫的溢胶或缝隙。散热鳍片本身排列极其致密,且全数经过镀镍处理。这层银色的镀镍层不仅赋予了散热器冷峻的金属质感,更重要的是防止了铜铝氧化,保证了显卡在长期使用后依然能维持出厂时的散热效能。
将视线移至PCB本体,INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙采用了一种非常紧凑的非公版方案。PCB的整体长度仅为散热模组的一半左右,呈现出一种独特的短卡形态,右侧为了避让风扇进风而做出了异形切割,使整个PCB呈现出一个标准的"C"字型布局。这种"小板大散热"的设计思路是目前高端显卡的主流方向,它允许散热器右侧的风扇直接吹透鳍片,形成毫无阻碍的贯穿式风道,极大地提升了机箱内部的热交换效率。虽然PCB尺寸小巧,但其上的元器件排布却显得错落有致,毫无拥挤杂乱之感,尽显大厂的布线功底。
在PCB的中央,坐落着这块显卡的心脏——代号为GB206-300-A1的NVIDIA Blackwell架构核心。作为新一代中端主力,GB206核心表面不仅蚀刻着NVIDIA的Logo,更承载着数以亿计的晶体管,是DLSS 4与光线追踪性能的物理基石。
围绕在核心周围的是本次升级的重头戏:GDDR7显存。我们可以清晰地看到来自三星的显存颗粒,具体型号为K4VAF325ZC-SC28。四颗共组成8GB GDDR7显存。
供电系统则是衡量显卡稳定性的重要指标。在GB206核心的左侧和右上角,映众布置了总计7相的供电电路,采用了5+2相的供电方案。其中5相专门负责GPU核心的供电,另外2相则负责显存供电。
在核心供电的用料上,映众选用了威世(Vishay)的SiC653A Dr.MOS芯片。这是一款高集成度的功率级芯片,单相连续输出电流能力高达50A。对于TGP仅为190W左右的RTX 5060 Ti来说,5相核心供电意味着理论上能提供250A的电流,这显然是大幅度的冗余设计。这种"杀鸡用牛刀"的堆料策略,能够确保每相供电都在低负载的高效区间运行,从而大幅降低供电模块的发热量,并为玩家后续的超频操作提供了坚实的电流保障。
为了滤除电流杂波,供电电路周围密布着红色的FP5K固态电容,这些电容具有极低的ESR(等效串联电阻)和优异的耐高温特性,能够保证显卡在瞬息万变的游戏负载中获得纯净且稳定的电压输入。
最后,我们不能忽视PCB上的接口细节。在显示输出区域,3个DP接口和1个HDMI接口均采用了镀金工艺处理。金黄色的金属屏蔽罩不仅提升了接口的耐插拔性,更能有效屏蔽高频信号干扰,确保8K分辨率下的视频信号传输稳定无闪屏。
纵观整个拆解过程,INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙无论是从散热规模的宏大,到核心供电的扎实,再到细微之处的防护,都展现出了一款旗舰级非公版显卡应有的素质。它没有因为定位"甜点"而在PCB用料上缩水,反而通过超越同级的散热配置和冗余供电,将这颗GB206核心的潜力挖掘到了极致。
测试平台介绍开始性能测试前介绍一下本次的测试平台, CPU使用的是目前毫无争议的游戏神U——AMD Ryzen R7-9800X3D,主板则是来自微星的MPG X870E CARBON WIFI 暗黑主板。内存为G.Skill的幻锋戟Z5 RGB DDR5,在这块主板上能轻松达成DDR5-8000 C38的成绩,并且我们这次选用的是24G×2的套条,确保这张显卡能够释放全部性能。
完整配置如下所示:
理论性能测试在正式开启测试前,我们先来剖析一下这款INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙的基础素质。根据 GPU-Z 的数据显示,该卡的基准频率定在了 2407MHz,而加速频率则高达 2662MHz。与上一代 RTX 4060 Ti 相比,这一代在频率上的堆料可谓诚意十足。为了支撑更高的性能输出,其 TDP 功耗也随之微增至 190W,并极具前瞻性地搭载了全新的 GDDR7 显存,这使得显存带宽直接飙升至 448GB/s,彻底告别了前代的带宽瓶颈。
进入 3DMark 理论性能实测环节,INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙展现出了近乎"代际压制"的实力。在 Fire Strike 系列测试中,它在 1080P 分辨率下对比 RTX 4060 Ti 的领先幅度达到了惊人的 33%,即便是在压力更大的 2K 和 4K 分辨率下,领先优势也稳稳维持在30%左右。而在衡量 DX12 性能的Time Spy测试中,新显卡依然保持了超20%的性能跨越,这种提升力度在甜点级显卡中实属罕见。
除了传统的图形性能,光追表现的升级同样堪称"史诗级"。 INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙在光追项目测试中跑出了 10719 的高分,整整领先 RTX 4060 Ti 约 31%。在最新的 Speed Way 测试里,这种超 27% 的涨幅依然得到了延续。可以说,无论是在光影追踪还是综合渲染能力上,这一代超级冰龙都通过硬实力的全方位增长,重新定义了 60 Ti 级别的性能基准。
DLSS 4测试 & DLSS 4.5解析
看完了理论性能部分的测试,接着我们再来看看本次RTX 50系显卡最"顶"的升级,DLSS 3在RTX 40系显卡上引入了帧生成技术,能够依靠AI在两帧之间生成一帧AI帧,从而实现帧数的翻倍,用过的玩家都说好!不过由于每生成一个新的帧都需要光流加速器和 AI 模型参与,因此生成多帧的开销相当高昂,而过高的性能开销会带来瓶颈,导致帧率提升受限。
而这次DLSS 4全新升级,引入了多帧生成技术,它可以利用 AI 为每个渲染帧额外生成多达3帧!相比传统渲染的方式,能够最多实现8倍的性能提升。无论是对性能、显存的开销还是延迟都比之前要好了许多。
另外,由于多帧生成技术,输出的帧多了,要给每一帧都安排一个合理的间隔刷新才能让观感更好。因此NVIDIA还引入了专属的Flip Metering来代替CPU Pacing,它将帧节奏逻辑转移到显示引擎,让GPU能够更精确地管理显示时间,尽可能的将每一帧画面的生成时间保持一致,从而提高整体游戏视觉的流畅感。不过由于Flip Metering是硬件级的控制器,因此DLSS 4的多帧生成目前只有RTX 50系显卡支持。
同时DLSS 4 还引入了图形行业首个 Transformer 模型实时应用。熟悉AI的应该对它很熟系了,它在AI生成领域已经应用多年了。基于Transformer架构的 DLSS 超分辨率和光线重建模型,相比之前DLSS使用的卷积神经网络(CNN)模型来说,具备2倍的参数量和4倍的计算量。在游戏场景中,能够提供更高的稳定性、更少的拖影、更高的细节和更强的抗锯齿能力,使画面更加清晰、流畅和逼真。
不过虽然DLSS 4的多帧生成功能是RTX 50系显卡的独占功能,但新的Transformer模型将会逐步下放至DLSS 3、DLSS 2等,将适用于所有GeForce RTX显卡。并且根据NVIDIA的说法,超过250款游戏和应用已经支持DLSS 4的全新DLSS多帧生成功能,包括《赛博朋克2077》《战神:诸神黄昏》《心灵杀手2》《霍格沃兹之遗》《黑神话:悟空》等。随着时间的推移,支持DLSS 4的游戏和应用数量将不断增加。
简单介绍完,我们再看看DLSS 4的理论表现如何,还是经典的3DMark测试。不得不说INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙搭配上DLSS 4后,帧数就跟打了鸡血一样,开关前后的性能简直天壤之别!其中2K分辨率下,开关前后性能差距足足有4倍之多。4K分辨率时帧数差距直接就是7倍。或许以后甜品卡也能畅享8K游戏也说不定。
接着我们看看DLSS 4在实际游戏中的表现,率先登场的就是有着"显卡杀手"之称的《赛博朋克2077》,它的设置页面是目前支持DLSS 4游戏中最为丰富一款,除了能够设置DLSS 4的多帧生成外,还可以切换DLSS 4的另一个特性——Transfomer Mode,据说能够让画质更清晰,同时还能改善此前的拖影问题,对玩家可以说是一大利好。
我们直接来一波对比,左侧为Transformer模型,右侧则是原本的CNN模型。从第一个场景来看,Transformer模型能够带来更多的细节。例如左侧图片中的栏杆倒影,这部分表现是比较清晰的,而CNN模型中则几乎不可见。
第二个场景也是能够一眼看出区别的,例如金属门的纹理细节以及砖墙的接缝处,明显是Transformer模型的优化要更好一些。
这个场景的区别主要在于地板细节刻画以及右侧铁栏杆部分,采用Transformer模型的情况下,地板细节更接近真实世界,并且铁栏杆的细节也能更好的还原。而CNN模型则会丢失比较多的细节,虽然不影响观感,但总有种"失真感"。
不过Transformer模型目前也并非万能,毕竟是由AI生成而来,因此在部分细节上还是有些错误的。例如下方的窗口部分,阳光照射下应该是斑驳的光影,比较正确显示的应该是CNN模型中的样式。整体来看,现在Transformer模型瑕不掩瑜,大幅改善的画面细节能够给玩家带来更精致的游戏展现。
见识完Transformer模型的魅力以后,我们再来看DLSS 4的性能表现,毕竟是"显卡杀手",对显卡的压力确实不一般,在最高画质+路径追踪的情况下,INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙只能跑29 FPS,完全不可玩。开启DLSS 3以后,游戏帧数为100 FPS,体感已经非常流畅了。开启DLSS 4以后,INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙能够做到183 FPS,对比原生分辨率,性能足足提升了6.3倍。1%Low就更离谱了,几乎快要追上DLSS 3下的平均帧了,整体游戏体验更佳。
DLSS 4带来的性能提升是有目共睹的,不过也有玩家担心DLSS 4的画质表现如何,这里我们也在游戏中截取了部分画面,第一个场景其实差距不大,肉眼很难分辨出区别。
第二与第三个场景还是能够看出部分细节的,例如第二幅图中的霓虹灯牌,DLSS开至性能档以后,能够看到灯牌与前面三张图有些许差异,不过你得靠细致的对比才能看出。实际游戏过程中很难发现,基本不影响观感。
总的来说,DLSS对画质的影响没有玩家想象中那么大,甚至于在纹理细节上能够不输或超越原生分辨率。如果你是敏感型玩家,那建议可以开至平衡档,在画面质量和帧率之间能够做到很好的平衡。如果你是追求超高帧率,那性能档也绝对可用,细节保留也不错,不对比基本看不出,同时帧率还能进一步提高。
第二款游戏则是NVIDIA在前段时间强力推荐的《半条命2》RTX版,这款游戏不仅支持了DLSS 4,同时也在游戏中加入了RTX神经网络辐射相关的技术,与初始版本的《半条命2》相比,画质可以说是史诗级的进步!
实测下来,只能说《半条命2》RTX版对硬件的开销极大,在原生1080P分辨率下,所有画质、光追均开至最高,不开启超分选项时,INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙帧数为52 FPS。在开启DLSS 3质量档以后,游戏帧数瞬间来到了135 FPS,体验都变得丝滑了许多,而继续开启DLSS 4质量档,游戏帧数又在原来的基础上上涨了100 FPS,对比原生1080P的表现,性能提升高达4.6倍!1%Low的表现也差不多,领先幅度也是4倍以上。
DLSS 4带来的性能提升是有目共睹的,同时DLSS 4的画质也表现极佳,这里我们还是在游戏中截取了部分画面,基本上可以说DLSS对画质的影响没有玩家想象中那么大,甚至于在纹理细节上能够不输或超越原生分辨率。
另外,游戏设置中还可以切换DLSS 4的另一个特性——Transfomer Mode,这里我们也截图了相同的场景进行对比,从下图可以看出Transformer模型能够带来更多的细节。例如左侧图片中的墙壁,这部分表现是比较清晰的,细节也更多,而CNN模型中则几乎不可见。图片中主体的木屋纹理也是Transformer模型下会更清晰,线条更锐利。
我们测试的第三款DLSS 4游戏是《霍格沃兹之遗》,支持DLSS 4技术以后可以在设置看到帧生成部分多了一些选择,其中×2则是原本DLSS 3的帧生成,而×4则是RTX 50系独有的多帧生成功能,另外你也可以选择插2帧的方式,也就是所谓的×3选项。
实际测试过程中,我们发现《霍格沃兹之遗》这款游戏优化还是不错的,1080P分辨率画质光追均设置最高的情况下,INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙在不开任何超分的情况下,平均帧为71 FPS。如果开启DLSS 3质量档,此时帧数已经能够做到119 FPS了,属于是高刷与画质的完美组合,体验相当丝滑。开启DLSS 4以后,帧数可以进一步提升至217 FPS,对比原生1080P的表现,性能提升了约3倍以上。同时实际游戏过程中,无论是1%Low还是延迟都不错,特别是延迟,相比原生分辨率还要低不少,跟手感更好。
第四款游戏我们测试的是《星球大战》,一样你能在设置中看到其帧生成功能已经支持×4的选项,也就是DLSS 4多帧生成功能。
实测DLSS 4在这类优化欠佳的游戏中确实大有用处,在1080P原生分辨率下,INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙的平均帧仅有97 FPS,整体游玩体验还不错。而开启DLSS 4质量档以后,游戏平均帧直接暴增至267 FPS,游戏体验如德芙般丝滑,对比原生1080P的表现,足足有2.7倍左右的提升。即便是对比DLSS 3的154 FPS,那也是接近翻倍的性能提升。
接下来我们再测一下第一款国产3A大作、去年的热门单机游戏《黑神话:悟空》,去年发售时,这款游戏也是率先支持了DLSS 3帧生成功能,如今它还支持了RTX 50系显卡的DLSS 4多帧生成,游玩体验将会更加顺畅,开启方式也很简单,在游戏菜单设置中即可找到4X的选项。
我们在1080P下将画质调整至影视级,全景光追也拉到最高,此时INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙在不借助任何超分技术的条件下,游戏帧数仅有27 FPS。而有DLSS 3的帮助后,游戏帧数也回到了流畅的水准77 FPS;这时如果你有RTX 50系显卡,开启DLSS 4多帧生成以后,游戏帧数将再度飞跃,138 FPS的表现相当夸张,对比原生分辨率提升了5.1倍以上,直接由可玩变爽玩了。
最后一款游戏是我们的老熟人《漫威争锋》,这款游戏在RTX 50系显卡首发之时,它还没有完全适配DLSS 4,玩家想要体验多帧生成功能还需要依靠NVIDIA App的DLSS 4优设功能。不过现在《漫威争锋》也正式支持DLSS 4了,与上面的游戏一样,玩家在游戏设置中就能直接开启,并且提供了2x、3x以及4x选项,玩家可以随意选择是插一帧、插两帧还是插三帧。
实测INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙在1080P全高设置下,不开超分,帧数为111 FPS,甚至已经快满足高刷的游戏需求了。开启DLSS 3后帧数可以达到224 FPS,相比原生分辨率已经提升了一倍以上,如果再开启DLSS 4多帧生成,性能对比原生分辨率直接提升3倍以上,366 FPS的表现妥妥的电竞3A。同时延迟以及1%Low表现也非常出色,反应在游戏中会更加跟手,体感更佳。
当然,如果你想玩的游戏还不支持DLSS 4,那也不用担心,NVIDIA App还提供DLSS 4优设功能,说人话就是能够让游戏强开DLSS 4,像此前的《漫威争锋》,在未更新前,玩家可以直接在NVIDIA App中简单设置,就能将帧生成调至"4×",一键实现多帧生成。目前也有不少游戏支持DLSS 4优设功能,感兴趣的玩家可以前往体验。
DLSS 4多帧生成功能的问世,毫无疑问为玩家带来了前所未有的游戏体验升级。与上一代RTX 40系的DLSS 3帧生成功能相比,它再次实现了帧数的惊人飞跃。在相同的画质设置下,INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙的表现远远超越了RTX 4060 Ti。实际测试中,在上述六款游戏里,开启DLSS 4的INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙,帧数几乎是RTX 4060 Ti的两倍!在部分极其吃硬件的游戏中,帧数甚至可以做到三倍左右,非常夸张!
聊完了DLSS 4,再用一点点时间给大家讲讲它的升级版DLSS 4.5!其主要更新了第二代Transformer超分辨率模型,还有高达6倍的多帧生成和动态多帧生成模式,可以说是款款都够劲爆。
其中第二代Transformer模型还是非常厉害的,根据NVIDIA的描述,该模型的计算能力达到了第一代模型的五倍,而且在一个更大规模的数据集上完成了训练。新的模型对各种游戏场景都有着更深入的理解,并且能更好地运用游戏引擎提供的数据进行画面的增强,从而减少闪烁、拖影等不稳定的现象。当然,还有细节上的提升——NVIDIA表示,虽然第二代Transformer模型为DLSS的四个模式都带来了升级,但在性能和超级性能模式中的提升是最显著的。
目前NVIDIA提供了两个DLSS 4.5超分辨率模型,分别是Model M和Model L,前者适用于各种分辨率和模式,后者则专为4K DLSS超级性能模式优化。你需要先把驱动更新到最新版,并进入NVIDIA App的测试版,才能通过DLSS优设功能应用新模型。
在实际体验中,我们能明显感受到其对场景的感知能力有了质的飞跃。即使是在画面中出现极其快速移动的物体时,新模型也能通过精准的像素采样与运动矢量分析,呈现出如丝般平滑的边缘画质,彻底告别了以往高速运动中可能出现的伪影和模糊。
至于玩家们关系的DLSS 4.5的6倍多帧生成功能也即将在今年春季上线,仅RTX 50系显卡能够享受,游戏帧数将进一步飞跃,让甜品卡也能拥有过往旗舰卡甚至超越过往旗舰卡的体验。
同时DLSS 4.5还提供了动态多帧生成模式,具体来说就是根据游戏的负载情况去调整帧生成的倍率,确保游戏的帧率能匹配显示器的最高刷新率:如果游戏场景压力大,就尽量开高到5倍甚至6倍,但只要压力小,帧生成的倍数也会降低。NVIDIA表示,这种动态调整的帧生成可以完美平衡帧率、画面和PC延迟。
另外,提到DLSS就不得不提全新的NVIDIA Reflex 2技术。延迟一直是电竞中绕不开的话题,玩家的每个动作都会经过复杂的计算,再在屏幕上渲染,这其中的每一步都会增加延迟。虽然延迟往往只有几十毫秒,但是你却能明显的感觉到游戏的不流畅、卡顿。
为了尽可能的降低延迟所带来的不良游戏体验,NVIDIA发布了NVIDIA Reflex技术,它可以使GPU和CPU同步,确保最佳响应速度和低系统延迟。目前NVIDIA Reflex已集成到超过100款游戏中,可以将PC延迟降低50%。
而GeForce RTX 50系显卡再度升级,带来了NVIDIA Reflex 2技术。它结合了Reflex低延迟模式与Frame Warp技术。它可以把最新的鼠标输入指令同步给渲染帧,及时更新渲染的游戏帧并在渲染帧被发送到显示器之前获取最新的鼠标信息,通过刷新渲染的游戏帧以进一步减少延迟,将PC延迟进一步降低多达75%。
另外,Frame Warp的加入,能够进一步将延迟降低。当一个帧被GPU渲染时,CPU会根据最新鼠标或手柄输入计算工作流中下一帧的视角位置。Frame Warp从CPU采样新的视角位置,然后将GPU刚才渲染的帧扭转到最新的视角位置。在渲染帧被发送到显示器之前,在尽可能最新的时间进行扭转操作,确保屏幕上反映最新鼠标输入。
而当Frame Warp转移游戏像素时,图像中可能会产生缝隙撕裂、镜头位置的变化会让游戏场景中显示新的部分。NVIDIA则开发了一种优化了延迟的预测渲染算法,该算法使用来自先前帧的视角、颜色和深度数据,对这些撕裂空白的像素进行准确的图像修复。玩家可以通过更新的视角看到没有撕裂的渲染帧,并降低了改变游戏内视角位置而产生的延迟。说人话就是现在NVIDIA Reflex 2还可以根据上一帧的信息去脑补一些空白的像素,有种无中生有但你又看不出来的感觉。
首发支持NVIDIA Reflex 2技术的游戏是《THE FINALS》以及《无畏契约》,后续我们也会第一时间带给大家该技术的详细评测。
游戏性能测试尽管 DLSS 4 的"黑科技"加成令人垂涎,但考虑到目前生态尚在普及阶段,本次实测我们将重心回归到更为核心的常规性能表现上。
首先在 3DMark 的 DLSS 专项测试中,INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙展现了 Blackwell 架构惊人的能效比——即便 CUDA 核心规模相比前代仅微增 5% 左右,但在 2K 分辨率下,其性能领先 RTX 4060 Ti 幅度高达 31%,即便压力来到 4K,优势依然稳固在 30%以上。不得不说,老黄这次在架构底层的优化确实"有点东西",让性能在硬件规格变化不大的情况下实现了飞跃。
转战实际游戏环节,我们在 11 款主流大作中开启最高画质与光追选项。实测结果显示,这块显卡在 1080P 下几乎是"降维打击":像《F1 22》和《光明记忆:无限》这类优化较好的游戏,帧数能轻松飙至 200 甚至接近 300 FPS;即便是面对《黑神话:悟空》这样的顶级画质大作,它也能稳住 86 FPS 的流畅线,《赛博朋克 2077》更是轻松突破百帧。
整体来看,其性能相比 RTX 4060 Ti 提升了 20%-30%。更值得一提的是,基于如此充沛的帧数储备,INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙显然已不再局限于 1080P 战场,即便是面对 2K 分辨率甚至部分 4K 场景,它依然具备极强的一战之力,完全能满足进阶玩家对更高画质的野心。
图像视频创作性能测试
游戏性能只是开胃菜,接下来我们深入探究INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙在专业创作领域的硬实力。首先参考 PCMark 10 Extended 综合测试,这款显卡在数位内容创作环节表现抢眼,普遍领先 RTX 4060 Ti 约 10% 至 20%;虽受限于早期驱动,生产力评分暂未完全释放,但在常规办公场景下,其性能与前代基本持平,应对日常高负载办公绰绰有余。
真正的分水岭出现在视频创作端,得益于 RTX 50 系架构对编码器的全面革新,在 UL Procyon 及 Adobe、达芬奇等专业软件实测中,新显卡展现了极高的编解码效率,对比前代不仅支持格式更丰富,综合效率更是提升了 23% 至 28%,显著优化了创作者的工作流体验。
3D渲染创作性能测试转向对硬件要求更为苛刻的 3D 渲染与光追创作,INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙的表现同样具备代际优势。在 Blender 与 V-Ray 的双重考验下,它分别取得了约 20% 及 30% 以上的性能领先。
特别是在基于 DXR 的 D5 渲染器中,该卡支持通过 NVIDIA App 开启最新的 DLSS 4 多帧生成技术。实测开启后,渲染预览帧数从原生的 45 FPS 瞬间飙升至 200 FPS 左右,1% Low 帧也稳定在 89 FPS,这种近 4 倍的流畅度提升,即便对比 DLSS 3 也有 30% 到 40% 的优势,彻底改变了实时渲染的交互体验。
最后在工业设计领域的 SPEC2020 测试中,INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙进一步证明了其作为生产力工具的价值。在多项工业软件模拟中,其平均性能较 RTX 4060 Ti 提升了 15% 至 20%。而在算力需求巨大的 3dsmax-07 项目中,性能涨幅更是达到了惊人的 56%。可以说,无论是视频剪辑、3D 渲染还是工业建模,这张新一代甜点卡都展现出了超越其定位的强悍生产力。
NVIDIA编解码测试接下来的测试则是介绍RTX 50系显卡的编解码器,GeForce RTX 50系列显卡上换装了第9代NVENC编码器与第6代NVDEC解码器,在视频规格上支持AV1 UHQ(超高画质 AV1)与MV-HEVC(多视角HEVC)编解码。同时由于GeForce RTX 50系列显卡还升级支持DisplayPort 2.1 UHBR20输出,单一通道支持20Gbps带宽,因此用户可以体验到令人惊叹的HDR视觉效果、超高分辨率和更流畅的游戏体验。
这里我们直接使用NVIDIA提供的4K60片源与工程文件分别测试AV1、H.265以及H.264下的编码导出时间。实测同一段素材下,RTX 5060 Ti导出三段视频的时间分别是16秒、15秒以及14秒,效率比RTX 4060 Ti快了56%、73%以及79%。
同时,我们也对导出的不同格式的视频进行了画质对比,实测AV1编码的视频在画质上与H.265或H.264也没有明显差距,无论是在文字、人像还是建筑等画面里,三者的画质可以说是伯仲之间,如果不特地标注其格式,一般人很难用肉眼分辨出来。随着目前越来越多视频网站、剪辑软件和硬件厂商的推动,未来AV1势必会成为下一个最受欢迎的格式。
值得一提的是,GeForce RTX 50系显卡还能够支持4:2:2色度取样的视频编解码,这将节省CPU的负担,加快创作速度。上面的图表里也可以看到我们的测试成绩,实测导出时间会比上代显卡快不少,毕竟RTX 40系显卡不支持该功能,仅支持4:2:0色度采样,如果一定要4:2:2导出只能靠CPU软解。
4:2:2色度采样的视频文件采用的是YUV颜色格式,与存储红色、绿色和蓝色(RGB)值不同,颜色被存储为亮度Y、蓝差色度U和红差色度V。在这类视频中,视频的完整亮度将被保留,而原始色度信息只保留一半,因此相比4:4:4的视频,其视频帧数据量仅有不到三分之二,而相比4:2:0的视频又能提供两倍的颜色分辨率,因此创作者采用这种格式拍摄,能够在保留更多色彩信息的同时还能减少文件大小和带宽需求。
功耗与温度表现最后来到玩家们最为挂心的"烤机"环节,毕竟性能释放能否持久,散热是关键。得益于INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙那一贯扎实的散热堆料,其实测表现相当稳健。在室温 20℃ 的环境下,经过 Furmark 连续 10 分钟的高压负载,显卡核心温度被牢牢压制在 61.5℃,显存温度更是低至 54℃。此时显卡功耗已顶满 190W 的 TDP 上限,而风扇转速仅为 1646 RPM,在保证高性能输出的同时,噪音控制也做得十分出色。
横向对比 RTX 4060 Ti,虽然新一代显卡的 TDP 确实有所提升,但在INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙的散热系统压制下,整体发热量不升反降。凭借其大尺寸扇叶、高效镀镍铜底座以及科学的导流鳍片设计,这款显卡展现出了极高的热交换效率。部分温度数据甚至比功耗仅 150W 的前代产品还要低,这种"加量不加温"的惊喜表现,无疑是给担心功耗上涨的玩家吃了一颗定心丸。
评测总结总的来看,INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙不仅仅是一次常规的性能迭代,更是一款在散热、静音与硬核性能之间寻求极致平衡的诚意之作。得益于全新的 Blackwell 架构与超高速 GDDR7 显存的强强联合,它在 2K 分辨率的主流战场上展现出了极具统治力的性能表现。更难能可贵的是,映众将"超级冰龙"系列标志性的越级堆料理念贯彻到底,用近乎旗舰级的散热规模去压制一颗甜点级核心。这种"降维打击"般的散热配置,彻底根治了以往中端显卡在满载高频运行时容易出现的积热降频与风扇啸叫痛点,让玩家在享受高帧率游戏的同时,也能拥有冷静、安谧的使用环境。
当然,为了实现这种极致的温控表现,这款显卡在物理体积上做出了一定妥协,接近三槽位的厚度确实对部分追求极致紧凑的小型机箱(ITX)构成了一定门槛。但瑕不掩瑜,对于绝大多数追求稳定体验、看重长期运行可靠性的主流玩家而言,这份体积上的付出是绝对值得的。在 2026 年这个硬件选择眼花缭乱的时间节点,INNO3D映众 GeForce RTX 5060 Ti 8GB 超级冰龙凭借其扎实的做工和全能的表现,无疑成为了主流装机清单中那个最让人省心、也最值得关注的"甜点级"优选。