游戏硬件实验室:DLSS NIS FSR三大超级采样PK 谁的游戏优化最佳?
随着NVIDIA在2018年9月推出第一代图灵架构RTX系列显卡,正式掀开了光追游戏时代的帷幕,同时为了迎合光追游戏对算力的需求,NVIDIA同时推出了深度学习超极采样技术,即我们现在所熟知的DLSS技术,大幅度降低了光追游戏的显卡门槛,让普通主流玩家也能有机会体验到光追游戏的魅力。
NVIDIA可能也感受到了压力,毕竟RTX 30系列显卡发售一年以来,能买到新显卡的玩家只是少数派,绝大多数游戏玩家依然在使用GTX系列显卡,而GTX系列显卡无法使用DLSS技术,加上近期各家游戏厂商在游戏优化方面明显划水摸鱼,越来越多使用GTX系列显卡的玩家开始感觉力不从心。也是出于对广大仍在使用GTX系列显卡玩家的现状考虑,NVIDIA在最新的显卡驱动和GFE软件中加入了全新的NVIDIA Image Scaling(简称NIS)技术。
原理科普:DLSS与空间缩放有何不同
在我们开始用游戏实测对比之前,为了让大家能大致理解几种游戏画面/性能优化技术之间的区别,这里我们简单介绍一下它们的原理。
NIS,即NVIDIA IMAGE SCALING,它本质上也是一种空间图像缩放技术,跟FSR的基本原理相同。它的基础原理并不复杂:根据输入画面中每个采样像素点的坐标,在输出分辨率的对应坐标中填入该采样的像素值,最终得到这一帧输出的画面。
以上就是空间缩放技术的基本工作流程,叫做“单点采样”。由于采样以及填充的像素值精度不高,输出的画面会出现颜色过渡生硬,物体边缘呈现很不清晰的马赛克。
为进一步提高输出画面的清晰度,单点采样又衍生出多线采样,用采样坐标点周围四个像素值进行加权平均值来填充到输出分辨率的坐标中,加权平均值通过双线性插值的方式计算,得到精确度更高的输出值。同时由于像素坐标是一个浮点坐标,通过浮点计算得来,用一个或许不那么恰当的比喻形容——多线采样也相当于一种提高浮点精度的方式。
多线采样原理示意图
目前无论是显卡驱动还是游戏中的SDK,采用跟空间缩放有关的优化技术都是基于上述原理,所不同的是后续的一些动作。
比如NIS的在进行空间缩放操作之后还加入了Sharpening Algorithm环节来锐化输出的帧画面,尽可能将因缩放而模糊的画面恢复清晰度,同时锐化的程度可以由用户手动调节,以适应不同喜好需求。FSR也有类似的算法,只是不单独开放这一项调节,有时可能锐化过渡,有时不足。
NIS控制界面,原生分辨率为4K,不同级别的优化档位供选择
与FSR不同的是,NIS并不是由游戏厂商在游戏中集成SDK来实现其功能,而是根植于驱动层面。NVIDIA在今日更新的496.70开始支持这项功能,需要通过GFE来调用。就像Shadow play界面一样,可以在游戏画面中用快捷键调出控制面板设置NIS。
由于NIS完全是基于驱动层面的后期处理,意味着无论是玩什么游戏,只要是NVIDIA GeForce 900及以后的显卡产品都支持该功能,因而适用面要比FSR大许多。
如上图所示,渲染分辨率的百分比即相当于FSR的性能、质量等不同优化档位,而锐化可让你手动调整对画质损失的补偿。不过锐化只是一种简单的算法,并不能让缩放渲染后的画面还原到跟原生画质一模一样。
DLSS还是永远的神
天上没有掉下的馅饼,如果仅仅靠降低渲染分辨率的空间缩放就能使画质和帧率兼得,那芯片巨头还要呕心沥血地研发新GPU干嘛。要想让优化后的画质无限趋近于原生,就必须做更多的工作,加入更复杂的算法,这就是NVIDIA花大力气开发DLSS的原因所在。
基础原理还是那个原理:在一定像素范围内,采样的数量越多,输出到大分辨率对应坐标的像素值就越精确。但像素值精确只是机械的理论精确,不代表画面准确,结果是物体边缘马赛克没了,却变的朦胧,如果继续扩大采样范围还会变得更模糊,乃至画面失真。所以光靠这条路是走不通的。
如何加大采样数量又能限制采样范围呢,DLSS在空间采样的基础上增加了一个时间维度——如上图所示,用1080P渲染输出到1440的屏幕上,DLSS会同时采样当前帧和之前几帧的画面,采样的帧画面范围会凭借帧生成时间和像素值的比对由AI判断,确保该帧适合被纳入采样范围,其中要用到张量计算。
假如输出一帧1440p画面要对三帧1080p做采样,代表一共输入了6M以上的像素数据计算最终得到了一个3.5M的1440p画面。而相对简陋的空间缩放技术要得到同样一张画面仅依靠2M左右一帧1080P像素数据。输出质量孰优孰劣,不言自明。
完成这些工作所需的张量计算本质上是大量半精度浮点计算,所以DLSS需要具有强大半精度浮点算力的Tensor核心支持,从而成为RTX系列显卡的专属福利。想要更好的就得付出额外的代价,这是亘古不变的规律。事实上NVIDIA两年前就已经开发出了NIS,当时由于更强大的DLSS即将问世,FSR又尚在娘胎之中,就没有将这项技术开放给用户。
测试平台简介
测试平台简介
微星MEG Z590 ACE战神主板
NZXT Kraken海妖Z73 360mm一体式水冷散热器
NIS vs FSR
虽然NIS和DLSS都属于NVIDIA的技术,但其工作原理完全不同,NIS的本质和FSR类似,都是一种空间分辨率缩放采样技术:根据输入画面中的采样像素点坐标,对周围像素值进行加权平均值计算,获得一个更精确的输出值填充到输出分辨率的坐标中。这和DLSS所采用的时间采样技术完全不同,所以我们首先来看看同为空间分辨率缩放采样技术的NIS和FSR之间有多少差异。
DLSS vs NIS
前面我们已经讲过,NIS和FSR都属于空间分辨率缩放采样技术,而DLSS则是时间分辨率缩放采样技术,简单来讲,DLSS是以当前渲染生成的帧画面为坐标,对已生成的前几帧画面进行采样,档连续多帧数据混合后就相当于对每个像素进行了多次采样,而不需要对每一帧每一个像素进行多线采样,利用AI算法提高输出像素的精确度,进而达到提升游戏帧数的效果。同时由于采样过程属于动态,当画面快速运动时,渲染的准入分辨率采样坐标与输出填充的坐标位移差增大,导致了运动画面模糊的现象。
DLSS vs NIS vs FSR(实测对比视频)
从前2场对比的结果可以看出,DLSS和NIS、FSR对于游戏帧数的提升效果非常接近,但在维持原生画面细节方面,NIS要强于FSR,而DLSS则要比NIS更加出色。
DLSS vs NIS vs FSR游戏效果帧数对比
至此,我们可以肯定的说,在这场光追游戏时代的超极采样技术大战中,DLSS技术以绝对的优势完胜对手FSR和自家小弟NIS。
结语:通过这次对比,我们可以清晰的认识到DLSS技术的优秀,毫无疑问的是目前最好的超极采样技术,借助AI算力能让玩家在最大程度保留原生游戏画面细节的同时,获得更流畅的游戏帧数体验。
这并不意味NIS和FSR毫无可取之处,DLSS技术需要RTX系列显卡独有的Tensor Core核心单元支持才能运行,很大程度上局限了DLSS技术的推广应用,而NIS和FSR作为开源技术,很好的弥补了市场空缺,让那些还没有升级RTX系列显卡的游戏玩家能够有机会流畅游戏最新的游戏大作。
但想要获得最佳游戏体验,我们还是强烈建议大家升级最新的RTX系列显卡,借助DLSS的强大表现来爽快游戏。