張祖強(qiáng)
更多地圖,畫面仍然驚艷
《我的世界》提供全局照明、反射、陰影、大氣特效、透明體反射、折射和散射等多種光線追蹤效果。例如,光線追蹤全局照明可以準(zhǔn)確地為場(chǎng)景中不同表面的一次或多次間接反射所造成的動(dòng)態(tài)間接散射光線建模,并使其與其他光線追蹤效果相互作用;路徑追蹤在每個(gè)世界中都添加了光線追蹤反射效果,能反射每個(gè)細(xì)節(jié)、每個(gè)群體和N P C以及其他每種視覺效果,從而在像素級(jí)別實(shí)現(xiàn)反射效果。目前,《我的世界》中一共擁有多達(dá)15款地圖供玩家體驗(yàn)光線追蹤,下面我們不妨在這些地圖中看看光線追蹤的加持下,《我的世界》究竟能給我們帶來怎樣的視覺享受。
劃重點(diǎn):你得有一張支持光線追蹤的顯卡
想要在《我的世界》中體驗(yàn)光線追蹤的魅力,玩家需要一張支持該技術(shù)的顯卡才行。目前N V I D I AGeForce RTX顯卡和AMD Radeon RX6000系列顯卡均支持光線追蹤,下面我們不妨首先回顧一下上述顯卡在光線追蹤方面的技術(shù)亮點(diǎn)。
NVIDIA GeForce RTX顯卡相關(guān)技術(shù)解析
在NVIDIA GeForce RTX 20系列顯卡的圖靈架構(gòu)上,N V I DI A引入光線追蹤核心(下簡(jiǎn)稱為“R T核心”)。R T核心的主要作用是針對(duì)光線追蹤計(jì)算中最耗費(fèi)時(shí)間的加速邊界體積層次(B V H)遍歷和光線/三角形(基元)交叉測(cè)試(光線投射)過程進(jìn)行加速,將整個(gè)光線追蹤計(jì)算的時(shí)間降低至可接受的范圍內(nèi)。而在NVIDIA GeForce RTX 30系列顯卡的Ampere架構(gòu)上,NVIDIA將其RT核心升級(jí)至第二代。相比第一代RT核心,NVIDIA GeForce RTX 30系列顯卡的第二代RT核心在光線和三角形相交測(cè)試速率和整體G P U光線追蹤速率上均實(shí)現(xiàn)性能翻倍。
除了上述性能提升外,NVIDIA在Ampere架構(gòu)的第二代RT核心中還帶來比較重要的技術(shù)創(chuàng)新,那就是光線追蹤動(dòng)態(tài)模糊加速。動(dòng)態(tài)模糊是一種非常流行且重要的計(jì)算機(jī)圖形效果,可用于電影、游戲和許多不同類型的專業(yè)渲染應(yīng)用程序中。動(dòng)態(tài)模糊的本質(zhì)和膠片攝影相關(guān),因?yàn)槟z片攝影時(shí),圖像不是立即創(chuàng)建的,而是通過將膠片在有限的時(shí)間段內(nèi)曝光來創(chuàng)建的。這意味著目標(biāo)物體在膠片快門時(shí)間內(nèi)的高速移動(dòng)將帶來模糊的曝光效果。對(duì)GPU來說,要?jiǎng)?chuàng)建類似效果,必須模擬相機(jī)和膠片工作流程。動(dòng)態(tài)模糊對(duì)于電影是非常重要的,它能夠避免畫面出現(xiàn)斷續(xù)卡頓的效果,對(duì)游戲來說亦是如此。
為了完成動(dòng)態(tài)模糊下的光線追蹤計(jì)算,N V I DI A加入有關(guān)位置和時(shí)間函數(shù)的計(jì)算,同時(shí)硬件部分還需要新加入有關(guān)時(shí)間位置計(jì)算的單元,最終在Ampere架構(gòu)的第二代RT核心中,NVIDIA實(shí)現(xiàn)了BVH、邊界框計(jì)算、位置(時(shí)間)計(jì)算、三角形相交、命中返回五個(gè)單元的協(xié)同工作,相比之前圖靈架構(gòu)的第一代R T核心,新增內(nèi)插三角形位置單元,進(jìn)一步提升了執(zhí)行效率。
除了率先將支持硬件實(shí)時(shí)光線追蹤渲染的RT核心加入到GPU中,NVIDIA在GPU上的另一個(gè)創(chuàng)舉就是引入張量核心(TensorCore)。在之前的Volta架構(gòu)中,張量核心的引入為AI計(jì)算帶來了極高的效率,這是NVIDIA的第一代張量核心。圖靈架構(gòu)中,NVIDIA又對(duì)張量核心進(jìn)行微調(diào),可以看作是第二代張量核心。目前在Ampere架構(gòu)中啟用的是第三代張量核心。簡(jiǎn)單來說,第三代張量核心主要特點(diǎn)是支持了更多的數(shù)據(jù)格式,大幅度加強(qiáng)了在稀疏矩陣計(jì)算時(shí)的效能,比如在原始矩陣具有稀疏性時(shí),第三代張量核心的速度可達(dá)到第一代伏特架構(gòu)的20倍等。另外,新的第三代張量核心還加入了對(duì)BF16等數(shù)據(jù)格式的支持。
在實(shí)際游戲中,張量核心提供的就是玩家熟悉的NVIDIADLSS功能,而第三代張量核心所提供的就是NVIDIADLSS2.1版本。這項(xiàng)實(shí)時(shí)渲染技術(shù)通過基于AI的超高分辨率來提升性能,這一過程包括渲染更少的像素,然后使用AI構(gòu)建清晰、更高分辨率的圖像,從而以快得多的幀率運(yùn)行。具體到《我的世界》這款游戲里,NVIDIADLSS2.1提供了質(zhì)量、平衡、性能和超性能這4種模式—在1080p下默認(rèn)為質(zhì)量模式,2.5K分辨率下默認(rèn)為平衡模式,4K分辨率下默認(rèn)為性能模式,8K分辨率下默認(rèn)為超性能模式。
AMDRadeonRX6000系列顯卡相關(guān)技術(shù)解析
支持DirectX12Ultimate讓AMDRadeonRX6000系列顯卡實(shí)現(xiàn)對(duì)硬件光線追蹤渲染的支持。在AMDRadeonRX6000系列顯卡使用的RDNA2架構(gòu)上,AMD引入硬件光線追蹤單元(下文簡(jiǎn)稱:RA單元)。AMD目前的消息只是提到為每個(gè)CU單元配備1個(gè)RA單元,性能方面只是宣稱RA單元的光線追蹤交叉性能是傳統(tǒng)軟件執(zhí)行的10倍,更具體的數(shù)據(jù)顯示AMDRadeonRX6000系列顯卡的RDNA2架構(gòu)GPU在微軟DXRSDK的ProceduralGeometry的測(cè)試中帶來了471fps的成績(jī),在軟件模擬下只有34fps,因此前者的性能達(dá)到軟件的13.8倍。
實(shí)際上ProceduralGeometry只是整個(gè)DXRSDK中的一部分,用于測(cè)試地面以上所有對(duì)象在光線追蹤上的性能,其圖元信息包括解析幾何、體積幾何和帶符號(hào)的距離幾何等多重內(nèi)容。因此,AMD在此處給出的性能只是光線追蹤計(jì)算的一部分內(nèi)容,更多的信息還有賴于更多的測(cè)試和實(shí)際游戲內(nèi)容。那么在開啟光線追蹤之后,AMDRadeonRX6000系列顯卡運(yùn)行《我的世界》的表現(xiàn)如何,其性能表現(xiàn)是否能夠比肩NVIDIAGeForceRTX30系列顯卡呢,我們不妨通過實(shí)測(cè)結(jié)果來尋找答案。
《我的世界》光線追蹤性能測(cè)試
我們本次測(cè)試的主要目的,是想看看NVIDIAGeForceRTX30系列顯卡和AMDRadeonRX6000系列顯卡運(yùn)行《我的世界》的性能表現(xiàn)。為此我們特別請(qǐng)到NVIDIAGeForceRTX3090FE和其競(jìng)品AMDRadeonRX6900XT,以及NVIDIAGeForceRTX3070FE和其競(jìng)品AMDRadeonRX6800這4款顯卡參與本次測(cè)試??紤]到NVIDIAGeForceRTX30系列顯卡還支持DLSS2.1技術(shù),所以對(duì)于NVIDIAGeForceRTX30系列顯卡的這兩款參測(cè)顯卡,我們將分別進(jìn)行“光追:開+DLSS:關(guān)”,以及“光追:開+DLSS:開”這兩個(gè)項(xiàng)目的測(cè)試。需要說明的是,《我的世界》中擁有名為“光線追蹤渲染能見度”的選項(xiàng),其設(shè)定值越高,玩家在游戲中開啟光線追蹤后的游戲畫面渲染距離就越遠(yuǎn),玩家能看到的游戲畫面也更加豐富。為了考察《我的世界》對(duì)顯卡性能需求的最大值,我們決定將“光線追蹤渲染能見度”設(shè)為最高,即24個(gè)區(qū)塊。
從測(cè)試成績(jī)我們可以看到,NVIDIAGeForceRTX3090FE和NVIDIAGeForceRTX3070FE運(yùn)行《我的世界》的性能表現(xiàn)非常亮眼。例如在1080p分辨率和打開光線追蹤設(shè)定下,不開啟DLSS時(shí)NVIDIAGeForceRTX3090FE運(yùn)行這款游戲的平均幀率約為134fps。作為NVIDIAGeForceRTX3090FE的競(jìng)品,AMDRadeonRX6900XT的表現(xiàn)就有些不如人意—這款顯卡在1080p分辨率下運(yùn)行《我的世界》的平均幀率僅有58fps。不僅如此,即使將分辨率提升至2.5K,NVIDIAGeForceRTX3090FE和NVIDIAGeForceRTX3070FE運(yùn)行《我的世界》的平均幀率也分別達(dá)到83fps和51fps,它們的測(cè)試成績(jī)也都大幅領(lǐng)先各自的競(jìng)品。
下面我們特別關(guān)注一下DLSS技術(shù)帶來的幀率提升。首先在1080p分辨率下,DLSS給NVIDIAGeForceRTX3090FE帶來約34%的性能提升。當(dāng)分辨率提升至2.5K并開啟DLSS之后,NVIDIAGeForceRTX3090FE運(yùn)行《我的世界》的平均幀率逼近關(guān)閉DLSS時(shí)的兩倍。將分辨率進(jìn)一步提升至4K之后,這款顯卡運(yùn)行《我的世界》的平均幀率更是達(dá)到109fps,是關(guān)閉DLSS時(shí)的2.7倍。反觀AMDRadeonRX6900XT,這款顯卡在4K分辨率下運(yùn)行《我的世界》的平均幀率僅為16fps,距離30fps的基本流暢水平也相去甚遠(yuǎn)。值得一提的是,NVIDIADLSS2.1在提升游戲幀率的同時(shí)還保證了出色的游戲畫質(zhì)。例如在平衡和性能模式下,《我的世界》的游戲畫面相比關(guān)閉DLSS時(shí)的游戲畫面在細(xì)節(jié)上幾乎沒有明顯差距。
玩光追,有NVIDIAGeForceRTX30系顯卡才暢快
正如我們預(yù)料的那樣,《我的世界》Windows10正式版仍然提供了令人驚艷的光追效果,各種反射、陰影和全局光照等效果給讓《我的世界》的游戲畫面得到蛻變,同時(shí)也讓玩家的游戲體驗(yàn)得到質(zhì)的飛躍。不僅如此,光線追蹤的加持還讓《我的世界》中眾多物體表面的細(xì)節(jié)紋理更為逼真,對(duì)于這款像素游戲來說,這是非常難能可貴的。
從我們的測(cè)試成績(jī)也可以看出,參與本次測(cè)試的這兩款NVIDIAGeForceRTX30系顯卡在運(yùn)行這款游戲時(shí)的平均幀率非常亮眼,并且將AMD的兩款參測(cè)顯卡遠(yuǎn)遠(yuǎn)甩在身后。更加喜人的是,DLSS的加持還讓這兩款NVIDIAGeForceRTX30系顯卡運(yùn)行《我的世界》的平均幀率大幅提升,并且游戲畫面也更加流暢,而沒有DLSS加持的RX6900XT和RX6800就完全不是前者的對(duì)手。因此我們認(rèn)為,對(duì)于那些想要在《我的世界》中享受暢快光追體驗(yàn)的玩家來說,NVIDIAGeForceRTX30系顯卡更值得入手。