知行
如今的GPU設(shè)計都會擁有一定的伸縮性,其實就是可以靈活地屏蔽或削減部分單元來提供不同定位的產(chǎn)品。從芯片的內(nèi)部規(guī)劃圖上看,RX 6900 XT就是一個典型的“完整”芯片,80個核心單元對稱整齊地塞滿了整個芯片(圖1)。
然而RTX 3090有一些不同,它的核心單元數(shù)量比較奇怪,而且無論是7個GPC(圖形處理簇)還是4個16組核心單元的GPC+3個12組核心單元的組合(圖2),都顯然說明它并不是一個完整的安培(Ampere)核心。沒錯,英偉達基于安培核心設(shè)計的最完整芯片其實是代號為GA100的專業(yè)芯片A100(圖3),不過這種芯片是用于AI處理等專業(yè)設(shè)備的,需要非??鋸埖纳岬扰渲茫▓D4)。
如果僅以消費級產(chǎn)品而言,RTX 3090的GA102芯片其實已經(jīng)是可用的極限,350W的全卡功耗相當于很多入門級甚至主流電腦的整機功耗。而定位更低的RTX3080等產(chǎn)品也是在RTX 3090核心的基礎(chǔ)上進行的簡化,所以它同樣可以算是一種全規(guī)格的產(chǎn)品。
那么,它們的實際性能究竟如何呢?我們以酷睿i9-10900K處理器搭配技嘉Z490 AORUS Master主板、安裝16GB×2的DDR4 3600內(nèi)存、技嘉AORUS Gen4固態(tài)硬盤組成測試平臺,安裝64位Windows 10 20H2版操作系統(tǒng)及最新驅(qū)動程序進行測試。
從游戲幀速上看,基于兩款旗艦級GPU的公版顯卡相對于自家次旗艦級型號的實際提升均為10%左右,也確實是相鄰檔次顯卡應(yīng)有的差距。同時兩者間的幀速差距總量則在5%以內(nèi),基本可以說是同檔次產(chǎn)品。但這還不是全部,如果考慮到它們其他方面的規(guī)劃與表現(xiàn),就會看到這兩款旗艦版產(chǎn)品的巨大差距。
其實從規(guī)格上看,RTX 3090的CU DA處理器數(shù)量比RTX 3080多20%,頻率則略低一些,因此實際計算能力提升不足20%,如果考慮到顯存帶寬提升幅度為23%,那么可以認為理論綜合性能提升在20%左右,受到其他配件能力等方面的限制,在實際測試中,它的游戲性能提升為10%左右也是正常。但它的價格卻出現(xiàn)了嚴重的扭曲,RTX 3090的官方起價是RTX 3080的兩倍以上(圖5),這是為什么呢?答案也許就在兩者間差距巨大的顯存上。
從規(guī)格表中可以看到,RTX 3090的顯存性能相對于RTX 3080并沒有特別明顯的提升,但容量從10GB直接跳到了24GB,最多20%的理論性能提升需要搭配這么大的顯存嗎?雖然RTX 3090的一大特色是更適合8K游戲,但相對于它在8K游戲中的表現(xiàn)和游戲?qū)嶋H需求,24GB顯存顯然還是有點夸張。好在我們從另一方面的測試中發(fā)現(xiàn)了它的實際意義,那就是專業(yè)設(shè)計性能。
在之前的顯卡產(chǎn)品中,我們經(jīng)常會強調(diào)專業(yè)級顯卡和游戲顯卡有著鮮明的分野,但隨著英偉達在官網(wǎng)上直接提供了專業(yè)版STUDIO驅(qū)動(圖6)。RTX系列顯卡就可以無需任何硬件變化,直接以經(jīng)過優(yōu)化的處理能力運行多種專業(yè)軟件了,而在RTX 3090上,其專業(yè)應(yīng)用的性能優(yōu)勢尤其明顯。
在很多專業(yè)軟件中,借助偏專業(yè)應(yīng)用的設(shè)計如超大顯存等,RTX 3090的專業(yè)應(yīng)用1生能遠超RTX 3080。例如Octane Render渲染測試中,RTX 3090的渲染時間僅需42秒,而RTX 3080需要575秒,這種差距的最大來源就是因為RTX 3090的顯存可以輕松容納14GB的渲染數(shù)據(jù),而RTX 3080的10GB顯存則需要應(yīng)對其他的需求,所以僅能提供8.7GB容量來容納測試數(shù)據(jù),需要與內(nèi)存進行頻繁的低效數(shù)據(jù)交換。
即使只是進行比較常見的4K視頻處理、RAW圖形處理等操作,對顯存的消耗量也是相當驚人的,不要說傳統(tǒng)的8GB顯存,就算RTX 3080的10GB顯存也有點頂不?。▓D7),3090的24GB顯存顯然就會寬松許多。
除此之外,RTX 3090還擁有RTX 30系列中唯一的SU連接能力(圖8),考慮到此前的SLI技術(shù)在各代產(chǎn)品上的配置路線,英偉達顯然是將這一功能逐漸轉(zhuǎn)向了更容易兼容和優(yōu)化的專業(yè)應(yīng)用,而不是需要更麻煩的適配,且特別依賴于游戲開發(fā)商能力的游戲應(yīng)用。
而隨著RTX 3090被很多廠商吃透,出現(xiàn)了大量采用渦輪風扇散熱方式的專業(yè)級產(chǎn)品(圖9),使厚度大幅縮減,不再占用其他PCIe顯卡插槽,同時將散熱氣流從I/O接口面板吹出而不是留在機箱內(nèi)。其實這種設(shè)計就是與SLI連接能力呼應(yīng)的,可以用高成本、高噪聲為代價,實現(xiàn)多顯卡并聯(lián),以提供盡量高的專業(yè)性能。
既然有專業(yè)處理能力的考慮,那么RTX3090的價格肯定就水漲船高了'畢竟設(shè)計能力是可以賺錢的,生產(chǎn)工具的定價肯定和游戲顯卡這種消費產(chǎn)品不同。所以筆者并不建議只考慮游戲性能的玩家上RTX 3090,如果希望在4K分辨率下的獲得更高的幀速或嘗試8K分辨率,我們還可以期待另一款產(chǎn)品——20GB顯存的RTX 3080 Ti(圖10)。
在前文的測試對比中,我們看到RX 6900 XT確實有和RTX 3090一戰(zhàn)的游戲?qū)嵙Γ贿^總體性能還是稍微差一點,特別是在4K分辨率下,看來128MB的內(nèi)置緩存也彌補不了顯存總量和顯存帶寬的差距。雖然考慮到官方起價僅有7999元,其性價比仍然是遠超RTX 3090的,但它的實際能力還遠不止與此。
要知道在對比測試中,考慮到公平性以及測試平臺的問題,并沒有開啟AMD RX6000系列的Smart Access Memory功能,更沒有考慮超頻能力。實際上,即使在Z490主板上開啟Smart Access Memory(在測試使用的技嘉主板上名稱為Resizable Base-Address Register,BIOS選項為Re-Size BAR Support)(圖11),參加測試的游戲總幀速也大都有2%~3%的提升,這已經(jīng)使其游戲幀速接近RTX 3090。
此外在AMD的新版驅(qū)動中還提供了更強的頻率設(shè)置功能(圖12),包括降壓超頻、顯存超頻等功能,據(jù)稱可以在默認的300W功率限制下將頻率提升至2.7GHz甚至更高,游戲幀速也相應(yīng)提升10%以上,這樣幾乎可以在所有分辨率下反超RTX 3090。當然,有些用戶可能表示RTX 3090也不是不能超頻,不過限于其較高的功耗設(shè)定以及廠商的設(shè)計,實際超頻要難得多,超頻幅度一般也小得多。
這樣看來,RX 6900 XT真是個挺有趣的顯卡,正常狀態(tài)下雖不足以問鼎最強顯卡,但以性價比取勝。不過在經(jīng)驗豐富的DIYer手中,幾項特技齊上陣后,它的性能又真的能超越RTX 3090,堪稱目前最強的游戲顯卡。
RTX 3090與RX 6900 XT這兩款目前最強的新一代旗艦GPU各有所長,而且與之前的產(chǎn)品的相比都是完全沒有對手的存在,無論是游戲性能還是專業(yè)性能都再次突破了極限,為用戶提供了遠超以往的能力,在資金足夠的情況下,其實都是相當值得的選擇。