一直以來(lái),英偉達(dá)和AMD旗艦級(jí)顯示卡的龍爭(zhēng)虎斗都會(huì)成為消費(fèi)者討論的焦點(diǎn),本期CHIP就為大家?guī)?lái)兩家最新的旗艦級(jí)顯示卡產(chǎn)品的對(duì)比測(cè)試,為追求極致的發(fā)燒級(jí)玩家們提供參考。
去年,英偉達(dá)采用GK104核心的GeForce GTX 680和單卡雙芯產(chǎn)品GeForce GTX 690凸顯了其小核心戰(zhàn)略的成功,原以為英偉達(dá)GeForce GTX 690順利拿下單卡卡皇的寶座之后,下一代旗艦產(chǎn)品應(yīng)該是GPU架構(gòu)更新?lián)Q代的小核心產(chǎn)品。但是考慮到這一代產(chǎn)品在性能尚不能完全甩開對(duì)手,因此英偉達(dá)在公司成立20周年之際,高調(diào)推出了由超級(jí)計(jì)算機(jī)領(lǐng)域直接“搬運(yùn)”到桌面領(lǐng)域的GeForce GTX Titan這一超大核心的產(chǎn)品。這款產(chǎn)品一經(jīng)推出便顛覆了高端顯示卡市場(chǎng)Radeon HD 7970與GeForce GTX 680相對(duì)平衡的現(xiàn)狀,一躍成為了目前性能最強(qiáng)的單芯旗艦產(chǎn)品,再加上之前就已存在的GeForce GTX 690,一時(shí)之間,骨灰級(jí)玩家在談及旗艦級(jí)顯示卡時(shí)廠商似乎只有N卡可選擇。面對(duì)如此的狀況,AMD自然不會(huì)坐以待斃,在Radeon HD 7970發(fā)布了一年多之后,AMD終于在4月下旬正式推出了官方版的單卡雙芯產(chǎn)品Radeon HD 7990,它的誕生意味著AMD將停止目前在頂級(jí)顯示卡市場(chǎng)碌碌無(wú)為的現(xiàn)狀,重新披掛上陣征戰(zhàn)旗艦級(jí)顯示卡市場(chǎng)。
硬件規(guī)格:再創(chuàng)新高
英偉達(dá)GeForce GTX Titan采用的GK110核心架構(gòu)與目前的GeForce GTX 680所采用的GK104核心很相似,如SMX單元包含192個(gè)CUDA核心和16個(gè)紋理單元,但是執(zhí)行DP雙精度的運(yùn)算單元增加到了64個(gè)(GK104只有8個(gè))。GK104具有35億個(gè)晶體管、8組SMX單元、4組ROP管線及4組GDDR5控制器,而GK110完整版具有驚人的15組SMX單元、6組ROP管線以及6組GDDR5顯存控制器,于是晶體管數(shù)量達(dá)到了71億個(gè),規(guī)模相比GK104幾乎翻了一番。GeForce GTX Titan只使用了GK110核心15組SMX中的14組,不過保留了完整的6組GDDR5顯存控制器和ROPs管線,于是它總計(jì)有2 688個(gè)CUDA核心、896個(gè)DP CUDA核心、224個(gè)紋理單元、384bit顯存位寬、6GB顯存容量和48組ROPs單元。頻率方面,由于GeForce GTX Titan有如此巨大的核心規(guī)模,所以它的核心頻率顯然不可能像GeForce GTX 680那樣輕松突破1GHz,其基礎(chǔ)頻率只有837MHz,Turbo頻率為876MHz,比GeForce GTX 680的1 006MHz/1 058MHz(Turbo頻率)低了不少,不過顯存頻率依然保留了GeForce GTX 680的水準(zhǔn)為6 008MHz,顯存帶寬高達(dá)288.33GB/s。
AMD的Radeon HD 7990采用的兩顆核心與Radeon HD 7970所采用的Tahiti XT相同,單顆Tahiti XT核心具有2048個(gè)流處理單元、128個(gè)紋理單元及32個(gè)光柵單元,晶體管數(shù)量達(dá)到了43.1億個(gè),并配備了3GB/384bit規(guī)格的GDDR5顯存。于是Radeon HD 7990具有4 096個(gè)流處理器、256個(gè)紋理單元和64個(gè)光柵單元,晶體管數(shù)量也達(dá)到了86.2億個(gè)。物理顯存容量雖然翻倍,但是由于雙卡同時(shí)渲染工作的原因,實(shí)際使用時(shí)等效顯存容量不變,依然為3GB。頻率方面,Radeon HD7990的默認(rèn)核心/顯存頻率為1000MHz/6000MHz,顯存帶寬為288GB/s,與對(duì)手基本持平。
架構(gòu)設(shè)計(jì):各有特色
英偉達(dá)的GeForce GTX Titan之所以被命名為Titan,多半是因?yàn)橛ミ_(dá)對(duì)于目前世界上最快的超級(jí)計(jì)算機(jī)“Titan”的紀(jì)念。超級(jí)計(jì)算機(jī)“Titan”所采用的是目前世界上最快的專業(yè)級(jí)顯示卡Tesla K20X,兩者采用的都是同為2 688個(gè)CUDA核心的NVIDIA Kepler GK110核心,不同的只是兩者的細(xì)節(jié)之處與面向的領(lǐng)域。
GeForce GTX Titan采用的GK110核心仍舊基于Kepler架構(gòu),從某種意義上來(lái)說(shuō),它并不能算是一款“革新”的產(chǎn)品。不過,雖然GK110核心與GTX680所采用的GK104核心同屬Kepler架構(gòu)范疇,但其相對(duì)后者GK110依然擁有不少的改變。從GK110核心SMX邏輯結(jié)構(gòu)圖中我們可以得知,雖然它與GK104的SMX具有相同的結(jié)構(gòu)、相同的192個(gè)CUDA Core和相同的16個(gè)紋理單元,但是在CUDA Core的旁邊,我們可以看到新加入了許多DP Unit單元,即Double Precision Float Unit,意為雙精度浮點(diǎn)單元。一組SMX中就包含64個(gè)DP Unit,14組共包含896個(gè)。英偉達(dá)在GK110核心中加入如此之多的雙精度浮點(diǎn)單元,目的就是為大幅增強(qiáng)GK110的雙精度浮點(diǎn)運(yùn)算能力以滿足和對(duì)手競(jìng)爭(zhēng)的需求。
雖然AMD的Radeon HD 7990使用的依然是AMD在一年多以前發(fā)布的Tahiti核心,但是現(xiàn)在看來(lái)它所使用的GCN架構(gòu)依然非常先進(jìn)。在GCN陣列微觀結(jié)構(gòu)中,每個(gè)GCN陣列里有4組SIMD單元,每組SIMD單元里面包括16個(gè)流處理器,我們可以發(fā)現(xiàn)GCN架構(gòu)已經(jīng)完全拋棄了此前4D+1D流處理器VLIW的超長(zhǎng)指令架構(gòu)限制,不存在原有架構(gòu)指令打包-派發(fā)-解包的問題,所有流處理器以16個(gè)為一組的SIMD陣列完成指令調(diào)度。雖然每次只能執(zhí)行1個(gè)ALU操作,但是4組SIMD能保證執(zhí)行4條線程,利用率接近100%。整個(gè)架構(gòu)從最基層開始就為更靈活地運(yùn)算優(yōu)化,架構(gòu)中層的運(yùn)算單元在并行效率上也有針對(duì)性地改進(jìn),整個(gè)GCN架構(gòu)更加面向“通用計(jì)算就是圖形計(jì)算”的未來(lái)趨勢(shì)。
技術(shù)比拼
英偉達(dá)在GeForce GTX 680發(fā)布時(shí)引入了一種新的GPU動(dòng)態(tài)超頻技術(shù)——GPU Boost,與CPU處理器中的Turbo Boost動(dòng)態(tài)加速類似,都是在處理器允許的范圍內(nèi)動(dòng)態(tài)調(diào)節(jié)核心頻率。在GeForce GTX Titan顯示卡中,GPU Boost加速技術(shù)也升級(jí)到了第二代。GPU Boost 2.0放寬了電壓的限制,在GPU溫度控制上考慮了更多,因?yàn)橄啾雀唠妷簬?lái)的危害,日常應(yīng)用中GPU長(zhǎng)時(shí)間處于高溫狀態(tài)更可能會(huì)損壞芯片。本次測(cè)試中GeForce GTX Titan公版顯示卡的Boost頻率能達(dá)到995MHz,相比默認(rèn)的837MHz提升了18.6%,比上一代公版GeForce GTX 680常見的10%要高一些,可以帶來(lái)更多的性能提升。
除此之外,GeForce GTX Titan還具有英偉達(dá)獨(dú)有的TXAA技術(shù),這是一大殺手锏。該技術(shù)類似在動(dòng)畫、電影、游戲CG中所采用的復(fù)雜高畫質(zhì)過濾器,可以減少因?yàn)殇忼X導(dǎo)致畫面出現(xiàn)撕裂和閃動(dòng)等問題,畫質(zhì)比MSAA、FXAA以及CSAA更高,而且消耗資源較少。
AMD方面,在畫面渲染也有獨(dú)到的優(yōu)勢(shì)。一直以來(lái),人類頭發(fā)在游戲中的實(shí)時(shí)精確渲染是游戲里最為復(fù)雜、最具挑戰(zhàn)性的項(xiàng)目,成千上萬(wàn)、各自獨(dú)立的微小細(xì)絲都是半透明的,而且都有復(fù)雜的陰影,這對(duì)GPU來(lái)說(shuō)是非常巨大的負(fù)擔(dān)。而Radeon HD 7990采用的TressFX Hair渲染技術(shù),使用了DirectCompute編程語(yǔ)言,結(jié)合AMD GCN架構(gòu)的強(qiáng)大并行計(jì)算能力,將頭發(fā)渲染的工作部分轉(zhuǎn)到了后期處理中。這不僅大大提高了運(yùn)算效率,還讓重力、風(fēng)雨、頭部運(yùn)動(dòng)等因素都被列入考慮的范圍智能,因此能以更真實(shí)的方式描繪頭發(fā),讓頭發(fā)更加自然和逼真。
除此之外,Radeon HD 7990集成了兩個(gè)Tahiti XT核心,通過重新設(shè)計(jì)的4個(gè)Mini Display Port+1個(gè)DVI的輸出接口,它原生即可支持5連屏的EYEFINITY應(yīng)用。此外,Radeon HD 7990也繼承了Radeon HD 7970的智能核心休眠技術(shù)ZeroCorePower,顯示卡在空閑時(shí)可讓一顆核心處于休眠狀態(tài),最大限度地降低顯示卡功耗、發(fā)熱和噪音。
性能、功耗互有勝負(fù)
無(wú)論兩款產(chǎn)品的設(shè)計(jì)和采用的技術(shù)如何,對(duì)于游戲玩家來(lái)說(shuō)顯示卡的性能表現(xiàn)才是最重要的。在分別測(cè)試顯示卡理論DirectX 11圖形性能和曲面細(xì)分性能的3DMark 11和Unigine Heaven Benchmark 4.0測(cè)試中,Radeon HD 7990均取得了不錯(cuò)的成績(jī),以較明顯的優(yōu)勢(shì)取得領(lǐng)先。在隨后的多款不同分辨率設(shè)置的熱門游戲測(cè)試中,Radeon HD 7990單卡雙芯的劣勢(shì)逐漸顯露出來(lái),在《刺客的信條3》、《上古卷軸5》中的成績(jī)明顯反常,想要在性能方面完勝對(duì)手,AMD在驅(qū)動(dòng)方面還需要下不少功夫。不過整體看來(lái),在游戲性能這一環(huán)節(jié),Radeon HD 7990還是略勝一籌。
在顯示卡高負(fù)載功耗測(cè)試中,由于如今的高端顯示卡均具備了功耗保護(hù)功能,在使用Furmark等嚴(yán)酷的烤機(jī)軟件進(jìn)行測(cè)試時(shí),顯示卡會(huì)自動(dòng)降低頻率來(lái)保護(hù)自己不會(huì)損壞。這導(dǎo)致我們無(wú)法通過常用烤機(jī)軟件來(lái)得到其準(zhǔn)確的最大功耗,所以我們選擇了用3DMark 11測(cè)試程序來(lái)測(cè)試整個(gè)平臺(tái)的整體功耗(不含顯示器)。在待機(jī)功耗方面,GeForce GTX Titan所在的平臺(tái)整體待機(jī)功耗僅為68W,Radeon HD 7990的平臺(tái)整機(jī)功耗略高,為91W。高負(fù)載狀態(tài)下GeForce GTX Titan平臺(tái)的最高功耗為380W,相比之下雙芯的Radeon HD 7990平臺(tái)最高功耗為460W。因此在功耗表現(xiàn)方面,GeForce GTX Titan完勝。
總結(jié):
通過此次旗艦級(jí)產(chǎn)品的碰撞,AMD又一次通過“1+1>2”的方式取得了勝利,重新奪回了單卡旗艦的寶座。雖然兩者在零售價(jià)格方面都是7 999元,不過采用單芯設(shè)計(jì)的GeForce GTX Titan在成本方面有著明顯的優(yōu)勢(shì),AMD為了奪回這個(gè)寶座可謂殺敵一千自損八百。
作為兩家顯示卡廠商在旗艦級(jí)產(chǎn)品上的扛鼎之作,在性能方面,兩款產(chǎn)品可謂誠(chéng)意十足,幾乎所有的游戲在2560×1440分辨率的高畫質(zhì)設(shè)置下都可以流暢運(yùn)行。雖然兩者在性能方面有些差距,但是并不十分明顯,不過AMD向來(lái)在后續(xù)驅(qū)動(dòng)優(yōu)化方面表現(xiàn)非常不錯(cuò),因此Radeon HD 7990在性能方面還有不少優(yōu)化的余地。從目前的信息看來(lái),英偉達(dá)的下一代旗艦GeForce GTX 780的性能并不如目前的GeForce GTX Titan,AMD自家的Radeon HD 8000系列顯示卡上市也仍需時(shí)日,因此Radeon HD 7990自然是當(dāng)今追求極致性能玩家的不二之選。