NVIDIA產(chǎn)品在2011年的表現(xiàn)可謂順風(fēng)順?biāo)?,無論在桌面還是移動(dòng)平臺(tái)上,市場份額、營收、利潤等都有比較不錯(cuò)的表現(xiàn)。不過在2011年底,AMD搶先發(fā)布的Radeon HD 7970似乎給NVIDIA當(dāng)頭一棒,搶走了不少風(fēng)頭。經(jīng)過大約3個(gè)月的蟄伏后,NVIDIA也終于開啟了自己的28nm時(shí)代,全新開普勒架構(gòu)正式發(fā)布,NVIDIA帶給了用戶一款功耗更低、晶體管更少、核心更小、功能更多、性能更強(qiáng)大的產(chǎn)品——GeForce GTX 680。
提升性能功耗比——開普勒家族首次出擊
開普勒架構(gòu)代號(hào)早在2010年就已經(jīng)曝光,但發(fā)布之前外界對(duì)這款架構(gòu)的各種參數(shù)基本上一無所知。從實(shí)際發(fā)布的情況來看,開普勒相對(duì)之前的Fermi(費(fèi)米)架構(gòu)做出了極大的改進(jìn)。費(fèi)米架構(gòu)在DirectX 11的支持以及通用計(jì)算性能、包括雙精度性能方面擁有相當(dāng)優(yōu)秀的表現(xiàn)。但是費(fèi)米架構(gòu)的缺點(diǎn)也比較明顯,那就是每瓦特性能不高,功耗較大,這在實(shí)際產(chǎn)品中表現(xiàn)也比較明顯,大部分N卡的功耗都會(huì)比同檔次的A卡高出不少,性能功耗比甚至只有對(duì)手的70%。
因此,NVIDIA在開普勒架構(gòu)上的重點(diǎn)在于提升性能功耗比,NVIDIA表示,開普勒的每瓦特雙精度浮點(diǎn)性能將比前代產(chǎn)品提升2倍左右。為了達(dá)到這個(gè)目標(biāo),NVIDIA重新設(shè)計(jì)了開普勒的架構(gòu),在內(nèi)部CUDA核心上作出徹底的重制,放棄了之前的SM核心,改為全新設(shè)計(jì)的SMX核心。
SM核心是之前的費(fèi)米架構(gòu)產(chǎn)品的基本結(jié)構(gòu)。一個(gè)SM結(jié)構(gòu)基本囊括了GPU中主要的功能,是NVIDIA設(shè)計(jì)GPU的最小功能模塊。在確定了SM結(jié)構(gòu)后,NVIDIA就可以分別開啟或者關(guān)閉、添加或者刪除SM模塊來獲得不同性能檔次的產(chǎn)品。在開普勒架構(gòu)中,SM升級(jí)到了SMX,但是基本結(jié)構(gòu)依舊沒有變化。比如GK104中有8個(gè)SMX,與此相對(duì)的是GF114中也有8個(gè)SM。但是SMX中CUDA Core的數(shù)量大幅度增加,之前的GF114每個(gè)SM中只有48個(gè)CUDA Core,但是新的SMX大幅度增加到了192個(gè),數(shù)量是前代產(chǎn)品的4倍。
目前NVIDIA沒有具體說明新的CUDA Core內(nèi)部結(jié)構(gòu)如何,但是從各種消息來看,新的CUDA Core應(yīng)該完全不同于過去。傳統(tǒng)的CUDA Core中每一個(gè)都擁有完整的FPU和ALU,也擁有相應(yīng)的指令分派設(shè)計(jì),新的CUDA Core應(yīng)該很難在晶體管規(guī)模增長有限的情況下做到大幅度提升CUDA Core數(shù)量的設(shè)計(jì),因此肯定內(nèi)部做出了大幅度精簡設(shè)計(jì)并增加了計(jì)算單元的規(guī)模。
除此之外,僅從架構(gòu)圖來看,開普勒在宏觀架構(gòu)上相比費(fèi)米沒有做出太大幅度的改善。不過從G80開始直到到GT200,然后到費(fèi)米,NVIDIA的宏觀架構(gòu)層面已經(jīng)相當(dāng)優(yōu)秀,開普勒予以沿用也是正常的。
目前開普勒家族只有一款產(chǎn)品,也就是GeForce GTX680。這款顯卡擁有1536個(gè)CUDA核心,GPU基準(zhǔn)頻率為1006MHz,Boost頻率平均值為1058MHz(最大達(dá)到1200MHz)。GeForce GTX680的使用GK104芯片,擁有35億晶體管,核心面積294平方毫米,浮點(diǎn)運(yùn)算能力為3.09TFLOPS。顯存方面,顯存位寬256bit,頻率高達(dá)6008MHz,顯存容量則維持比較傳統(tǒng)的2GB。TDP滿載功耗最高只有195W,供電使用6+6pin接口。外接方面,這款顯卡支持三屏輸出,單卡可以支持三屏幕同時(shí)顯示,也支持3D Vision Surround技術(shù),也算是NVIDIA對(duì)AMD的Eyefinity的正式回?fù)簟?/p>
自動(dòng)頻率調(diào)節(jié)是亮點(diǎn)——GPU性能發(fā)展新方向
傳統(tǒng)的GPU頻率除了分為2D、3D、視頻播放等頻率外,在最高頻率上一般是固定的。也就是說頻率無法自動(dòng)調(diào)整上限。實(shí)際上GPU在運(yùn)行的過程中,很難達(dá)到TDP上限。GPU作為一顆龐大的芯片,內(nèi)部并非時(shí)時(shí)刻刻所有部件都處于滿載狀態(tài),因此在實(shí)際游戲運(yùn)行中,GPU本身熱量功耗要比TDP值低不少。在這種情況下可以考慮略微提升GPU頻率來獲得更強(qiáng)性能同時(shí)又不會(huì)超出TDP上限。
這就是開普勒上GPU Boost技術(shù)的原理。根據(jù)NVIDA說明,開普勒GPU存在基礎(chǔ)頻率和Boost頻率兩種。其中GeForce GTX680的基礎(chǔ)頻率為1006MHz,Boost頻率不定,但是基本都會(huì)在1058MHz附近浮動(dòng)。實(shí)際上在運(yùn)行中GeForce GTX680的頻率也會(huì)超出1058MHz不少,甚至達(dá)到1200MHz。目前開普勒的GPU Boost屬于第一代智能頻率調(diào)節(jié)技術(shù),性能和頻率調(diào)節(jié)幅度并不大。不過意義非常明顯,自動(dòng)調(diào)節(jié)頻率屬于有效使用能源的一種方法,在控制功耗范圍內(nèi)給用戶更好的效能。
全新的垂直同步和抗鋸齒技術(shù)
垂直同步技術(shù)用于保證畫面穩(wěn)定性,降低畫面撕裂非常有效。不過垂直同步技術(shù)在使用時(shí)也存在一定缺陷,這就是在游戲幀數(shù)低于60幀時(shí),會(huì)發(fā)生圖像頓挫等現(xiàn)象。NVIDIA開發(fā)了新的自適應(yīng)垂直同步技術(shù),在圖像幀數(shù)低于60幀和高于60幀時(shí),讓幀數(shù)變動(dòng)不會(huì)大起大落,而是平滑流暢。此外,NVIDIA還添加了30幀作為“半垂直同步”,在一些要求不高的RTS、MMPRPG游戲中,30幀不但可以保證畫面流暢穩(wěn)定,還能在一定程度上節(jié)約能耗。
此外,NVIDIA又給出了全新的TXAA技術(shù),號(hào)稱能在2XMSAA的資源消耗下,達(dá)到8XMSAA的效果,或者在4XMSAA的資源消耗下遠(yuǎn)超8XMSAA的效能。全新的TXAA很快會(huì)在大量新的游戲引擎和大作中施展拳腳。
性能和功耗雙驚喜——GeForce GTX 680輕取AMD
根據(jù)NVIDIA官方資料和部分實(shí)測,GeForce GTX680在1080p分辨率下相比AMD Radeon HD7970有大約10%~15%的性能領(lǐng)先幅度,部分游戲中甚至?xí)^30%,當(dāng)分辨率進(jìn)一步提高到2560×1600后,GeForce GTX680依舊保持10%左右的領(lǐng)先。總的來看,GeForce GTX680非常優(yōu)秀地完成了自己的任務(wù),對(duì)AMD的新品形成了有力阻擊。和性能提升不同的是,GeForce GTX680在功耗控制方面令人驚訝。整機(jī)滿載功耗比使用Radeon HD7970的產(chǎn)品還要低10~20W,在溫度方面表現(xiàn)雖然沒有特別的亮點(diǎn),但公版噪音控制極好,除了滿載時(shí)略微有一些風(fēng)聲外,基本不存在噪音吵人的問題。
NVIDIA的野望
沒錯(cuò),這顆芯片擁有太多令人驚喜的地方,強(qiáng)大的性能、GPU頻率自動(dòng)調(diào)節(jié)、較低的功耗、超高的能耗比表現(xiàn)、特色的TXAA以及自適應(yīng)垂直同步等,都是顯卡發(fā)展上的新里程碑。不過這并不是終點(diǎn),GK104是一顆定位于游戲玩家和主流市場的產(chǎn)品,它的雙精度浮點(diǎn)性能等還不夠令用戶特別是專業(yè)用戶滿意。因此NVIDIA還將繼續(xù)推出GK110,這顆巨無霸的芯片在幕后已經(jīng)開始摩拳擦掌,隨時(shí)可能出現(xiàn),然后給市場更強(qiáng)烈的震動(dòng)。