作為Maxwell GPU的先鋒軍,由于工藝的限制,GeForce GTX 750 Ti和GTX 750并沒有使用20nm的工藝打造,而是較為保守的使用了成熟的28nm工藝。而在架構方面,全新的Maxwell架構經過了全新的設計,計算單元組織方式進化為SMM(Sreaming Multiprocessors Maxwell),降低了SM尺寸,提高了SM數量及調度邏輯單元數量,主打每瓦特性能。
Maxwell架構首發(fā)的兩個型號產品GeForce GTX 750 Ti和GeForce GTX 750均使用了新的GM107核心。這次新核心產品的發(fā)布與之前略有不同,一方面是受20nm工藝拖累,首發(fā)的GM107是一顆偏低端的核心,一改之前首發(fā)旗艦級核心的做法。另一方面,這兩張新架構、新核心的顯示卡也沒有使用全新的產品序列,仍然和Kepler架構產品一起使用GeForce GTX 700系列的命名,這次英偉達的做法相比之前經常舊瓶裝新酒的做法可謂非常厚道。
GeForce GTX 750 Ti和GeForce GTX 750均基于Maxwell架構中低端的GM107核心,其中前者使用的是全規(guī)格的核心,擁有640個CUDA處理器,可搭配1GB或2GB的128bit GDDR5顯存,預設頻率1020~1085/5400MHz,官方TDP僅60W;而后者屏蔽了一組SMM,擁有512個CUDA處理器,搭配1GB 128bit GDDR5顯存,預設頻率1020~1085/5000MHz,官方TDP僅55W。為了凸顯低功耗特性,GeForce GTX 750 Ti和GeForce GTX 750公版顯示卡都僅使用了5.75英寸、單槽位的身型,并且更都采用無外接供電設計。
根據英偉達的說明,GeForce GTX 750 Ti和GeForce GTX 750兩款新品上市(參考售價999元和799元)后,將會取代GeForce GTX 650 Ti的地位,下承GeForce GTX 650,上接GeForce GTX 660(GeForce GTX 650 Ti Boost將逐漸退市),并與AMD的R7系列多款顯示卡展開競爭。
全新的麥克斯韋1.0架構
英偉達表示,Maxwell架構將會有兩代,用在GeForce GTX 750 Ti和GeForce GTX 750上的GM107核心和只用于移動版的GM108核心均采用的是第一代的Maxwell 1.0,以28nm工藝制造,主打低功耗。而Maxwell 2.0,或者是第二代,傳說將會使用20nm工藝打造,會晚些到來,主打高性能與發(fā)燒友市場。
Maxwell 1.0主打的將是能耗比或者是每瓦特性能,通過英偉達之前推出的Tegra處理器和游戲設備SHIELD就可以看出,英偉達在原有的傳統(tǒng)游戲PC、工作站及超級計算機領域外,開始拓展一些新的市場。注重低功耗和每瓦特性能的顯示卡,可以應用于新晉的、以Mini-ITX為例的小型PC和以Steam Machines為例的游戲主機,在家庭娛樂市場上進一步分一杯羹。
GM107的核心布局與上代相比變化其實并不大,定位偏低的GM107核心擁有一個GPC,兩個64bit顯存控制器及配套的2組ROP單元(每組8個,共計16個),外加二級高速緩存。GPC里仍舊包含一個光柵引擎(Raster Engine),SM單元的數量增加為5個,組織方式也使用了全新的設計。隨著Fermi、Kepler、Maxwell架構的逐步進化,GPC里的SM架構組織方式也從SM變成了SMX,再變?yōu)槿碌腟MM(Sreaming Multiprocessors Maxwell)。
Maxwell架構的SMM,依然和SMX一樣,由PolyMorph引擎(2.0)、CUDA核心、Load/Store單元、SFU、Warp調度器和分發(fā)單元、Register File、紋理定址/拾取單元、紋理緩存、指令緩存等等組成。最主要的變化是,在PolyMorph引擎(2.0)和指令緩存區(qū)之下,Maxwell架構將一個SM分為4個獨立的處理塊,每個獨立的處理塊擁有自己的指令緩沖區(qū)、調度器、32個CUDA核心,以及Load/Store和SFU單元。之前在Kepler架構一個SMX里的紋理高速緩存和64KB共享顯存/一級高速顯存組合也發(fā)生了變化,由一對處理塊共享4個紋理過濾單元和一個紋理高速緩存,然后64KB共享顯存成為獨立單元,被4個塊共享。在SMM外,Maxwell架構還將核心的二級高速緩存配置從GK107(同樣是一組GPC、兩組顯存控制器)的256KB大幅提升到了2 048KB,用以降低顯存帶寬需求。
除了全新的布局,控制邏輯分區(qū)、負荷均衡、時鐘門控粒度、編譯器調度、每時鐘周期發(fā)出指令條數等方面,Maxwell架構也進行了改進。這樣Maxwell架構,一改Kepler架構的SMX主要大量堆CUDA計算核心,架構效率會受到一定程度的影響的做法,核心降低了SM尺寸,提高SM數量及調度邏輯單元數量,以達到簡化設計與調度邏輯、節(jié)省了面積與功耗、降低計算延遲的目的。
除了架構的革新,Maxwell還有幾點新的變化。首先,Maxwell改進了在Kepler上加入的硬件H.264視頻編碼器NVENC,可以實現更快的編解碼速度(英偉達稱編碼速度可以提升1.5~2倍,解碼速度提升8~10倍),以服務于H.264視頻編解碼和自己的特色功能ShadowPlay,游戲視頻實時錄制。其次,Maxwell使用了全新的GC5功率狀態(tài),能在視頻播放等輕載型使用場合降低GPU的功耗。除此之外,英偉達顯示卡一直以來的一些特性,比如支持PhysX、TXAA、GPU Boost、G-Sync、GeForce Experience等等,Maxwell核心、GeForce GTX 750 Ti和GeForce GTX 750都全部支持。
我們非常驚喜的看到,Maxwell所采用了的全新設計,一改之前Kepler使用龐大規(guī)模ALU設計的SMX,采用新的SMM,讓核心可以更有效的利用每一個計算單元,開始走上了追求效率之路。外加Maxwell架構在編譯器調度、每時鐘周期發(fā)出指令條數等方面的改進,以及容量更大的二級緩存等設計,使得每個計算核心的效率和每瓦特性能都有了顯著增長。只是受到20nm制程工藝的拖累,我們暫時只能靠一顆偏低端的核心來嘗嘗鮮。不過對性能有較高要求用戶也無須著急,高性能Maxwell 2.0產品的出現只是時間問題。