馬宇川
北京時間2020年10月9日零點,本年度最受期待的一場處理器發(fā)布會:“WHERE GAMING BEGINS”(游戲從這里開始)終于召開,AMD公司總裁兼CEO蘇姿豐博士正式發(fā)布了采用新一代Zen 3架構(gòu)的AMD銳龍5000系列處理器,并帶來了一系列好消息:Zen 3核心架構(gòu)的每時鐘周期指令數(shù)(IPC)性能比上一代Zen 2產(chǎn)品提升了多達19%;銳龍5000系列處理器的單線程性能得到大幅提升,高端產(chǎn)品的CINEBENCH R20處理器單線程性能突破630pts;銳龍5000系列處理器中的高端產(chǎn)品在游戲性能上已經(jīng)全面超越現(xiàn)在的游戲處理器旗艦酷睿i9-10900K。那么AMD Zen 3處理器架構(gòu)是如何實現(xiàn)性能大幅提升的,新一代AMD銳龍5000系列處理器由哪些產(chǎn)品組成,各自有什么特點,它們的價格如何呢?接下來就讓我們通過目前AMD所公開的部分資料來先睹為快。
對于AMD處理器而言,Zen架構(gòu)顯然是這3年來最為重要的一款處理器架構(gòu)。在2017年,正是憑借Zen架構(gòu),AMD處理器在技術(shù)上實現(xiàn)了質(zhì)的飛躍,從挖掘機架構(gòu)到Zen架構(gòu)高達52%的IPC提升,讓AMD處理器在性能上終于能與強勁的競爭對手平分秋色。同時AMD也不斷對Zen架構(gòu)進行升級、改造,保持了高速發(fā)展態(tài)勢:在2018年,AMD發(fā)布了性能得到小幅提升的Zen+架構(gòu);在2019年IPC性能得到15%提升(與Zen架構(gòu)對比)的Zen 2架構(gòu)問世。而在僅僅時隔一年后,AMD就拿出了IPC性能較Zen 2架構(gòu)提升多達19%的Zen 3架構(gòu)。那么AMD到底為Zen 3處理器架構(gòu)施加了什么“魔法”,讓它在短期內(nèi)就能獲得如此大的進步呢?
CCX模塊采用全新設計
從目前AMD公開的資料來看,zen 3架構(gòu)最大的改變是CCX(CPU Complex)模塊采用了全新設計。從zen架構(gòu)開始,AMD銳龍?zhí)幚砥鞫际峭ㄟ^CCX模塊來實現(xiàn)多核心配置。CCX是AMD Zen架構(gòu)最基本的組成單元,ZenB寸代每個CCX模塊擁有4顆核心,每個核心擁有自己獨立的L1和L2緩存,一個CCX模塊共享8MB L3緩存。每個CCX模塊還擁有獨立的DDR4內(nèi)存控制器、PCIe控制器等I/O功能元器件。此外Zen時代處理器采用的生產(chǎn)工藝為14nm、12nm,工作頻率不算太高,旗艦銳龍7 1800X的加速頻率也就4.0GHz左右。
在zen 2時代,為了實現(xiàn)更多的處理器核心數(shù)量和更高的運算效率,AMD引入了MCM多芯片封裝技術(shù)(multi-chip module)。首先,Zen 2架構(gòu)將處理器的計算核心部分和I/O部分剝離,CCX模塊不再具備I/O功能,只由純粹的處理器計算核心組成。采用分離式設計的優(yōu)勢在于可以靈活配比不同數(shù)量的計算核心和I/O模塊,以實現(xiàn)不同的規(guī)格。AMD為Zen 2設計了一個內(nèi)置PCIe控制器、DDR4內(nèi)存控制器、SATA控制器、usB控制器,采用12nm工藝打造的I/O模塊。計算核心通過INFINITY FABRIC總線和I/O模塊連接。Zen 2的計算核心則采用了更先進的7nm工藝,有助于縮小面積、提高頻率、降低功耗。其CCX模塊雖然仍是4核心設計,但借助7nm工藝、I/O模塊的剝離,每個CCX模塊的三級緩存容量翻倍達到16MB。同時在Zen 2上,AMD引入了CCD(Core Chiplet Die)大計算核心這個設計。簡單地說,CCD就是將兩個CCS模塊封裝在一個芯片內(nèi),彼此同樣通過INFINITY FABRIC總線連接。這也就意味著AMDR需增加CCD模塊,并與I/O模塊連接就能輕松地制造出核心數(shù)量多得多的處理器,這也是我們能在Zen 2處理器上看到64核心銳龍Threadripper 3990X處理器的主要原因。
相比英特爾消費級處理器所用的環(huán)形總線架構(gòu),AMD通過MCM多芯片封裝技術(shù)的確能更容易地實現(xiàn)多核心設計,但也有它的不足。目前在英特爾主流消費級處理器上,由于核心數(shù)不多,其所有核心是通過環(huán)狀總線和L3緩存綁定在一起的。也就是說,所有處理器核心、緩存都掛靠在統(tǒng)一的總線上,每顆核心都可以快速訪問L3緩存,其數(shù)據(jù)一致性也能通過統(tǒng)一的L3緩存得到保證,這樣做的優(yōu)勢在于可以最大限度地提升處理器的性能和緩存的利用率。與此相應的是,Zen、Zen2架構(gòu)都是獨立的CCX 4核心模塊化設計,各模塊擁有獨立的L3緩存,而且每個模塊的L3緩存容量并不大,只有8MB(Zen)或16MB(Zen 2)。這就可能出現(xiàn)某核心在模塊內(nèi)緩存查找數(shù)據(jù)未命中,需要跨CCX到I/O模塊中調(diào)用數(shù)據(jù)或到速度更慢的內(nèi)存中調(diào)用的情況。而要執(zhí)行這兩個工作都需要通過INFINITY FABRIC總線去調(diào)用數(shù)據(jù),這將顯著增加延遲,降低處理器運算效率。畢竟從上一代銳龍?zhí)幚砥鞯臄?shù)據(jù)來看,芯片之間INFINITY FABRIC總線的讀取帶寬雖然達到了51.2G B/s,寫入帶寬也有25.6GB,s,但跟傳輸速度輕松就能達到500GB/s以上的三級緩存相比還是慢了很多,計算核心需要等待待收到數(shù)據(jù)后才能運算。如果再考慮計算任務有緩存一致性要求(即要求所有L3緩存中的數(shù)據(jù)必須相同)的話,其實對每顆處理器核心來說最有用的緩存容量就是自己CCX模塊內(nèi)的那16MB(Zen 2)或8MB(Zen)。這也使得之前的銳龍?zhí)幚砥髟趯μ幚砥骱诵臄?shù)要求不太高的應用,如在所需核心數(shù)與競爭對手產(chǎn)品規(guī)格相近的應用中(注:因為競爭產(chǎn)品的核心數(shù)量較少,所以一般體現(xiàn)在游戲這樣的消費級應用上),會由于緩存、內(nèi)存延遲的問題在游戲中的表現(xiàn)要略遜于對手。而在對核心數(shù)要求更多的專業(yè)應用中,銳龍?zhí)幚砥鲃t能憑借更強的核心運算能力完全掩蓋掉這個不足。
因此在Zen 3上,為了提升處理器的游戲運行性能,AMD采用了一個看似簡單的辦法——擴大CCX規(guī)模,將CCX內(nèi)的計算核心數(shù)量提升到8顆,同時把共享三級緩存容量擴大到32MB。8顆處理器核心都能高速、任意地訪問這32M B緩存。簡單地說,在Zen 3上每顆處理器核心最有用的緩存容量大幅提升到了32MB。對于只需要較少核心參與運行的游戲應用來說,翻倍的緩存容量顯然提升了處理器在緩存中查找數(shù)據(jù)的命中概率,能有效減少跨CCX查找或訪問內(nèi)存的頻率,可以明顯提升處理器的運行效率。同時單CCX 8核心的設計也可以減少核心之間的通訊頻率,降低延遲。對于8核心Zen 3處理器來說,它的所有核心都可以在一塊芯片內(nèi)高速通信,而zen 2的8核心處理器內(nèi)部則需要跨CCX通過INFINITY FABRIC總線通信。對于16核心Zen 3處理器而言,它的內(nèi)部則只存在與一個CCX通信的情況,而Zen 216核心處理器銳龍9 3950X內(nèi)部的每個CCX都有與其他三個CCX進行通信的可能。
總的來看,雖然AMD并沒有公開Zen 3 CCX內(nèi)部是如何連接這8顆計算核心與三級緩存的,但毫無疑問肯定是通過比INFINITY FABRIC總線快得多的高速總線將它們?nèi)坷壴谝黄穑锌赡苁桥c對手類似的環(huán)形總線設計,這也為處理器能高效執(zhí)行那些對核心、線程數(shù)要求較少的任務打下了基礎。
19%性能提升的“功臣”有六位
不過根據(jù)AMD官方描述,CCX架構(gòu)的改變、緩存性能的提升只是Zen 3處理器獲得總共19%性能提升的“功臣”之一,而為這19%性能提升做出貢獻的“功臣”總計有六位。它們是:Cache Prefetching(緩存數(shù)據(jù)預?。┴暙I了2.7%的力量;Execution Engine(執(zhí)行引擎)的改進貢獻了3.3%;更先進的Branch Predictor(分支預測)貢獻了1.3%;Micro-op Cache(微操作緩存)的改進貢獻了2.7%;處理器采用了新的Front End前端架構(gòu),為性能提升貢獻了多達4.6%的力量;在整數(shù)運算單元上,Zen 3架構(gòu)提升了Load/Store(數(shù)據(jù)載入和存儲)帶寬,貢獻同樣高達4.6%。遺憾的是目前AMD并未公開大部分的創(chuàng)新、改進細節(jié),只是表明相對Zen 2,Zen 3是一個完全的全新設計,這也是其性能可以在一年內(nèi)就獲得19%提升的關鍵所在。
仍是7nm,但是與銳龍XT系列處理器相同的7nm
在生產(chǎn)工藝方面,雖然Zen 3架構(gòu)處理器仍采用臺積電的7nm生產(chǎn)工藝打造,但它采用的是與今年中期發(fā)布的銳龍XT系列相同,得到小幅改進的7nm生產(chǎn)工藝。我們知道7nm工藝在去年的Zen 2處理器上就得到了采用,而臺積電也在不斷改進其工藝技術(shù),因此在Zen 2架構(gòu)的銳龍XT處理器上,它的工作頻率較其他Zen 2處理器得到了小幅提升。在Zen 3架構(gòu)上,處理器的加速頻率更進一步提升到最高4.9GHz,已接近5.0GHz大關。AMD表示,Zen 3處理器的每瓦性能比第一代銳龍?zhí)幚砥魈岣吡?.4倍,對比基于14nm工藝的英特爾Comet Lake酷睿處理器提高了2.8倍。
四款首發(fā)產(chǎn)品 覆蓋從主流到旗艦
第一批上市的Zen 3處理器有四款,它們是銳龍9 5950X、銳龍95900X、銳龍7 5800X、銳龍5 5600X。其中銳龍9 5950X對應Zen 2旗艦,同樣采用16核心、32線程設計的銳龍9 3950X,L3緩存總?cè)萘恳彩?4MB,TDP熱設計功耗為105W,但最高加速頻率從銳龍9 3950X的4.7G Hz提升到了4.9GHz,同時處理器建議零售價為799美元,折合人民幣約5365元,中國市場的零售價暫未公布。銳龍95900X則是為了取代銳龍9 3900XT、銳龍9 3900x設計的產(chǎn)品,同樣采用12核心、24線程設計,L3緩存總?cè)萘咳詾?4MB,最高加速頻率達到4.8GHz,分別比銳龍9 3900XT、銳龍9 3900X高了100MHz、200MHz。盡管其標稱加速頻率沒有銳龍9 5950X高,但在AMD的宣傳中卻將銳龍95900X稱為“目前世界上最好的游戲處理器”,我們分析這是因為銳龍95900X的核心數(shù)量少一些,因此發(fā)熱量、溫度相對更低,在實際的游戲運行中更容易達到高頻率,帶來性能增益。其建議零售價為549美元,折合人民幣約3687元。
至于銳龍7 5800X則是為了替換現(xiàn)在的銳龍7 3800XT、銳龍7 3800X。單從規(guī)格上看,它與銳龍7 3800XT幾乎完全相同,最高加速頻率同為4.7GHz,L3緩存容量為32MB,TDP均為105W。當然就像我們在前面講的那樣,它們在內(nèi)部架構(gòu)上有大的區(qū)別,銳龍7 5800X采用單CCX設計,而銳龍7 3800XT需要兩個CCX才能實現(xiàn)8核心、32HB三級緩存的規(guī)格。目前銳龍7 5800X的建議零售價為449美元,折合人民幣約3015元。
由于定位高端,以上三款處理器上市時都不會附送散熱器,用戶可以自行為它們購買高端風冷或水冷散熱器。作為面向主流用戶的銳龍5 5600X則會向用戶附送幽靈潛行(Wraith Stealth)65W靜音版散熱器。幽靈潛行只是一款性能一般的全鋁制散熱器,銳龍5 5600X之所以只搭配這樣的散熱器關鍵在于其TDP不高,仍只有65W。其他方面,作為替換銳龍5 3600X、銳龍5 3600的產(chǎn)品,它也采用了6核心、12線程設計。三級緩存總?cè)萘客瑸?2MB,但最高加速頻率從銳龍5 3600XT的4.5GHz提升到了4.6GHz。價格方面,相對于其他幾款Zen 3產(chǎn)品,這款處理器要便宜不少,建議零售價只有299美元,折合人民幣約2008元。所有這四款處理器都將在2020年11月5日上市銷售。
性能獲得大幅提升
盡管從技術(shù)規(guī)格來看四款Zen 3銳龍?zhí)幚砥髋cZen 2產(chǎn)品相比領先并不多,但根據(jù)AMD目前公布的資料,借助新架構(gòu),Zen 3銳龍?zhí)幚砥髟谛阅苌汐@得了大幅提升。首先從銳龍9 5950X與銳龍9 3950X的對比來看,在內(nèi)容創(chuàng)建性能上,它的最大性能領先幅度可達27%,出現(xiàn)在CAD應用《SOLIDWORKS 2019》上。在優(yōu)勢最小的視頻編輯軟件《ADOBE PREMIERE PRO 14.3.1》中,它也有5%的領先幅度。當然最值得關注的是在分辨率為1080p、高畫質(zhì)設定下的游戲測試中,其較銳龍9 3950X的游戲領先幅度普遍在28%以上,最小也有13%的優(yōu)勢。與酷睿i9-10900K相比,銳龍9 5950X則繼續(xù)在需要調(diào)用多核心運算性能的渲染應用中碾壓對手——在V-RAY 4.10的性能測試中領先對手59%;在部分游戲中則能小幅領先或與對手打平。
對于被稱為“目前世界上最好的游戲處理器”:銳龍9 5900X,AMD則在資料中重點宣傳了它的游戲性能,其游戲測試仍采用1080p分辨率、高畫質(zhì)的設定。相對于銳龍93900X,銳龍9 5900X在《英雄聯(lián)盟》《絕地求生:大逃殺》《CS:GO》游戲中,分別實現(xiàn)了高達50%、46%、33%的游戲性能提升幅度;在《古墓麗影:暗影》《F1 2019》等多款游戲中也能輕松實現(xiàn)20%以上的性能提升。面對曾經(jīng)的“游戲性能王者”:酷睿i9-10900K,它依然能在《英雄聯(lián)盟》《CS:GO》中分別獲得21%、19%的優(yōu)勢,在10款游戲?qū)Ρ葴y試中,銳龍9 5900X贏了9款,僅在《戰(zhàn)地5》中小幅落后。能讓銳龍9 5900X占據(jù)游戲性能寶座的關鍵就在于它的處理器單線程性能得到了大幅提升——根據(jù)AMD公開的資料顯示,銳龍9 5900X的CINEBENCH R20處理器單線程性能達到631pts,而酷睿i9-10900K的單線程性能只有545pts左右,優(yōu)勢很大。
至于銳龍7 5800X、銳龍55600X,在AMD目前公開的資料中,AMD只簡單地介紹了它們的每美元性能即用戶每花一美元所能買到的性能。總的來看,銳龍7 5800X在單線程性能、多線程性能上的每美元性能都比與其對位的8核心、16線程處理器:酷睿i7-10700K要稍強一些,領先幅度在9%~11%左右。在1080p游戲性能測試中,兩款處理器打平。而銳龍5 5600X則相對競爭對手有更明顯的優(yōu)勢,同與其對位的6核心、12線程處理器:酷睿i5-10600K對比,銳龍5 5600X在單線程、多線程、1080p游戲性能上都全面勝出,領先幅度達13%~20%。
現(xiàn)有500系主板可輕松支持Zen 3處理器,400系主板未來也能用
為了讓用戶能方便地使用Zen 3處理器,AMD表示現(xiàn)有500系芯片組主板,如X570、B550、A520等主板只需將BIOS中的AGESA(AMD Generic Encapsulated Software Architecture,AMD通用封裝軟件架構(gòu))升級到1.0.8.0版本,就能讓Zen 3處理器通過自檢、引導。當然如果想獲得更好的體驗,則需用戶將AGESA升級到1.1.0.0或更新的版本。簡單一句話,不斷升級500系主板的BIOS就是最正確的做法。
當然更激動人心的是,AMD確認X470、B450這類400系主板也能使用Zen 3處理器,目前AMD與主板廠商正在為400系主板聯(lián)合開發(fā)支持Zen 3處理器的BIOS,預計在2021年1月首批BIOS就能上線發(fā)布。
11月5日展示Zen 3處理器的真正實力
從AMD目前公開的Zen 3處理器技術(shù)資料來看,毫無疑問它是非常誘人的——它具有在多線程性能、單線程性能、游戲性能全面擊敗競爭對手的實力,這是以往任何一代AMD處理器都沒有取得的成績。當然PPT歸PPT,事實又是否如此呢?根據(jù)AMD目前透露的信息來看,AMD將在Zen 3處理器上市的當天即2020年11月5日也同步公開Zen 3處理器的第三方評測數(shù)據(jù)。毫無疑問,作為國內(nèi)專業(yè)的硬件評測媒體,《微型計算機》評測室也將在第一時間對Zen 3處理器展開全面、詳細的評測。因此要想了解Zen 3處理器的真實實力,那么就請繼續(xù)關注《微型計算機》官方微信(微信號:MC-1981)、微博(微博號:微型計算機唐方微博)、今日頭條(用戶名:微型計算機)等新媒體與雜志平臺為您帶來的最新報道。