可樂(lè)
AMD Kaveri APU開(kāi)創(chuàng)了AMD全新的異構(gòu)計(jì)算時(shí)代,為AMD未來(lái)的發(fā)展鋪平了道路。在硬件上,Kaveri APU在GPU和CPU部分都做出了重大改進(jìn),全新的壓路機(jī)CPU架構(gòu)和強(qiáng)大的GCN GPU架構(gòu)使得APU在性能上達(dá)到了一個(gè)巔峰。在軟件方面,借助于統(tǒng)一內(nèi)存尋址技術(shù)和HSA異構(gòu)加速的強(qiáng)大魅力,APU能夠以前所未有的態(tài)勢(shì)展現(xiàn)出其在應(yīng)用程序加速、并行計(jì)算等方面的獨(dú)特優(yōu)勢(shì)。
1 全新的CPU和GPU架構(gòu)
Kaveri APU在硬件上的優(yōu)勢(shì)在于全新的硬件架構(gòu)。它的CPU部分采用了AMD在推土機(jī)架構(gòu)上大幅度加強(qiáng)、重新調(diào)整設(shè)計(jì)的壓路機(jī)架構(gòu)。而GPU部分,桌面顯卡上流行的GCN架構(gòu)的加入,使得Kaveri APU成為史上圖形性能最強(qiáng)大的處理器產(chǎn)品。
壓路機(jī)架構(gòu):IPC大幅度提升
AMD之前的的推土機(jī)架構(gòu)設(shè)計(jì)存在些許遺憾。而在Kaveri APU上,AMD經(jīng)過(guò)全新調(diào)整推出了壓路機(jī)架構(gòu),總的來(lái)看,Kaveri APU的壓路機(jī)構(gòu)相比同檔次的推土機(jī)和打樁機(jī)架構(gòu),綜合性能提升大約15%~20%。
根據(jù)AMD官方資料,壓路機(jī)架構(gòu)指令部分大幅度加強(qiáng),指令緩存追蹤失敗幾率降低30%,分支預(yù)測(cè)失敗幾率降低20%,每個(gè)線程增加了25%的數(shù)據(jù)調(diào)度寬度,為每個(gè)整數(shù)單元配備了獨(dú)立的解碼單元。在執(zhí)行部分,壓路機(jī)增加了5%~10%的調(diào)度效能,提升了L1數(shù)據(jù)緩存的存儲(chǔ)性能。此外,壓路機(jī)還引入了動(dòng)態(tài)調(diào)整大小的L2緩存、增加了微解碼操作隊(duì)列,提升了L1和L2緩存的接口,上述改進(jìn)使得壓路機(jī)的性能相比之前的推土機(jī)有了明顯的提升,尤其是額外增加的整數(shù)解碼單元,使得壓路機(jī)的整數(shù)性能明顯提升,在執(zhí)行日常操作時(shí)性能表現(xiàn)更為出色。
GCN架構(gòu):史上最強(qiáng)的融合GPU
AMD官方數(shù)據(jù)顯示,新的GCN架構(gòu)融合獨(dú)顯核心帶來(lái)了最多30%的GPU性能增加。Kaveri APU完美支持DirectX 11.2、Open GL 4.3等一些新技術(shù),也支持AMD諸多特色技術(shù),如Mantle、TureAudio、UVD等,堪稱史上規(guī)格最全面、性能最強(qiáng)悍。
Kaveri APU最多可以集成8個(gè)CU單元,每個(gè)CU單元有64個(gè)流處理單元, 最多擁有512個(gè)流處理單元,規(guī)格堪比目前桌面獨(dú)立顯卡。AMD宣稱Kaveri APU的頂級(jí)型號(hào)A10-7850K可以在1080P分辨率下以中等畫(huà)質(zhì)以每秒30~40幀的速度比較流暢地運(yùn)行《戰(zhàn)地4》。此外,AMD還額外強(qiáng)調(diào)了兩個(gè)數(shù)據(jù),856GFLOPS和47%的GPU面積。Kaveri APU的計(jì)算能力目前最高可達(dá)到856GFLOPS,與此相對(duì)應(yīng)的是上一代Richland APU的最高浮點(diǎn)計(jì)算能力為779GFLOPS。從數(shù)據(jù)來(lái)看,雖然Kaveri APU只想對(duì)Richland的絕對(duì)值提升了約10%,但是由于CPU和GPU架構(gòu)的改進(jìn)以及統(tǒng)一內(nèi)存尋址、HSA等技術(shù)的引入,Kaveri APU在實(shí)際的計(jì)算能力上相比前代的Richland還是有更大幅度的進(jìn)步的。此外,Kaveri APU中GPU部分的面積越來(lái)越大,目前已經(jīng)達(dá)到了47%(浮點(diǎn)計(jì)算貢獻(xiàn)能力約86%)。更大的GPU面積可以提供更強(qiáng)大的浮點(diǎn)計(jì)算能力,也能夠使得APU在運(yùn)行圖形應(yīng)用以及有關(guān)并行計(jì)算時(shí)效能表現(xiàn)更為出色。
2 新工藝提升能耗比
在這一代新的Kaveri APU上,AMD采用了全新的28nmSHP工藝。全新的工藝擁有超高的晶體管密度。之前的Richland APU的晶體管數(shù)量有13億個(gè),核心面積為246平方毫米,但是在Kaveri APU上使用了GlobalFoundries新的“半代工藝”后,擁有高達(dá)24.1億晶體管,但是核心面積卻只有245平方毫米,晶體管密度幾乎提升一倍。
更小的核心面積有助于降低產(chǎn)品的成本。不僅如此,Kaveri APU借助于全新的28nm SHP工藝,功耗表現(xiàn)也非常令人滿意,最高功耗僅有95W,最低功耗甚至只有15W。更低的功耗加上更強(qiáng)悍的性能,大幅度提升了APU的性能功耗比,擴(kuò)展了APU的市場(chǎng)范圍。現(xiàn)在AMD可以提供高性能、低功耗以及超低功耗等多個(gè)版本的APU產(chǎn)品,各個(gè)類型的用戶都可以得到自己想要的選擇。
3 異構(gòu)計(jì)算魔力初現(xiàn)
對(duì)Kaveri APU而言,硬件架構(gòu)的進(jìn)步只能說(shuō)是常規(guī)性的。而Kaveri APU對(duì)統(tǒng)一內(nèi)存尋址(Heterogeneous Uniform Memory Access,簡(jiǎn)稱為hUMA)的支持,則完全可以堪稱對(duì)整個(gè)業(yè)界尤其是異構(gòu)計(jì)算發(fā)展的革命性推動(dòng)。Kaveri APU是目前全球首款能夠支持CPU和GPU統(tǒng)一尋址的處理器,也是AMD未來(lái)發(fā)展HSA(Heterogeneous System Architecture,異構(gòu)系統(tǒng)架構(gòu))的核心產(chǎn)品。
在傳統(tǒng)的理念中,由于巨大的結(jié)構(gòu)差異,CPU和GPU各有所長(zhǎng),將它們?nèi)诤显谝黄疬M(jìn)行智能調(diào)度并發(fā)揮各自的優(yōu)勢(shì),一直都極為困難。傳統(tǒng)的CPU+GPU的分離式架構(gòu)通過(guò)PCI-E總線調(diào)配CPU和GPU中的數(shù)據(jù),并且CPU和GPU各自有擁有本地存儲(chǔ),這樣就造成了兩者之間數(shù)據(jù)的共享和傳輸存在瓶頸,還給編程人員和程序編譯帶來(lái)了巨大的困難。
為了解決這樣的問(wèn)題,AMD在Kaveri APU上支持hUMA,使得CPU和GPU能夠使用統(tǒng)一的內(nèi)存空間,數(shù)據(jù)存放于CPU和GPU公共的空間中,可以被CPU和GPU同時(shí)調(diào)用和讀取,完全沒(méi)有任何帶寬和數(shù)據(jù)存儲(chǔ)上的阻隔,效率相比傳統(tǒng)的CPU+GPU分離式設(shè)計(jì)有了翻天覆地般的提升,同時(shí)為異構(gòu)計(jì)算本身的發(fā)展打開(kāi)了大門(mén)。為了更進(jìn)一步發(fā)展Kaveri APU統(tǒng)一內(nèi)存尋址的強(qiáng)大潛力,AMD還專門(mén)組建了HSA聯(lián)盟,并從軟件開(kāi)發(fā)和硬件底層兩方面下手支持HSA異構(gòu)計(jì)算的發(fā)展。根據(jù)AMD展示的一些例子,在HSA的支持下,Kaveri APU相比傳統(tǒng)CPU,在JPEG解碼速度上的提升高達(dá)87.3%。此外還有諸如人臉識(shí)別、圖形加速等強(qiáng)大的功能,在HSA和Kaveri APU的加持下都能獲得極為明顯的性能提升。
4 奏響APU最強(qiáng)音
從硬件、軟件以及架構(gòu)設(shè)計(jì)和規(guī)格來(lái)看,Kaveri APU不愧是目前AMD最強(qiáng)的APU產(chǎn)品。借助于全新的打樁機(jī)架構(gòu)、GCN融合顯卡,Kaveri APU實(shí)現(xiàn)了性能的飛躍。在軟件方面,HSA架構(gòu)以及相關(guān)軟件的配合,使得Kaveri APU開(kāi)啟了一扇通向未來(lái)異構(gòu)計(jì)算的大門(mén)。這也是AMD布局多年后希望得到的結(jié)果。總的來(lái)說(shuō),Kaveri APU是AMD未來(lái)發(fā)展的核心,也是AMD未來(lái)進(jìn)化的基礎(chǔ)。