劉向紅,張時光,李隱峰
(鴻富錦精密電子 天津300462)
IBM POWER8核心處理器
劉向紅,張時光,李隱峰
(鴻富錦精密電子 天津300462)
隨著云運算和大數(shù)據(jù)產(chǎn)業(yè)的迅猛發(fā)展,數(shù)據(jù)處理和存儲技術(shù)的發(fā)展如火如荼。IBM 作為服務(wù)器行業(yè)的先行者,不甘心Intel一枝獨大,在2015年3月對外部客戶推出開放型平臺POWER8。為使服務(wù)器開發(fā)者和用戶快速了解該系列處理器,整理了POWER8的技術(shù)特點和產(chǎn)品特性,以利于快速比較和選型。
大數(shù)據(jù) 服務(wù)器 核心處理器 IBM POWER8
2013年8月26日,在斯坦福大學(xué)舉行的第25屆HotChip半導(dǎo)體大會上,IBM發(fā)布了新一代服務(wù)器處理器POWER8。POWER8采用22,nm SOI工藝,芯片核心面積為650,mm2。性能方面,POWER8采用超標(biāo)量體系架構(gòu),對稱型超線程設(shè)計 8-WaySMT,最大支持同時執(zhí)行 96 個線程。該產(chǎn)品可聯(lián)系OpenPOWER基金會進行許可注冊并開發(fā)設(shè)計,這是IBM第1次對外開放如此高端處理器的開發(fā)許可。
POWER8 最大支持12核心芯片多線程設(shè)計,每個核心能同時處理 8個硬件線程,執(zhí)行高速運算,總共可同時執(zhí)行 96個線程運算任務(wù)。處理器使用了大量的開關(guān)芯片 eDRAM 作為緩存,內(nèi)存控制器在eDRAM開啟狀態(tài),可以為內(nèi)存和系統(tǒng)I/O打開很大的帶寬。對于大多數(shù)工作負(fù)荷,據(jù)說緩存芯片可達(dá)到POWER7兩到三倍的計算速度。
在 POWER7及以前的處理器系列,使用 GX+外部通信總線,POWER8 刪除了這一設(shè)計并取而代之以 CAPI端口。CAPI端口用于連接一些專業(yè)的輔助處理器,如GPU、ASIC和FPGA。這些通過CAPI總線外加的處理單元可以與CPU使用相同的內(nèi)存地址空間,從而減少了計算路徑長度。在2013年ACM和IEEE超級計算大會上,IBM和Nvidia宣布了一項合作工程,在未來的 HPC系統(tǒng)中,Nvidia GPU將與POWER8系統(tǒng)高度集成且已明確應(yīng)用于第 1款POWER系統(tǒng)S824L。
POWER8還包含1個OCC,即所謂的集成于芯片上的控制器,也就是基于PowerPC 405處理器的電能和熱能管理單片機。它有兩個通用卸載引擎(GPE)和 512,KB的嵌入式靜態(tài)隨機存取存儲器(SRAM),通過OCC可直接訪問主存——運行中的一個開源固件。OCC管理 POWER8的運行頻率、電壓、內(nèi)存帶寬、熱控制處理器和內(nèi)存,它可以通過 1,764個位于Fly之上的集成調(diào)節(jié)器調(diào)整電壓。OCC也可以被編程用于超頻POWER8處理器或降低其功耗降低工作頻率(類似于一些 Intel和 AMD處理器中的可配置的TDP)。
POWER8已有4、6、8、10和12核等不同版本,每個版本都采用 15層金屬處理的 22,nm的絕緣硅(SOI)單元制造。12核心版本由 42億個晶體管構(gòu)成,大小為650,mm2,6核版本大小僅為362,mm2。
POWER8芯片的存儲器控制器設(shè)計為可使用DDR3或 DDR4內(nèi)存。而作為一個存儲緩沖區(qū)、L4高速緩存芯片和實際存儲器,被配對至外部原件Centaur,設(shè)計為永不過時技術(shù)的內(nèi)存控制器。當(dāng)前,Centaur芯片采用 DDR3內(nèi)存,但未來版本可以使用DDR4或一些其他存儲器技術(shù),而不需要修改POWER8芯片本身的設(shè)計。
每一個 Centaur由 3條高速連接方式連接到POWER8(2讀 1寫),運行帶寬 9.6,GB/s,總運行帶寬 28.8,GB/s,具有 40,ns的時間延遲。Centaur包含有 16,MB的 eDRAM,可用作 L4高速緩存。每個POWER8的每個Socket可以鏈接最多8個Centaur芯片,合計每 Socket最多允許鏈接高達(dá) 1,TB,帶有128,MB的L4高速緩存和230,GB/s的持續(xù)存儲器帶寬,32,GB DRAM的接口以及410,GB/s的峰值內(nèi)存帶寬。Centaur芯片最終被集成到 DRAM的 DIMM模塊中。存儲控制器 Centaur 芯片采用與 POWER8一樣的制程技術(shù)。
每個 POWER8核心擁有 64,KB的 L1數(shù)據(jù)和32,KB的L1指令緩存。每個核心的每個循環(huán)可以向16個執(zhí)行通道發(fā)出10條指令并分派8條指令:2個固定點的通道,2個加載/存儲通道,2個加載通道,4個雙精度浮點通道,也可以充當(dāng)8個單精度浮點運算通道,2條VMX通道,1個加密通道,1個十進制浮點通道,1個條件寄存器通道和 1個分支執(zhí)行通道。
它有一個更大的4×16問題處理隊列入口,能提高分支任務(wù)預(yù)測,處理多達(dá)兩倍的高速緩存缺失。每個核包含8路硬件多線程,可被動和自動分配到具有1個、2個、4個或所有 8個線程的運算。POWER8還增加了對硬件事務(wù)存儲器的支持。IBM估計,其每個內(nèi)核是 POWER7 單線運算速度的1.6倍。
POWER8 處理器由 12 顆芯片設(shè)計而成,可能由4、6、8、10或12 顆芯片集合構(gòu)成,其中1組芯片集包括1顆核芯,SRAM 512,KB 的L2 高速緩存總線(是上一代產(chǎn)品的兩倍)和eDRAM 8,MB的每顆芯片集的芯片之間的 L3共享緩存。因此,6核芯處理器將有48,MB L3的eDRAM緩存,而12 核芯處理器將總共有 96,MB 的 L3,eDRAM 緩存。該芯片還可以利用1個高達(dá)128,MB的 eDRAM 緩存 L4 采用Centaur 配套芯片。集成于芯片上的內(nèi)存控制器可以處理 1,TB RAM 和 230,GB/s 的持續(xù)內(nèi)存帶寬。這些內(nèi)核設(shè)計用來處理2.5~5,GHz的時鐘速率。
POWER8的6核版采用的是IBM安裝在雙芯片模塊(DCM)對向外擴展的服務(wù)器。在大多數(shù)配置中,并不是全部的核心都可以被激活,因此出現(xiàn)了各種實際核心數(shù)量的不同配置。 12核心版本直到 2014年5月還沒有發(fā)布到任何系統(tǒng)。
IBM的單芯片POWER8模塊被稱為Turismo,雙芯片變種被稱為 Murano。PowerCore 的修改版本被稱為CP1。
2014年1月19日,蘇州Powercore技術(shù)公司宣布,他們將加入OpenPower基金會并注冊POWER8核心應(yīng)用,為客戶定制設(shè)計大數(shù)據(jù)和云計算。
IBM Murano——雙6核的12核處理器。擴展型處理器在某些核心關(guān)閉的情況可以啟用。
IBM Turismo——單芯片的12核處理器。替換型處理器在市售和注冊時可以帶有被關(guān)閉內(nèi)核配置。
PowerCore CP1——POWER8是修訂安全特性后的一個變種,由于美國和中國之間的出口限制,將在紐約East Fishkil的Global Foundries(IBM之前的工廠)生產(chǎn)。該產(chǎn)品已在2015年發(fā)布。
針對該款功能強大的服務(wù)器平臺,全球多家知名系統(tǒng)開發(fā)商在解決方案發(fā)布之初就已經(jīng)開始投入巨資開發(fā)自己的 POWER8系列產(chǎn)品,在服務(wù)器市場搶占先機。其中啟動比較早的有以下公司及其產(chǎn)品:
6.1 IBM開發(fā)的3大系列產(chǎn)品線
6.1.1 擴展型服務(wù)器
支持雙芯片模塊的1個或2個插座有2個6核處理器的 POWER8?!癓”版本只運行 Linux,而其他版本運行AIX、IBM i和Linux。典型機型如:
①Power Systems S812L:1×POWER8,DCM(4、6或 8核心),2,U;Power Systems S814。②1× POWER8,DCM(6或8核心),4,U或tower。③Power Systems S822 和 S822L:1×(2×)POWER8 DCM (6、10、12或 20核心),2,U。④Power Systems S824和 S824L:1×(2×)POWER8 DCM(6、8、12、16或24核心),4,U。
6.1.2 企業(yè)級服務(wù)器
支持節(jié)點具有4套處理器插槽,各載8、10或12核心模塊,最多的16套處理器插槽,128個內(nèi)核和內(nèi)存 16,TB。這些機器能夠運行 AIX、IBM i或 Linux操作系統(tǒng)。
①Power Systems E850,2×POWER8、3×DCM或 4×POWER8 DCM(8、10或 12核心),4,U;②Power Systems E870(見圖1),1×5,U或2×5,U節(jié)點,4套處理器插槽,8~10 核心,POWER8一體化芯片設(shè)計,最高支持到 80核心;③Power Systems E880,1×5,U、2×5,U、3×5,U或4×5,U節(jié)點,每節(jié)點4套處理器插槽,8~12核心,POWER8一體化芯片設(shè)計,最高支持到192核心。
圖1 IBM Power E870Fig.1 IBM Power E870
6.1.3 高性能計算機
典型機型如:① Power Systems S812LC(Open-Power),1×POWER8,SCM(8或 10核心),2,U;②PowerSystems S822LC“Firestone”(OpenPower),2×POWER8,SCM(8或 10核心),2,U,由制造商Wistron 為 IBM制造,兩顆 Nvidia K80,GPUs和達(dá)1,TB容量的自由選配DDR3,RAM。
6.2 泰安電腦
①SP010GM2NR,集成POWER8一體化芯片設(shè)計,ATX 架構(gòu)的主板;② Palmetto GN70-BP010 (OpenPower參考設(shè)計用的主板),2,U,4核心POWER8 SCM,4,RAM插槽,基于泰安設(shè)計的主板;③Habanero TN-71-BP012.2,U,帶有8核心POWER8 SCM,32 支RAM插槽。
6.3 谷歌
谷歌曾展示過內(nèi)部使用的設(shè)計方案,帶有兩套處理器插槽。
6.4 浪潮電子信息
浪潮已經(jīng)與IBM達(dá)成協(xié)議,采用POWER8平臺和相關(guān)技術(shù),開發(fā)服務(wù)器硬件。產(chǎn)品定型為:4,U服務(wù)器,兩套 POWER8處理器插槽。
6.5 Cirrascale
RM4950:4,U,4核心POWER8,SCM帶有4顆Nvidia Tesla K40加速器,基于泰安電腦的主板方案。
6.6 ,ZoomNetcom
①RedPOWER C210和C22,2,U和4,U,服務(wù)器帶有兩套POWER8處理器插槽和 64支RAM插槽;②RedPOWER C310和C320,2U和4U,服務(wù)器帶有兩套CP1插槽。
6.7 Rackspace
Barreleye:1,U,雙處理器插槽,32支 RAM 插槽,基于Rackspace的開放平臺及其OnMetal服務(wù)。
另外還有創(chuàng)和 OP:1,X(1,U,單處理器插槽,32支RAM 插槽)等產(chǎn)品已經(jīng)開發(fā)成功。
包括縱向擴展型(Scale-up)和橫向擴展型(Scaleout)兩種方案,如圖2所示。
圖2 縱向擴展型和橫向擴展型方案示意Fig.2 Schematic of Scale-up and Scale-out solutions
縱向擴展型,就是當(dāng)舊方案已無法滿足應(yīng)用需求時,重新采購新方案,切換到新方案后,淘汰舊方案。橫向擴展型,就是當(dāng)舊方案已無法滿足需求時,在保留原有舊方案基礎(chǔ)上,增加新方案投資,新舊方案同時運行。
關(guān)于系統(tǒng)架構(gòu)選型,用戶在采購之初很難準(zhǔn)確預(yù)測未來數(shù)據(jù)增長的速度和總量,因而往往不得不采購比自己目前實際需求容量更大的存儲,這就導(dǎo)致兩個問題,一是預(yù)算的浪費,很多存儲空間都是為未來數(shù)據(jù)增長采購的,花了 10,TB的錢,但是可能只利用了5,TB,另外5,TB的資金白白閑置。另一個問題是,隨著時間推移,數(shù)據(jù)增長,數(shù)據(jù)量超過了 10,TB。按照過去Scale-up的理念,解決方案就是購買更大容量的存儲,則難免面臨數(shù)據(jù)遷移的問題,用戶必須停機遷移數(shù)據(jù),意味著服務(wù)的中斷。而Scale-out架構(gòu)解決了這個矛盾。用戶按需采購存儲,一旦容量不夠了,再購置一臺接到原有存儲上即可,所以橫向擴展型方案對于連續(xù)運行型需求有絕對優(yōu)勢。■
[1] IBM Announces POWER8 with OpenPOWER Partners[EB/OL]. http://www.moorinsightsstrategy.com/wpcontent/uploads/2014/04/IBM-Announces-POWER8-with-OpenPOWER-Partners-by-Moor-Insights-and-Strategy. Pdf.
[2] IBM POWER8[EB/OL]. http://komplex-it.dk/media/ 128719/ibm_power8. pdf.
[3] POWER8[EB/OL]. https: //en.wikipedia.org/wiki/ POWER8.
[4] Life at the Intersection:OpenPOWER,Open Compute,and the Future of Cloud Software & Infrastructure[EB/OL]. http://openpowerfoundation.org/blogs/lifeat-the-intersection-openpower-open-compute-and-thefuture-of-cloud-software-infrastructure.
[5] IBM to help China's Inspur to design servers [EB/OL]. https://www.yahoo.com/news/ibm-help-chinas-inspurdesign-servers-123642000--finance.html?ref=gs.
A Brief Introduction of IBM POWER8
LIU Xianghong,ZHANG Shiguang,LI Yinfeng
(HongFuJin Electronic Precision,Tianjin 300462,China)
With the rapid development of cloud computing and big data industry,data processing and storage technology are also growing vigorously.IBM,as a pioneer of server industry,is not willing to let Intel occupy the data processing market,therefore it launched POWER8,an open platform,for external customers in March 2015.To give server developers and users a quick overview of the series processors,this paper analyzes technical features and product characteristics of POWER8 to offer reference for rapid comparison and selection.
big data;server;core processor;IBM;POWER8
TP368.5
A
1006-8945(2016)07-0012-04
2016-06-02