11月12日,第40屆全球高性能計算機500強(TOP500)排行榜發(fā)布。這次的榜單與以往相比略顯不同,一方面今年是這份榜單誕生的20周年紀念,此外,這回的榜單上出現(xiàn)了與以往不同的新生力量。
在最新TOP500排行榜上,有379套上榜系統(tǒng)采用了英特爾處理器,榜單中還新增了 7套基于英特爾至強融核協(xié)處理器的上榜系統(tǒng),其中包括排名第七位的Stampede系統(tǒng),其計算速度達到了2.66PFlops(千萬億次浮點計算每秒)。至強融核協(xié)處理器基于英特爾集成眾核(MIC) 架構(gòu),在高度并行化的應用方面能夠提供出色的性能。在英特爾公布的一份資料中,中石油南京物探院總工程師趙改善介紹,該院的疊前深度偏移應用在至強融核上的性能提升了2.53倍。
挑戰(zhàn)GPGPU
在2010年和2012年分別登上TOP500榜首的“天河一號”和“Titan”都采用了通用計算圖形處理器(GPGPU)加速的體系架構(gòu)。在這次的榜單上有62套系統(tǒng)采用了這種混合架構(gòu)加速的體系架構(gòu),比上一屆的榜單多出了4套。
采用協(xié)處理加速的體系架構(gòu)在高性能計算領(lǐng)域很早就已出現(xiàn),只是當天河一號采用這種架構(gòu)一舉奪得榜首位置后,引起了更多人的注意。圣地亞哥超算中心副主任Richard Moore在2012高性能計算專家委員會中國研討會上表示,天河一號的成功的確讓包括美國在內(nèi)的眾多高性能計算專業(yè)人士眼前一亮,未來會有越來越多帶有加速器的高性能計算系統(tǒng)出現(xiàn)。不過他認為,要想把各種混合架構(gòu)的系統(tǒng)用好,最關(guān)鍵的是在軟件編程方面下更多的功夫,提高不同應用在混合架構(gòu)上的效率。“而至強融核由于可以采用與傳統(tǒng)通用處理器同樣的編程工具,和其他的異構(gòu)系統(tǒng)相比,在編程效率上有很大的提高。圣地亞哥超算中心的相關(guān)人員也在通過TACC的系統(tǒng),對至強融核進行相應的研究工作?!?/p>
正如Richard所說,至強融核最吸引人之處,就是它能夠充分利用為英特爾架構(gòu)提供的、已被用戶熟知的編程語言、并行模式、技術(shù)和開發(fā)人員工具,這有助于確保軟件公司和企業(yè)的IT部門加大對并行代碼的利用,且無需為與加速器相關(guān)的、針對硬件的特定編程模式重新培訓其開發(fā)人員。
英特爾目前已經(jīng)發(fā)布了Parallel Studio XE和 Cluster Studio XE等軟件工具,來幫助科學家和工程師們優(yōu)化其代碼,以便充分利用至強融核。這些工具能夠通過至強融核和至強E5處理器共用的編程語言和模型對代碼進行優(yōu)化,從而使應用不但能從至強融核的數(shù)十個內(nèi)核中獲益,亦可從至強E5處理器更為高效的多線程資源利用上獲得幫助。
目標不止HPC
最近一年半以來,英特爾已經(jīng)在全球挑選了近百家合作伙伴來對至強融核進行相應的測試。其中在中國就包括中石油南京物探院、BGP東方物探、中科院計算技術(shù)研究所、中科院過程研究所等在內(nèi)的多家高性能計算典型用戶。
英特爾公司副總裁兼數(shù)據(jù)中心及互聯(lián)系統(tǒng)事業(yè)部總經(jīng)理柏安娜表示:“英特爾至強融核協(xié)處理器是英特爾公司創(chuàng)新史上的一大成就,它將推動我們在研究和探索領(lǐng)域再創(chuàng)新高,并重申了我們在實現(xiàn)百億億級計算方面的承諾。英特爾至強處理器產(chǎn)品家族和英特爾至強融核協(xié)處理器的強強聯(lián)合可提供無與倫比的性能、效率和可編程性,從而將改變高度并行化應用所能達到的范圍和規(guī)模。利用該技術(shù)作為高性能計算的全新基石,將使諸如提前 21 天精確預測氣候模式,以及找到治愈疾病的新方法等現(xiàn)實世界挑戰(zhàn)的破解變得更具可能性?!?/p>
如果追溯至強融核的發(fā)展路徑,可以很清楚地看到英特爾在MIC技術(shù)方面的發(fā)展路徑。可以感到,英特爾對于MIC的應用并不局限在高性能計算一方面。2011年7月,英特爾就曾經(jīng)在無錫正式宣布在中國引入眾核研究社區(qū)(MRAC),該社區(qū)的目標就是與中國研究者一起共同探討眾核并行編程領(lǐng)域所面臨的關(guān)鍵性問題和研究方向。而至強融核所具有的獨立IP地址、支持Linux操作系統(tǒng)等特性,讓人對其應用范圍有了更多的遐想。
據(jù)悉,除了兩款用戶定制化的型號外,英特爾會向市場推出3100和5110P兩款至強融核產(chǎn)品。3100將能夠提供超過1000 Gigaflops(即每秒1萬億次浮點計算)的雙精度浮點計算性能,并支持容量最高達6GB、帶寬最高達240GB/秒的內(nèi)存,以及內(nèi)存錯誤校正碼(ECC)等一系列可靠性特性,功耗(TDP)范圍在 300瓦以內(nèi)。5110能夠?qū)崿F(xiàn)1011 Gigaflops(即每秒1.01萬億次浮點計算)的雙精度浮點計算性能。,支持容量和帶寬分別高達8GB和320GB/秒的GDDR5內(nèi)存,功耗(TDP)為225瓦。
之前在英特爾與中科院計算所成立聯(lián)合實驗室的揭幕典禮上,中科院計算所所長孫凝暉表示,“至強融核只有不局限在高性能計算領(lǐng)域,才會有更強的生命力。”據(jù)悉,雙方的合作就是針對 MIC平臺的編程與優(yōu)化、應用程序調(diào)優(yōu)以及開發(fā)數(shù)據(jù)中心評估基準方面的研究。孫凝暉還專門強調(diào),希望將至強與至強融核混合架構(gòu)方面的研究成果用于深入探索高效的數(shù)據(jù)中心服務器體系結(jié)構(gòu),開發(fā)相應的硬件和軟件系統(tǒng)。
鏈接
走近Stampede
位于榜單第七位的超級計算機“Stampede”是新上榜的系統(tǒng),安裝在美國德州先進計算中心(TACC)。這臺大家伙由6200臺服務器組成,采用了英特爾至強E5-2680和至強融核協(xié)處理器(Xeon Phi),計算速度達到2.66Pflops(千萬億次浮點計算每秒)。TACC在高性能計算領(lǐng)域,主要針對千萬億次的代碼優(yōu)化、計算流體動力學研究、下一代網(wǎng)格的測試、生物信息學的并行算法等方面展開了研究。