GPU盛開
高性能計算
GPU與CPU的結合成為未來平臺的核心——異構系統(tǒng),它能提供一種創(chuàng)新的解決方案,更多的異構的系統(tǒng)將面世。
在過去的幾年里,高性能計算進入一個快速發(fā)展時期。一方面是集群技術的發(fā)展,使得高性能計算的成本降低,另外一方面,多核以及GPU的出現(xiàn),讓高性能計算迎來了新的機遇和挑戰(zhàn)。
當前,HPC發(fā)展中最重要的技術應當是GPU的發(fā)展。目前,使用GPU的異構計算在高性能計算中已是一種主流技術。比如最近的TOP500前五名有三臺機器都是GPU異構集群。美國橡樹嶺國家實驗室剛宣布了他們計劃在2012年用GPU來搭建一臺峰值20 Pflop/s的集群。在我國,天津超算中心2010年使用了7168個GPU搭建了峰值4.7 Pflop/s,Linpack實測性能2.57 Pflop/s的天河1A系統(tǒng)。這套系統(tǒng)在2010年的Supercomputing大會上排在了TOP500的第一名。
對于GPU的支持者看來,GPU具有更強的浮點運算能力、更大的帶寬等諸多優(yōu)勢,連晶體管數(shù)量也是GPU略勝一籌。性能和復雜性不斷提升的GPU自然不甘繼續(xù)做CPU的配角,他們甚至毫不掩飾地提出:“未來GPU將越來越多地取代CPU的數(shù)據(jù)處理職能,未來GPU才是計算機的核心部件!”
從體系結構的觀點來看,CPU本質(zhì)上是一種針對延遲(latency)優(yōu)化的體系結構。它的首要設計目標是優(yōu)化單線程的執(zhí)行性能。與此對應的趨勢是針對吞吐量(throughput)優(yōu)化的眾核體系結構。比如Sun的Niagara處理器,IBM的Cell處理器,以及nVIDIA的圖形處理器(GPU)。簡單地說,吞吐量優(yōu)化處理器的策略是降低單線程的性能但以在眾核上同時運行大量線程的方式來提高總體處理能力(高吞吐量)。因此吞吐量優(yōu)化處理器的總體性能往往比延遲優(yōu)化處理器高得多。
在并行計算成為必須之后,由于吞吐量優(yōu)化處理器更高的性能,很多開發(fā)人員開始認識到它們是一種對很多并行應用更適合的體系結構。所以近年吞吐量優(yōu)化處理器在通用并行計算中變的越來越重要。
GPU與CPU的結合成為未來平臺的核心——異構系統(tǒng)。它能提供一種創(chuàng)新的解決方案,而更多的異構的系統(tǒng)將面世。這些已面世系統(tǒng)顯示了性能上的優(yōu)勢。然而異構平臺同樣面臨著挑戰(zhàn):低程序員生產(chǎn)力,缺乏通用性,缺少集成工具和開發(fā)庫,以及非常敏感的性能穩(wěn)定性。這些問題會為應用程序的開發(fā)團隊和他們的科
而與此同時,Exaflop(百萬萬億次)級高性能超級計算機面臨的挑戰(zhàn)也成為人們關注的問題,這些挑戰(zhàn)包括傳統(tǒng)的性能、擴展性和生產(chǎn)力,還有新出現(xiàn)的能效問題和可靠性問題。
此外是節(jié)能技術的發(fā)展。隨著能耗越來越重要,TOP排行榜已經(jīng)把能耗作為很重要的考核。其中如何冷卻服務器也是個挑戰(zhàn)。事實上,今天風冷數(shù)據(jù)中心里50%以上的能耗和碳排放不是來自計算單元本身,而是源于為避免處理器過熱而安置的散熱系統(tǒng)。
一些公司研發(fā)了熱水冷卻技術。比如在2010年7月初,IBM公司在為蘇黎世的瑞士聯(lián)邦理工學院(ETH Zurich)建造的超級計算機Aquasar上就使用了這一技術。在該案例中,60攝氏度的溫水經(jīng)過微型管道流經(jīng)炙熱的CPU,將CPU的溫度控制在可接受的85度以內(nèi),最后排出的水溫達到65度,這些熱水隨后用來為學校里的建筑供暖。