文/本刊記者 王左利
HPC遭遇三重門
文/本刊記者 王左利
云計(jì)算、異構(gòu)平臺、學(xué)科應(yīng)用是現(xiàn)在高校建高性能計(jì)算中心無法逃避的三大難題。前兩者,是時(shí)代變革的新趨勢,后者,則是歷史難題的新挑戰(zhàn)。
今年個(gè)人電腦迎來了30周歲的生日,個(gè)人電腦的強(qiáng)大兄弟——超級計(jì)算機(jī),則已走過70年的風(fēng)風(fēng)雨雨。比起現(xiàn)在的電腦來,初期的超級計(jì)算機(jī)運(yùn)算非常緩慢;僅在過去25年,計(jì)算機(jī)的速度和運(yùn)算能力就提升了一百萬倍。
超級計(jì)算機(jī)已經(jīng)被使用到各個(gè)領(lǐng)域,能源探索、氣象服務(wù)、物理實(shí)驗(yàn)、圖像渲染……幾乎你能想到的領(lǐng)域,都可以有高性能計(jì)算的參與。而每年兩度的全球高性能計(jì)算TOP500強(qiáng)榜單,也讓各國計(jì)算機(jī)精英為之折腰。
2011年6月,最新TOP500高性能計(jì)算機(jī)榜單上,前三甲分別是:K電腦,8.2千萬億次/每秒,日本;天河-1A,2.57千萬億次/每秒,中國;Jaguar,1.76千萬億次/每秒,美國。K的運(yùn)算速度甚至比排名第二至第六的計(jì)算機(jī)運(yùn)算速度總和還要快。各國角遂超級計(jì)算機(jī)排名的背后,折射出超級計(jì)算機(jī)之熱。
在中國,從2009年以后,高性能計(jì)算迎來了一個(gè)新的歷史發(fā)展時(shí)期。這與不停建設(shè)中的城市高性能計(jì)算中心分不開,也與一度奪得全球TOP500榜首的天河一號分不開。但最實(shí)質(zhì)的原因是,隨著中國經(jīng)濟(jì)的飛速發(fā)展,對科研的投入越來越大,高性能計(jì)算作為推動學(xué)科發(fā)展的有力杠桿的地位得到共識。
高校作為科研創(chuàng)新前沿陣地,顯然擁有極大需求。而且,從國外的經(jīng)驗(yàn)來看,許多高校的高性能計(jì)算在世界上擁有很高的聲譽(yù)。比如,美國伊利諾伊大學(xué),德國斯圖加特大學(xué),日本的東京工業(yè)大學(xué)等。我國的天河一號也產(chǎn)自國防科技大學(xué)。高性能計(jì)算在高校發(fā)展很快,主要原因在于高校有更多的用戶,許多學(xué)科,無論是化學(xué)、物理、生物、地球、航空、海洋等,都給高性能計(jì)算提供了用武之地。從這個(gè)趨勢來看,未來高校對高性能計(jì)算中心的重視只會加強(qiáng),不會減弱。
從這個(gè)角度上,也就不難理解何以從2009年開始,高校的高性能計(jì)算中心風(fēng)生水起,進(jìn)入一個(gè)新的發(fā)展時(shí)期了。
處理器芯片將不再由架構(gòu)相同的內(nèi)核組成,而是會由多種架構(gòu)的內(nèi)核組成,分別負(fù)責(zé)加密、視頻渲染和網(wǎng)絡(luò)等任務(wù)。
2010年起,隨著云概念的深入,一些高校開始構(gòu)建基于云的平臺。與此同時(shí),高性能計(jì)算中心的規(guī)劃也正在進(jìn)行——主要命題是:高性能計(jì)算中心作為一個(gè)公共的服務(wù)平臺,在新的形勢下,是否要融入到學(xué)校的整體信息化結(jié)構(gòu)中來?還是讓其孤獨(dú)地獨(dú)立成篇?
以上海交通大學(xué)為例,其正在做一個(gè)面向全校師生進(jìn)行網(wǎng)絡(luò)服務(wù)的云平臺,將Web服務(wù)、郵件服務(wù)、論壇等通通納入云服務(wù)平臺中。那么,高性能計(jì)算平臺呢?是否也納入到總體的云平臺上?
對于此,是有爭議的。一方面,云計(jì)算采用的關(guān)鍵技術(shù)是虛擬化,這樣可以使資源按需調(diào)度,但也勢必導(dǎo)致犧牲一部分速度。而高性能計(jì)算則追求“高速”,兩者看似矛盾。另外一方面,人們又期望以云計(jì)算的靈活的彈性應(yīng)用模式來解決公共高性能計(jì)算平臺的系統(tǒng)管理問題。中國工程院院士李國杰認(rèn)為,“云計(jì)算的易用性會影響傳統(tǒng)的HPC計(jì)算模式,按需的云計(jì)算給HPC提供了更易交互的計(jì)算模式。如同幾年前用大眾化的PC服務(wù)器搭建集群以及最近用GPU加速科學(xué)計(jì)算一樣,云計(jì)算對于HPC也是一次模式轉(zhuǎn)變。”那么,HPC到底可不可以采用云計(jì)算的架構(gòu)?
針對此,上海交通大學(xué)做了初步的嘗試,他們提出了一種融合高性能計(jì)算、網(wǎng)格計(jì)算和云計(jì)算的新型計(jì)算框架——高性能彈性計(jì)算(HPEC),可以跨域管理和調(diào)度多個(gè)云計(jì)算資源,支持GPU和眾核異構(gòu)計(jì)算環(huán)境,用戶可以自主靈活地申請和管理計(jì)算、存儲和網(wǎng)絡(luò)資源,這些資源可以是虛擬化的或者是直接的物理資源,支持High Performance Computing Platform as a Serv(iceHPC PaaS)多節(jié)點(diǎn)集群及上層軟件的快速部署,同時(shí)支持計(jì)算密集(MPI)和數(shù)據(jù)密集(Map/Reduce)應(yīng)用等。
而北京工業(yè)大學(xué)的高性能計(jì)算平臺采用的也是云的架構(gòu)——“我們覺得可以采用云架構(gòu),原因在于我們是一個(gè)公共的平臺,并非針對一個(gè)領(lǐng)域,所以資源的調(diào)度也很重要。”北京工業(yè)大學(xué)邸瑞華教授表示。
在當(dāng)前看來,用云計(jì)算的思路去實(shí)施高性能計(jì)算,可能更多的是一種取舍,當(dāng)你需要的是不惜一切追求高速時(shí),顯然,采用了云計(jì)算就與你最初的理想相背離了。反之亦然。
今天,當(dāng)高校進(jìn)行超級計(jì)算機(jī)采購的時(shí)候,會發(fā)現(xiàn),整個(gè)市場上開始在提供一個(gè)異構(gòu)的平臺。這就是GPU加CPU的融合平臺。
一位曾在Intel工作,現(xiàn)在又在A M D工作的資深技術(shù)人員表示,未來的處理器將會結(jié)束內(nèi)核之戰(zhàn),轉(zhuǎn)向異構(gòu)平臺之戰(zhàn)。他預(yù)測,處理器新的競爭熱點(diǎn)是異構(gòu)計(jì)算,處理器芯片將不再由架構(gòu)相同的內(nèi)核組成,而是會由多種架構(gòu)的內(nèi)核組成,分別負(fù)責(zé)加密、視頻渲染和網(wǎng)絡(luò)等任務(wù)。
這句話是有跡可循的。使用GPU的異構(gòu)架構(gòu)在高性能計(jì)算中已是一種主流技術(shù)。比如最近的TOP500前五名中有三臺機(jī)器都是GPU異構(gòu)集群。美國橡樹嶺國家實(shí)驗(yàn)室剛宣布了他們計(jì)劃在2012年用nVIDIA的GPU來搭建一臺峰值20 Pflop/s的集群。在我國,天津超算中心2010年使用了7168個(gè)nVIDIA的GPU搭建了峰值4.7 Pflop/s,Linpack實(shí)測性能2.57 Pflop/s的天河1A系統(tǒng)。這套系統(tǒng)在2010年的Supercomputing大會上排在了TOP500的第一名。
由此可見,未來整個(gè)市場將向異構(gòu)平臺遷移,高校的HPC采購也不可能跨越這一門檻,而在異構(gòu)平臺下的編程,將會變成一個(gè)新問題。
上海交通大學(xué)網(wǎng)格中心副主任林新華表示, 異構(gòu)與異構(gòu)眾核的硬件更新?lián)Q代頻率驚人,甚至超越了CPU的摩爾定律,因此軟件研發(fā)將不可避免地會在編程策略、目的和工具上遇到各自的挑戰(zhàn)。
很多人都看好GPU,但是其昂貴的編程和代碼維護(hù)正在成為越來越明顯的絆腳石。所以有越來越多的精力被放到異構(gòu)平臺的建立上。
nVIDIA在2007年推出了在GPU上的并行編程模型CUDA。除了CUDA外,開發(fā)人員也還有很多其它選擇。如OpenCL是一個(gè)類似CUDA的GPU編程標(biāo)準(zhǔn)。微軟也推出了針對GPU的編程語言DirectCompute以及即將推出的C++ AMP語言。PGI Fortran允許開發(fā)人員直接用Fortran的語法寫GPU kernel。PGI accelerator類似OpenMP, 開發(fā)人員只需要在耗時(shí)的循環(huán)外插入一些pragma,就能將其移植到GPU上。HMPP是類似PGI accelerator的另一種解決方案。PyCUDA是Python的CUDA接口。此外,PGI最近還發(fā)布了CUDA-x86。這個(gè)產(chǎn)品可以把CUDA代碼編譯在x86 CPU上執(zhí)行。這樣一個(gè)代碼版本就可以既在GPU又在CPU上運(yùn)行。
事實(shí)上,目前的編程工具都不是太好,體現(xiàn)在技術(shù)人員需要很大的努力才能達(dá)到自己的目標(biāo)?!罢嬲齾柡Φ墓ぞ呤俏覀兒苋菀拙湍苓_(dá)到一個(gè)目標(biāo),而不是費(fèi)盡千辛萬苦才能達(dá)到一個(gè)目標(biāo),這樣的話,我們只能說這個(gè)人很厲害,而不是這個(gè)工具厲害?,F(xiàn)在的異構(gòu)平臺編程工具就是這樣?!绷中氯A說。
“異構(gòu)平臺的優(yōu)勢在于計(jì)算能力的能耗低、性價(jià)比高;挑戰(zhàn)在于大量并行軟件需要為異構(gòu)平臺重新開發(fā),而異構(gòu)多核環(huán)境下并行程序的開發(fā)是非常難的。”中山大學(xué)廣東省計(jì)算科學(xué)重點(diǎn)實(shí)驗(yàn)室高性能計(jì)算應(yīng)用研發(fā)中心主任張永東介紹說,“中山大學(xué)自主研發(fā)的PCF并行編程環(huán)境,簡化了OpenCL的調(diào)用過程,較好地解決了異構(gòu)多核編程的困難?!?/p>
高性能計(jì)算的生命力體現(xiàn)在應(yīng)用。缺少了應(yīng)用,再高的峰值,再快的計(jì)算速度,都是奢華擺設(shè)。
“高性能計(jì)算機(jī)越來越像一臺復(fù)雜而精密的虛擬實(shí)驗(yàn)儀器,人們不僅可以在上面聰明的做實(shí)驗(yàn),還可以進(jìn)行充滿想象力的科學(xué)探索。無論是理論家還是實(shí)驗(yàn)家,不能掌握這個(gè)工具的人就像少了一只手。 ”一位資深人士形象地說。
那么,高性能計(jì)算到底可以給我們解決什么樣的具有挑戰(zhàn)的問題?美國國家橡樹嶺實(shí)驗(yàn)室的美洲豹的任務(wù)可能給我們一點(diǎn)啟發(fā):美洲豹有6大公開應(yīng)用。其中有幾項(xiàng)非常有意思。比如,極端氣候模擬。在地球45億年的歷史中,氣候總在冷熱間徘徊。而通過美洲豹超級計(jì)算機(jī)可以完整、連續(xù)地模擬這個(gè)過程,利用全球氣候模型,提供有關(guān)全球氣候變化根源和影響的珍貴數(shù)據(jù)。
再比如,模仿火山爆發(fā)應(yīng)激氣候?;鹕絿姲l(fā),重力氣溶膠粒子通常會在2至3年之內(nèi)回落。相反,人為排放的有害物質(zhì)長期持續(xù),并可能改變未來的氣候。如果通過超級計(jì)算機(jī)可以模擬運(yùn)行該大氣環(huán)境模型對于火山噴發(fā)的灰塵反應(yīng),便可以預(yù)測出該大氣環(huán)境對于人為長期排放的反應(yīng)。
應(yīng)用的根本是人才。在前不久由教育部科技發(fā)展中心主辦,《中國教育網(wǎng)絡(luò)》雜志承辦,AMD公司獨(dú)家贊助的“2011年高等院校高性能計(jì)算綜合技能及學(xué)科應(yīng)用培訓(xùn)班”上,來自南京農(nóng)業(yè)大學(xué)農(nóng)學(xué)統(tǒng)計(jì)遺傳創(chuàng)新團(tuán)隊(duì)章元明提出:“目前國家對基礎(chǔ)科研的重視力度空前,我們學(xué)院下半年就有2億元的費(fèi)用下?lián)?,目前的難題在于懂生物遺傳相關(guān)知識的人、熟悉高性能計(jì)算特別是異構(gòu)環(huán)境下并行計(jì)算編程的人員非常少?!?/p>
這個(gè)難題怎么去解決?惟有建立有效的人才培養(yǎng)機(jī)制以及合作交流機(jī)制。“目前,計(jì)算機(jī)學(xué)科與其他學(xué)科的結(jié)合甚少,這是必須改變的現(xiàn)狀?!?/p>
南京大學(xué)周會群教授表示,他曾經(jīng)在日本名古屋大學(xué)做過訪問研究員,那時(shí)候,他們整個(gè)實(shí)驗(yàn)室在做關(guān)于醫(yī)學(xué)圖像的研究,比如將CT掃描的結(jié)果建成可以編輯的計(jì)算模型,這需要很專業(yè)的醫(yī)學(xué)知識?!白鲞@個(gè)項(xiàng)目的人,幾乎都是計(jì)算機(jī)專業(yè)的,但是他們會經(jīng)常請醫(yī)生做講座,從而具備了很專業(yè)的知識并應(yīng)用到計(jì)算中?!?/p>
此外,也需要產(chǎn)業(yè)界的推動?!?011年高等院校高性能計(jì)算綜合技能及學(xué)科應(yīng)用培訓(xùn)班”就是由AMD公司發(fā)起,他們希望讓高校的教師更好地掌握OPEN CL,這是一個(gè)很好的開始。但這遠(yuǎn)遠(yuǎn)不夠。事實(shí)上,整個(gè)人才機(jī)制的建立,最根本之處在于大學(xué)教育,只有讓計(jì)算機(jī)學(xué)科與其他學(xué)科充分結(jié)合,建立交叉學(xué)科機(jī)制,才能培養(yǎng)出一大批“多面手人才”。在教育界、學(xué)術(shù)界、產(chǎn)業(yè)界的共同聯(lián)手下,才有高性能計(jì)算人才蓬勃涌現(xiàn)的明天。
目前中國在硬件方面已經(jīng)領(lǐng)先,那么,如何在人才方面不落后?這是一個(gè)比硬件設(shè)計(jì)艱巨得多的任務(wù),更需要社會的關(guān)注。