在再次位居最新TOP500排名榜首,喜獲世界超級計算機(下稱“超算”)“三連冠”后,“天河二號”于6月30日在廣州正式投入使用,進入應(yīng)用階段。此外,“天河二號”已自7月起進行一期系統(tǒng)升級,預(yù)計將在明年底前完成全系統(tǒng)建設(shè)并投入運行。與“銀河”系列定位不同的是,“天河”系列主要針對民用市場,這也意味著“高大上”的“天河二號”即將走入尋常百姓家,為社會提供服務(wù)。
算一秒相當(dāng)于全民算千年
6月23日,在德國萊比錫舉行的HPC國際會議上發(fā)布了超算的最新排名,中國國防科學(xué)技術(shù)大學(xué)研制的“天河二號” 以比第二名美國“泰坦”快近一倍的速度再次問鼎冠軍,榮獲全球超算運算性能“TOP500項目”的“三連冠”。有美國專家預(yù)測,在一年時間內(nèi),“天河二號”還會是全球最快的超算。
“天河二號”由16000個浪潮的節(jié)點組成,累計共有32000顆主處理器和48000個協(xié)處理器,總計有312萬個計算核心。目前“天河二號”一期主機系統(tǒng)已調(diào)試完成并投入使用,同時還將開始二期系統(tǒng)的建設(shè)。國家超級計算廣州中心主任袁學(xué)鋒介紹,“天河二號”一期的運算速度為5.49億億次/秒,運算一秒相當(dāng)于全中國人用計算器算一千年,待二期系統(tǒng)建成后,運算速度還將提高一倍,達到10億億次/稱以上。
在普通人看來,要提升計算機的計算能力,似乎只要把多個中央處理器(CPU)“綁”起來就行了。就好像要比10個人的小組工作快10倍,只要找100個人來就行了一樣。在計算機的研發(fā)中,這一過程卻復(fù)雜得多。但中國科學(xué)家只花了4年時間,就把超算的速度從每秒運算速度相當(dāng)于全國13億人連續(xù)計算88年的數(shù)據(jù)提升到了相當(dāng)于全國13億人連續(xù)計算1000年的數(shù)據(jù)。
牛津超級計算中心主任喬·洛克利博士曾評價,雖然中國超算研究的起步較晚,但這剛好提供了一個“很高的起點”:不需要浪費資源去解決一些發(fā)展初期所要面對的瓶頸和難題。美國早在1990年就提出制造千萬億次級巨型計算機,但直到2009年,這一目標(biāo)才得以實現(xiàn)。而僅在幾個月之后,中國的計算機就達到了同樣的目標(biāo)。
袁學(xué)鋒認同喬·洛克利的說法,高起點的確加速了中國超算的進程。但他認為事實上中國一直不缺乏這方面的技術(shù)與人才,早在上世紀(jì)五六十年代就擁有計算機的中國在這方面的發(fā)展原本可以更快一些,只是因為基礎(chǔ)工業(yè)的原因,“我們的芯片跟不上,才導(dǎo)致這方面滯后了,所以全球經(jīng)濟一體化也是加速進程的一個重要原因?!?/p>
算天算地算人算宇宙
自2013年6月研制成功后,“天河二號”在國防科技大學(xué)呆了僅僅3個月就被匆匆運往廣州,從裝機、調(diào)試到設(shè)備正式運行,為的就是趕在今年4月1日正式啟用,“大家都很著急,希望‘天河二號能盡快投入使用”,袁學(xué)鋒感慨道,以至于廣州超級計算機中心的辦公大樓里除了兩間會議室裝修完畢外,其他辦公室都是臨時搭建的,甚至一些技術(shù)人員的組建也尚未完成,但這并不影響這臺“超級大腦”幫助人們作出更精準(zhǔn)的天氣預(yù)報、設(shè)計更安全的汽車,或者研發(fā)更有效的藥物等,它正在從各個方面直接或間接影響著每個人的生活。
從4月1日至6月中旬,“天河二號”已經(jīng)收獲了來自全國各地的120多位客戶,華大基因、廣東工業(yè)研究院、北京大學(xué)、中核集團中國原子能科學(xué)研究院、英特爾(中國)有限公司、浪潮集團、華強文化科技集團、中國科學(xué)院計算機網(wǎng)絡(luò)信息中心等“高大上”的企業(yè)都在其中。
袁學(xué)鋒表示,截至目前,“天河二號”已為用戶提供了300多項專業(yè)服務(wù),特別是在大型基因組組裝和基因測序、生物醫(yī)學(xué)、高通量藥物篩選、污染治理、大型飛機設(shè)計制造、高速列車設(shè)計制造、高超聲速發(fā)動機燃燒模擬等工程中發(fā)揮了重要的支撐作用。“計算的內(nèi)容可以概括為算天、算地、算人、算宇宙?!痹瑢W(xué)鋒說。
具體來說,例如中國商用飛機設(shè)計有限公司北京研究中心利用約2.4萬CPU核開展了大型民機全參數(shù)氣動優(yōu)化設(shè)計,在“天河二號”計算6天,完成了其自身計算平臺約需2年的工作量,極大地提高了工作效率。在其他應(yīng)用上,汽車研發(fā)機構(gòu)可使用它進行反復(fù)穆尼安全碰撞試驗,減少設(shè)計誤差,提高汽車的質(zhì)量和安全性能,原本要使用20臺汽車碰撞的試驗,現(xiàn)在也許只需要使用兩到三臺就能達到最高標(biāo)準(zhǔn)。制藥企業(yè)在藥物研發(fā)中使用它對所有可能的分子組合進行高速測試,從而篩選出十幾種甚至幾十種藥物進行實驗。超算出現(xiàn)之前,開發(fā)一種新藥需經(jīng)過原理研究、動物實驗、志愿者實驗等步驟,很多東西需要在現(xiàn)實中大量、反復(fù)地試驗,整個研制周期往往長達十余年,耗費的時間與精力可能不亞于登月工程。如今,很多基礎(chǔ)性的實驗和計算工作可以通過超算模擬完成,研制周期可大大縮減,一種新藥三到五年就能研制出來,而且也不用犧牲大量小白鼠了。動漫企業(yè)和影視公司未來都將是“天河二號”的???,因為隨著4K電視的普及,對影視、動畫等的精度要求都將更高,普通的計算機根本無法達到渲染要求。一些金融機構(gòu)也可以使用它對股票期貨的投資進行詳細模擬計算,從而將行動建議精確到“幾分幾秒出手”。
袁學(xué)鋒解釋道,實際上“天河二號”是在創(chuàng)造一個和物理世界完全一樣的虛擬數(shù)字世界,就像美國大片《機械戰(zhàn)警》中的測試場景一樣,通過和物理世界完全一樣的虛擬數(shù)字世界去測試它的速度與反應(yīng)。
普通用戶每天只需24元
此前有科學(xué)家認為,像“天河一號”這樣的千萬億次級超算,由于CPU之間的相互協(xié)調(diào)需要大量能耗,普通程序未必能體現(xiàn)出它的強大能力,要充分發(fā)揮它的優(yōu)勢,所需要的計算量一定要具有相當(dāng)規(guī)模,否則就是“大炮打蚊子”。這是否意味著無論運算速度還是性能都比“天河一號”強大很多的“天河二號”也不應(yīng)該是普通玩家的“菜”?
對此袁學(xué)鋒并不贊同。他一直強調(diào),“天河二號”的使用并不局限在廣州地區(qū)。事實上,它還提供了24小時的網(wǎng)絡(luò)遠程應(yīng)用服務(wù)。人們可以在得到超級計算中心的授權(quán)之后,從個人電腦通過互聯(lián)網(wǎng)連接到“天河二號”,上傳自己的程序,下載運算數(shù)據(jù),從而“使有興趣的大、中學(xué)生也可以進行課題研究”。
只是目前來看,使用超算仍有門檻,非專業(yè)人士進入比較困難,但在袁學(xué)鋒暢想的未來中,超算絕不僅僅是技術(shù)玩家的專利。
對于酷愛科幻電影的袁學(xué)鋒而言,“天河二號”的開局讓他滿意,但遠不滿足。在眾多超級英雄中,他最看好小羅伯特·唐尼所飾演的鋼鐵俠,那個用手指在屏幕上指指點點然后設(shè)計出一套又一套帥氣盔甲的超級英雄也是他的目標(biāo),只是目前尚未達成,他希望有更多民間高手能一起來實現(xiàn)。
在英國曼徹斯特大學(xué)做科研時,袁學(xué)鋒就開始接觸3D打印,他會把一些虛擬數(shù)據(jù)利用3D打印出來做科學(xué)研究,但他發(fā)現(xiàn)自己的學(xué)生有時會用這些儀器打印私人自制的鑰匙扣、杯子等,從那時起,他就開始有了這個想法,“天河二號”不僅只會做運算,還會配有3D打印等“一條龍”設(shè)施。
至于費用方面,是否普通人也能用得起?袁學(xué)鋒算了一筆賬,按10核/小時一元錢算,普通用戶如果使用一天也才24元錢,價格甚至比使用個人電腦一天的費用還要低。
功耗大散熱難缺軟件
“天河二號”在一年半內(nèi)連續(xù)三次登頂TOP500,它的峰值運算速度33.86 petaflop/s,短時間內(nèi)其他超算難以對它構(gòu)成挑戰(zhàn)。但TOP500衡量的只是浮點計算能力,超算的基準(zhǔn)測試排名還有解析數(shù)據(jù)的Graph500和環(huán)境影響的Green500,而“天河二號”在這兩方面沒有任何優(yōu)勢。
一些研究人員表示,“天河二號”運營成本高,且缺乏相關(guān)軟件,對研究的助益有限?!疤旌佣枴钡哪芰εc它的實用性不成正比。
專家表示,超算發(fā)展目前面臨的首要挑戰(zhàn)是功耗控制難導(dǎo)致的高成本。目前的集成水平和此前相比并沒有根本性改善,以現(xiàn)有技術(shù),極超級電腦的功耗會超過20兆瓦,建造費用將超過2億美元,這將帶來一系列技術(shù)和運營問題。例如“天河二號”全速運算的話,電費為每日40萬人民幣至60萬人民幣之間,一年下來僅電費一項就超過1.5億元。如果還是按照老思路,依靠增加規(guī)模制造出極級超算,功耗可能會達到50兆瓦至100兆瓦,需要一個專門的核電站來給它供電,這樣的超算顯然沒有實用價值。同時這樣密集排列的大功率處理器,也會帶來無法解決的散熱問題。因此國際上公認的極級超算標(biāo)準(zhǔn)是,功耗必須控制在20兆瓦內(nèi),這就要求在制造工藝上有革命性突破。
另一個阻礙是缺乏軟件。“天河二號”迄今的投資主要用于硬件開發(fā),客戶必須自己編寫程序才能使用。中國科學(xué)院計算機網(wǎng)絡(luò)信息中心副主任遲學(xué)斌表示,“天河二號”就運算能力來說處于世界前沿,但功能仍遠落后于美國和日本的超算。遲學(xué)斌表示,一些用戶或需要多年甚至十年時間編寫必要的代碼??煽啃砸彩莻€問題,將來超級電腦并發(fā)部件將超過10億,以現(xiàn)在的故障率,平均每過10至20分鐘系統(tǒng)就會報一次硬件錯誤,而每次處理錯誤需要半個小時。這顯然也是無法容忍的。
中國計算機學(xué)會高專委秘書長、中科院計算所研究員張云泉表示,超算還面臨數(shù)據(jù)的訪問速度限制。現(xiàn)在超級電腦運行的速度愈來愈快,但現(xiàn)有存儲器讀取數(shù)據(jù)的速度卻無法跟上需求,這也成為超級電腦性能提升的瓶頸。因此美國有一批教授認為應(yīng)該反思超算的發(fā)展方向,改變追求峰值運算速度的模式,而注重實用價值。例如放棄通用型超算,而根據(jù)實際需求定制超算。
“全球計算機的發(fā)展非常快,一年時間可能什么都變了。”袁學(xué)鋒認為,“真正重要的還是把它們推廣應(yīng)用,產(chǎn)生實際效益?!保ū究C合)