◎?qū)嵙曈浾吖稄?/p>
在2010超級計算國際會議上,中國國防科學技術(shù)大學研制的“天河一號”二期系統(tǒng),以峰值速度4700萬億次、持續(xù)速度2566萬億次每秒浮點運算的優(yōu)異性能,在國際TOP500組織正式發(fā)布的第36屆世界超級計算機500強排行榜上,位居世界第一。中國,這個有著“算盤王國”之稱的國度,因為“天河一號”神奇的運算速度,首次站到了國際超級計算機世界之巔。消息傳來,“天河一號”的總設(shè)計師楊學軍抑制不住內(nèi)心的喜悅,即興題詩一首:“夢幻天河彈指間,電閃巡地十億年。濱海坐擁飛流急,倚天妙算出奇篇!”
1983年11月,中國首臺“銀河-I”億次巨型計算機在國防科技大學研制成功,實現(xiàn)了中國巨型機“零”的突破。這促使楊學軍報考國防科大的研究生,從事中國高性能計算機的研制。楊學軍在國防科技大學先后獲得碩士、博士學位。他寫的一篇關(guān)于向量巨型機編譯技術(shù)的研究生畢業(yè)論文,曾獲得“銀河-I”總設(shè)計師慈云桂教授的青睞。畢業(yè)留校后,楊學軍很快成為一名出類拔萃的技術(shù)骨干。在“銀河-Ⅱ”十億次巨型計算機研制時,他作為一名技術(shù)人員參與了研制工作,并得到總設(shè)計師周興銘的親自指點。
1992年“銀河-Ⅱ”研制成功,不久,“銀河-Ⅲ”立項上馬。學校宣布任命楊學軍為“銀河-Ⅲ”高性能計算機的總設(shè)計師。那一年,楊學軍才31歲!總設(shè)計師是高性能計算機研制中的“靈魂”人物,學校卻將“銀河-Ⅲ”百億次巨型計算機總設(shè)計師的擔子交給這位31歲的年輕博士。雖然在楊學軍的身后有周興銘、盧錫城等他所敬重的專家教授,有一批支持他的學長、同事,還有在研制“銀河-I”、“銀河-Ⅱ”的技術(shù)積累和工程經(jīng)驗,但對于這個決定,楊學軍仍感到十分意外。
當時,“銀河-Ⅲ”面臨兩個挑戰(zhàn):一是科研隊伍正值換代期;二是技術(shù)難度大。令人欣喜的是,楊學軍沒有辜負領(lǐng)導和導師們的期望,出色地完成了作為總設(shè)計師應(yīng)該完成的任務(wù)。1997年,中國第一臺“銀河-Ⅲ”百億次巨型計算機研制成功,這是“銀河”系列第一臺實現(xiàn)全局共享分布存儲結(jié)構(gòu)的計算機,也是“銀河”系列研制周期最短的一臺機器,從而實現(xiàn)了中國巨型計算機研制路線從向量計算到并行計算的轉(zhuǎn)變,峰值速度實現(xiàn)了從每秒十億次到每秒百億次的突破,極大地縮短了中國巨型機研制與發(fā)達國家的差距。隨著“銀河-Ⅲ”百億次巨型計算機研制成功,楊學軍也成為中國高性能計算機研制的領(lǐng)軍人物。
創(chuàng)新沒有止境。“銀河-Ⅲ”百億次巨型計算機研制成功后,楊學軍率領(lǐng)團隊不斷開拓創(chuàng)新,一步步將中國高性能計算機研制技術(shù)推向了國際前沿,有多項技術(shù)創(chuàng)新處于國際領(lǐng)先水平。
2005年,著眼突破千萬億次超級計算機關(guān)鍵技術(shù),楊學軍將國際上公認的主要技術(shù)難題作為創(chuàng)新的突破口,在團隊中成立多個課題組,組織精干的技術(shù)力量,針對高性能計算發(fā)展的前沿技術(shù)、關(guān)鍵技術(shù)和新興交叉技術(shù)等方面開展基礎(chǔ)研究和前沿探索,相繼突破了大規(guī)??蓴U展共享存儲體系結(jié)構(gòu)等一系列技術(shù)難題,掌握了一批擁有自主知識產(chǎn)權(quán)的關(guān)鍵技術(shù),從而為研制更高性能的超級計算機奠定技術(shù)基礎(chǔ)。
2006年,在國際超級計算機速度還未實現(xiàn)千萬億次,國產(chǎn)超級計算機才剛剛突破10萬億次之時,他們勇敢地站在了突破千萬億次超級計算機系統(tǒng)起跑線上。
2007年11月,美國IBM公司“走鵑”問世,峰值計算速度達到每秒1456萬億次,而此時,楊學軍率領(lǐng)團隊也完成了千萬億次超級計算機系統(tǒng)的相關(guān)技術(shù)攻關(guān)。
當中國將發(fā)展千萬億次超級計算機系統(tǒng)列入《國家中長期科學和技術(shù)發(fā)展規(guī)劃綱要》,楊學軍團隊憑借充分的技術(shù)儲備和可行的研制方案,順利獲得國家“863”計劃重點課題和國家自然科學基金委創(chuàng)新群體項目的支持,研制工作再次提速。
在研制攻關(guān)過程中,楊學軍與團隊創(chuàng)造性地提出了多陣列、可配置、協(xié)同并行體系結(jié)構(gòu),將全系統(tǒng)分為計算陣列、加速陣列、服務(wù)陣列,通過實現(xiàn)“CPU(通用微處理器)+GPU(圖形加速處理器)”的異構(gòu)協(xié)同計算,最大限度提高計算效能、降低能耗、減少費用、加快進度。他帶領(lǐng)科研人員在經(jīng)過了8萬多次實驗后,終于發(fā)現(xiàn)了GPU的內(nèi)在規(guī)律,采用混合語言編程技術(shù),通過融合多種計算資源并對其靈活配置,深入挖掘GPU的并行計算潛力,最終實現(xiàn)了高效異構(gòu)協(xié)同運算,使GPU的計算效率由20%逐步提升到70%,創(chuàng)造了一個世界奇跡。
與此同時,其他課題組在楊學軍的帶領(lǐng)下相繼突破了高速率可擴展互連通信、高效異構(gòu)協(xié)同計算、基于隔離的安全控制、虛擬化的網(wǎng)絡(luò)計算支撐、多層次的大規(guī)模系統(tǒng)容錯、系統(tǒng)能耗綜合控制等一系列關(guān)鍵技術(shù)。2009年10月29日,中國首臺千萬億次超級計算機系統(tǒng)在國防科大橫空出世,使中國成為繼美國之后世界上第二個能夠自主研制千萬億次超級計算機系統(tǒng)的國家。
經(jīng)過一年的連續(xù)奮戰(zhàn),楊學軍率領(lǐng)團隊突破了多核多線程系統(tǒng)架構(gòu)技術(shù),自主研制了64位8核“飛騰—1000”通用CPU,解決了超級計算機CPU間高速高效互聯(lián)通信等世界級技術(shù)難題,使“天河一號”的峰值速度提高了2.89倍,持續(xù)速度更是提高了3.55倍,最終榮膺世界第一。如今,安裝在國家超級計算天津中心“天河一號”,先后為70多個單位提供了超級計算服務(wù)。
2007年盛夏,大洋彼岸的美國圣地亞哥。第34屆“國際計算機體系結(jié)構(gòu)年會”在此召開,“天河一號”總設(shè)計師、國防科技大學楊學軍的《64位流處理器體系結(jié)構(gòu)研究》論文,引起與會專家學者的高度關(guān)注。
因為該領(lǐng)域的專家學者從這篇論文中,看到了突破更高性能計算機的希望——采用“異構(gòu)協(xié)同計算技術(shù)”來設(shè)計千萬億次超級計算機系統(tǒng)。
在此半年前,楊學軍發(fā)表的《容錯并行算法:基于并行復(fù)算的故障恢復(fù)》論文,被第16屆國際并行體系結(jié)構(gòu)和編譯技術(shù)大會錄用。這也是自1993年以來該會議首次錄用由中國大陸科研單位獨立完成的學術(shù)成果論文。
多年來,楊學軍在敏銳捕捉國際高性能計算研究契機的基礎(chǔ)上,組織吳俊杰所在的博士生基礎(chǔ)研究課題組大膽嘗試了“統(tǒng)一目標、集體攻關(guān)”的組織方式。圍繞大目標進行任務(wù)分工,集思廣益、共同攻關(guān),這使得原始創(chuàng)新思路在理論體系建立、形式化證明、實驗驗證等各個環(huán)節(jié)都能做得很充分。在成果逐步成熟的時候,課題組成員又分工負責共同撰寫高水平學術(shù)論文,參加國際高水平學術(shù)會議。
2011年,楊學軍獲得何梁何利科學技術(shù)成就獎,并當選為中國科學院院士。如今,已擔任國防科學技術(shù)大學校長的楊學軍,在謀劃學校全面建設(shè)發(fā)展的同時,率領(lǐng)團隊為中國高性能計算機技術(shù)的發(fā)展奮力攻關(guān)。據(jù)悉,目前國防科大已部署開展萬萬億次超級計算機系統(tǒng)的關(guān)鍵技術(shù)研究,楊學軍率領(lǐng)的團隊正向著新的世界科技高峰攀登。