劉源隆
提起超算,很多人已經(jīng)不陌生了。無論是“高大上”的國防、材料科學、天文學還是距離我們生活更近的天氣預報、災害監(jiān)測、交通管理,超算都大有用武之地。今年初,在國家超級計算廣州中心,“天河二號”超級計算機,以每秒最高十億億次的超強算力,助力篩選出能抑制病毒的小分子藥物,搭建“15秒斷診”的新冠肺炎CT影像智能診斷平臺,建立新冠肺炎病患時空軌跡數(shù)據(jù)庫。
“天河二號”是一組由中國人民解放軍國防科技大學研制的異構超級計算機,為“天河一號”超級計算機的后繼?!疤旌佣枴庇?2013 年底入駐廣東省廣州的國家超級計算廣州中心并進行驗收,2013 年底交付使用后對外開放接受運算項目任務,用于實驗、科研、教育、工業(yè)等領域。
作為“天河工程”“銀河工程”副總設計師,國防科技大學計算機學院計算機研究所所長肖立權與團隊成功研制出“天河一號”“天河二號”“天河三號E級驗證系統(tǒng)”以及銀河系列高性能計算機系統(tǒng)。
“走別人沒有走過的路很難,但我喜歡挑戰(zhàn)!”這是肖立權常說的一句話。20世紀末,大規(guī)模計算機系統(tǒng)中通常采用電互聯(lián)技術,傳輸速率低且易受干擾,影響系統(tǒng)穩(wěn)定性。這是我國研制千萬億次級超級計算機路上的一塊絆腳石。
如何搬開這塊絆腳石?用光互聯(lián)替代電互聯(lián)是最優(yōu)解決方案,研究所將這一重任交給了肖立權。2003年,肖立權受接到任務后,立即著手解決這項技術難題。然而剛開始,按照他的思路做出來的系統(tǒng)根本跑不起來。
“是哪里出了問題?” 肖立權架起示波器、邏輯分析儀,全神貫注觀察著,生怕錯過關鍵數(shù)據(jù)。解決思路一次次提出,但又一次次推翻。有一天,肖立權突然冒出一個想法:是不是數(shù)據(jù)傳輸有問題?靈光突現(xiàn),他一下找到了解決問題的“鑰匙”。由此,我國光互聯(lián)技術在大規(guī)模計算機系統(tǒng)中得到有效驗證,這為后續(xù)該技術在超級計算機系統(tǒng)中的應用奠定了堅實基礎。
此后,肖立權瞄準這一技術領域,啃下了一個又一個“硬骨頭”,解決了光互聯(lián)替代電互聯(lián)的系列技術難題,成功研制出我國首臺采用光互聯(lián)技術的并行計算機互聯(lián)通信系統(tǒng),使傳輸速率從原有的400Mbps一路飆升為10Gbps,實現(xiàn)數(shù)量級飛躍。
據(jù)國防科技大學計算機學院研究員李瓊介紹,“天河二號”的峰值計算速度達到每秒十億億次。假設每人每秒鐘進行一次運算,“天河二號”運算一小時,相當于13億人同時用計算器算上數(shù)千年。
“CPU+GPU異構融合體系”,是天河一號獨創(chuàng)的技術路線,其擁有著低能耗、低成本、高集成度等優(yōu)點。在此基礎上,科研人員邁出創(chuàng)新的又一步,為天河二號設計出“新型異構多態(tài)體系結構”,不僅大幅提高了系統(tǒng)的計算速度,還將其應用從科學計算拓展至大數(shù)據(jù)處理等多個領域。
如果說技術積淀和“計算機+多學科”的融合優(yōu)勢是“銀河”賦予“天河”的技術財富,“胸懷祖國、團結協(xié)作、志在高峰、奮勇拼搏”的“銀河精神”就是天河人永遠堅守的精神高地?!疤旌佣枴背売嬎銠C研制團隊榮獲“2015中國全面小康十大杰出貢獻人物”。在頒獎的那一刻,現(xiàn)場響起雷鳴般的掌聲。
這是一群極其勤奮的科學家,在研發(fā)階段,他們每天工作十幾個小時,一年中僅春節(jié)期間休息了三天。機器的新速度大多是在凌晨三四點鐘算出來的。每到這時,燈火通明的“天河樓”一片歡騰,大家還會興奮地打電話告訴在外地出差的同伴們。
這是一群視事業(yè)高于一切的奉獻者。有人在孩子出生當天進入封閉攻關基地而毫無怨言,因為“天河也是我們的孩子”。有人在親人臨終時無法相見,只能在系統(tǒng)調(diào)試完成后去墓地獻上一束鮮花。
這是一群朝氣蓬勃的年輕人,平均年齡不到40歲。在天河一號工程中成長起來的年輕技術人員,都是天河二號研制的骨干力量。值得一提的是,當時還有23名本科生直接參與系統(tǒng)研制。
他們,是我國超算事業(yè)生生不息的源泉。