楊光
中科曙光面向用戶、合作伙伴及業(yè)界專業(yè)人士舉辦的大型創(chuàng)新分享活動——2016中科曙光技術創(chuàng)新大會(IDIC2016)在京開幕。中國工程院院士、曙光公司董事長李國杰,曙光公司總裁歷軍,高級副總裁聶華,副總裁沙超群、邵宗有等曙光公司高管以及VMware、Intel等曙光公司合作伙伴代表先后登臺,圍繞“E級超算”挑戰(zhàn)下企業(yè)級計算、存儲、網(wǎng)絡、安全、能耗等一系列問題的解決之道展開演講,分享業(yè)界技術前沿、面向未來共話創(chuàng)新。中科曙光在大會上宣布,由其牽頭的E級高性能計算機(簡稱“E級超算” )原型系統(tǒng)項目正式發(fā)布。
中國E級超算“三頭并進”
作為體現(xiàn)一個國家綜合國力和科技創(chuàng)新能力的重要標志,各國在超算領域的競爭也日趨激烈。尤其是在“太湖之光”把最快計算機的持續(xù)計算速度刷新到93PFlops之后,E級超算已成為當前各國競相角逐的戰(zhàn)略制高點。
目前,美國、歐洲、日本等國家和地區(qū)都提出了自己的E級超算研發(fā)計劃。中國也將百億億次超級計算機及相關技術的研究寫入了國家“十三五”規(guī)劃,希望在2020年左右實現(xiàn)這一宏偉研究計劃。在國家“十三五”高性能計算專項課題中,中科曙光、國防科技大學以及江南計算技術研究所同時獲批牽頭E級超算的原型系統(tǒng)研制項目,形成了中國E級超算“三頭并進”的局面。
E級超算“原型系統(tǒng)研制”是在E級超算項目正式進入日程之前的預研工作。中科院計算所研究員、中國計算機學會高性能計算專委會秘書長張云泉表示,原型系統(tǒng)的研制可以驗證一些關鍵的技術設想,對一些關鍵技術難點進行測試和改進,為最后建造全部的系統(tǒng)掃清障礙,避免出現(xiàn)大的技術錯誤和難題,類似的預研項目“非常必要”。
對于E級超算系統(tǒng)的建設,國際上對運算速度、能耗比等都有其公認的標準。那么,國產(chǎn)E級超算可采取何種架構、何種技術路線?能否實現(xiàn)10萬節(jié)點規(guī)模的擴展能力?能效比能否有所突破?歷軍表示,基于原型機的研制與測試,類似上述疑問的謎底將一一被揭開。
開通“E級路線”
完成E級原型機系統(tǒng)
曙光副總裁沙超群在其“E級挑戰(zhàn)‘億觸即發(fā)”的大會報告中對中科曙光E級超算原型系統(tǒng)項目的規(guī)劃和研究路線進行了詳細的解讀。他在大會上報告了曙光預研項目的任務目標:完成E級原型機系統(tǒng),驗證E級機研制的關鍵技術和路線圖,形成E級機的完整方案,為國產(chǎn)E級超算的研制奠定技術基礎。
按照這一目標,曙光將憑借深耕高性能計算20余年的豐富經(jīng)驗,在體系結構、計算、存儲、網(wǎng)絡、系統(tǒng)軟件、系統(tǒng)冷卻和可靠性等方面對未來E級超算的建設進行有益探索。
在體系結構方面,曙光提出了一種超融合自適應并行處理體系結構( HCAPP )。“節(jié)點內異構架構仍是未來頂級超算的主流?!鄙吵赫f,“先進的6D-Torus高維網(wǎng)絡架構和層次化網(wǎng)絡系統(tǒng),使系統(tǒng)具有10萬節(jié)點的擴展能力,可以穩(wěn)定擴展至E級規(guī)模?!?/p>
原型系統(tǒng)采用的存儲系統(tǒng),則是基于曙光承擔的863課題“曙光EB級云存儲系統(tǒng)研制”的研究成果。沙超群指出,層次多協(xié)議的高性能存儲系統(tǒng)具有超強的EB級擴展性和支持千億級文件的存儲能力。
在節(jié)能方面,曙光擬采用目前最高效、最先進的服務器冷卻技術——全浸沒式相變液冷技術。沙超群介紹說,絕緣冷媒的相變潛熱是比熱的一百倍,換熱效率高、安全性好,冷媒與發(fā)熱器件直接接觸,能一次性解決全部元件的散熱問題,同時能大幅提升系統(tǒng)的可靠性。
超算E勢力 助推全球發(fā)展
此外,曙光E級高性能計算系統(tǒng)原型機,在完成E級系統(tǒng)關鍵技術驗證的同時,具有良好的生態(tài)環(huán)境和廣泛應用適用性。沙超群稱,原型系統(tǒng)可以良好地支撐高性能計算、深度學習、大數(shù)據(jù)、云計算等領域應用,加快技術成果產(chǎn)業(yè)化應用,對我國高性能計算產(chǎn)業(yè)的發(fā)展有重大支撐作用。
“隨著科技的飛速發(fā)展,知識和技術創(chuàng)新成為經(jīng)濟、社會發(fā)展的主要驅動力。”沙超群指出,“曙光原型機作為工業(yè)標準的高性能計算系統(tǒng),不僅可以為國家科技創(chuàng)新和產(chǎn)業(yè)轉型升級提供基礎設施保障,還將促進中國高性能計算產(chǎn)業(yè)成果走向世界,推動全球基礎科學研究、工業(yè)轉型升級、數(shù)字化行業(yè)發(fā)展等,為全人類進步作出貢獻?!?/p>
“大曙光”格局推動產(chǎn)業(yè)發(fā)展
曙光多業(yè)務協(xié)同創(chuàng)新正開展得有聲有色。圍繞今年4月發(fā)布的“數(shù)據(jù)中國加速計劃”重點布局的政府大數(shù)據(jù)、科學大數(shù)據(jù)、安全大數(shù)據(jù)、工業(yè)大數(shù)據(jù)等四類大數(shù)據(jù)業(yè)務方面,曙光的布局舉措和落地在IDIC2016上已經(jīng)得到了充分展現(xiàn)。在政府大數(shù)據(jù)方面,曙光易通創(chuàng)造性地利用生物特征識別與云計算技術相結合的“身份認證云”為10億中國人提供身份認證服務;在科學大數(shù)據(jù)方面,中科星圖利用“互聯(lián)網(wǎng)+空天大數(shù)據(jù)”增值服務撬動信息消費市場;在安全大數(shù)據(jù)方面,中科睿光致力于打造最優(yōu)秀的國產(chǎn)云操作系統(tǒng)以“立足中國服務中國”……
歷軍表示,隨著中科睿光、曙光易通、中科三清、中科星圖、聯(lián)方云天等子公司的崛起,“大曙光”多元化發(fā)展道路的探索已嶄露頭角。
產(chǎn)業(yè)鏈協(xié)同創(chuàng)新方面,在近年來與Intel、VMware等合作伙伴共同成立“關鍵業(yè)務系統(tǒng)產(chǎn)業(yè)聯(lián)盟”、聯(lián)合實驗室等基礎上,2016年曙光又與國內眾多上下游伙伴發(fā)起“智慧城市產(chǎn)業(yè)聯(lián)合體”,創(chuàng)造性地開展“麥當勞”加盟模式落地智慧城市領域。如今,這一計劃已取得第一批碩果:在本次大會的智慧城市分論壇現(xiàn)場,聶華與4座城市的合作伙伴簽署戰(zhàn)略合作協(xié)議,曙光云計算公司常務副總裁關宏明與7座城市的合作伙伴簽署連鎖加盟協(xié)議。
“以自主創(chuàng)新構建核心競爭力,以協(xié)同創(chuàng)新推動產(chǎn)業(yè)化發(fā)展。”曙光總裁歷軍表示,中科曙光一系列面向未來創(chuàng)新始終堅持一個主題,就是“讓全社會共享數(shù)據(jù)價值”。
曙光大數(shù)據(jù)技術優(yōu)勢
在曙光公司大數(shù)據(jù)總經(jīng)理宋懷明看來,曙光大數(shù)據(jù)技術有著如下的優(yōu)勢:第一,曙光的歷史相對比較久,從2003年就開始涉足大數(shù)據(jù),包括互聯(lián)網(wǎng)數(shù)據(jù)的監(jiān)控、數(shù)據(jù)分析、后端處理,曙光一直在做數(shù)據(jù)的存儲分析系統(tǒng),那時候規(guī)模非常大,在2004年曙光單一系統(tǒng)已經(jīng)到500TB以上。第二,曙光大數(shù)據(jù)對行業(yè)應用的實踐比較成熟。尤其在網(wǎng)媒和環(huán)保氣象領域,曙光是和一些國家的權威機構合作,能接收到核心的數(shù)據(jù),可以對一些國家監(jiān)測機構、數(shù)據(jù)采評機構的權威數(shù)據(jù)進行分析,有應用的基礎。這點跟互聯(lián)網(wǎng)企業(yè)是不一樣的。最后,曙光技術是完全自主可控的,并且充分利用完全吸收了開源技術,任何一條代碼都是自己開發(fā)的,所以曙光對用戶的需求響應非???,處理用戶的問題基本不會隔夜,當然也與曙光內部團隊管理機制、解決問題機制有關系。同時,代碼自主可控可以增強系統(tǒng)的可靠性。