前不久,在科技新聞評選中,“神威太湖之光”四次問鼎世界超算榜冠軍被評選為2017十大科技新聞No.1。而它的總設(shè)計師,正是金怡濂。金怡濂是中國計算機事業(yè)的開拓者之一,他主持完成了中國多臺大型、巨型計算機的研制,系統(tǒng)和創(chuàng)造性地提出了巨型機體系結(jié)構(gòu)、設(shè)計思想和實現(xiàn)方案,為中國計算機事業(yè)特別是巨型計算機的跨越式發(fā)展作出了重大貢獻。
金怡濂與計算機結(jié)緣,是在新中國成立后的1956年。當時,國家把計算機技術(shù)列為科學(xué)發(fā)展的四個重點學(xué)科之一。不久后,20個年輕人被選派赴蘇聯(lián)學(xué)習(xí)計算機研制,時年27歲、自清華大學(xué)電機系畢業(yè)后進入研究所工作的金怡濂幸運入選?!爱敃r,電子計算機剛問世10年。中國沒多少人知道什么是計算機,國家急缺人才,與其說我選擇了計算機,不如說計算機選擇了我?!苯疴セ貞浀?。
1958年7月,金怡濂在蘇聯(lián)精密機械與計算技術(shù)研究所完成對電子計算機的“啟蒙”后,坐了七天七夜的火車,從莫斯科回到北京。他只到原單位報了個到,隨即就被派往中科院計算所,參與中國第一臺大型計算機104機的研制。
104機,是以蘇聯(lián)的БЭСМ-Ⅱ機為藍本研制,金怡濂在莫斯科時就已研究過蘇方的圖紙很多遍,所以,在原理和結(jié)構(gòu)上問題不大。但時值國內(nèi)“大躍進”時期,在“大干快上”的熱潮中,質(zhì)量往往不太受重視,所以,如何確保計算機的穩(wěn)定性和可靠性,成了重點和難點。
當時的計算機體積都很龐大。世界上的第一臺電子計算機“埃尼阿克”(ENIAC)誕生于1946年,占地170平方米,重達30噸,能在1秒內(nèi)進行5000次加法和500次乘法運算。而104機的主機和電機組機房各占地200平方米,共有22個機柜,使用了4200個電子管、4000個晶體二極管,每秒能運算1萬次。
金怡濂頗有感觸地說:“計算機是個很特別的東西。算一個數(shù),需要很多器件一起工作,哪里在某個瞬間斷一下,計算結(jié)果就會出大錯。所以,工藝質(zhì)量和設(shè)計質(zhì)量一樣至關(guān)重要?!?/p>
1959年國慶節(jié),104機宣布研制完成,《人民日報》頭版頭條報道了這一喜訊。隨后,它圓滿完成了包括中國第一顆原子彈在內(nèi)的許多重大課題的相關(guān)科學(xué)運算。
此時,金怡濂已離開104機研究小組,又陸續(xù)投入到四臺大型計算機的研制工作。時值三年困難時期,金怡濂和同事們雖然吃不飽,但為了趕進度,白天黑夜連軸轉(zhuǎn),困了就到機房隔壁的庫房睡一覺,醒了再回到機房接著干。
金怡濂主攻的運算控制,被稱為計算機的大腦和心臟。他提出了一系列可行性建議和改進方案,攻克了“穿通進位鏈加法器”等課題,逐步成長為中國大型計算機研制領(lǐng)域的骨干力量,被破格提拔為研究室副主任。
1963年,三線建設(shè)時期,金怡濂攜家眷隨單位遷往大西南。生活條件自然艱苦,他們住的是干打壘的房子,各種物資都憑票供應(yīng)。金怡濂一邊學(xué)著照顧家,一邊繼續(xù)全身心地投入新型計算機的研制。
1969年,金怡濂作為主要技術(shù)負責(zé)人和總體組組長,主持國家重點工程九〇五乙機的研制。當時,國家的電子工業(yè)基礎(chǔ)異常薄弱,金怡濂一方面與同事們下大力氣幫助合作的元器件生產(chǎn)廠家提高質(zhì)量,另一方面在國內(nèi)首次提出“雙機并行”的處理器系統(tǒng)結(jié)構(gòu),以雙機并行提高機器的速度和穩(wěn)定性,彌補元器件的可靠性不足。
雙機并行,這在當時不少人看來是個極其大膽新穎的構(gòu)想。但金怡濂說,這并非他異想天開,而是源自多年來堅持追蹤國際新技術(shù)的心得。即使在鼓吹“知識無用”的年代,即使身在大西南信息閉塞的山區(qū),他仍然想方設(shè)法獲取最新的學(xué)術(shù)信息。每次到大城市開會或辦事,他必定要去圖書館或資料室查閱學(xué)術(shù)資料。他說:“搞科研的人,不跟蹤了解本專業(yè)的先進技術(shù),無異于瞎子、聾子,長此以往,思維會遲鈍,會失去想象力和創(chuàng)造力,失去創(chuàng)新的靈感和激情。”
山區(qū)的科研條件十分簡陋。印制板車間充斥著刺鼻的化學(xué)制劑氣味;數(shù)千個比米粒更小的磁芯,中間要穿過三根細銅絲,全憑一群好眼力的年輕人手工完成;數(shù)以萬計的組件,全部手動組裝……盡管如此,憑著“革命加拼命”的精神,1976年,九〇五乙機宣布研制完成,運算速度達每秒350萬次,開創(chuàng)了中國并行機研制的先河。
1978年,中國迎來科學(xué)的春天。金怡濂代表九〇五乙機的全體參研人員、設(shè)計組和他個人,在第一次全國科學(xué)大會上捧回了三張獎狀。兩個月后,他又被派往美國和日本考察大型計算機。
1980年代,“銀河”向量億次機和九〇五工程億次機兩臺運算速度達億次級的巨型機相繼成功研制。1991年,金怡濂所在的研究所又成功研制出速度達每秒10億次級的中國第一臺大規(guī)模并行處理計算機,逐漸縮小與美、日等國的差距。那么,下一個目標,定在100億,還是1000億?各方爭議不斷。金怡濂是少數(shù)贊成直接研制1000億次級巨型機的人之一。
“冒險和求實,是一個問題的兩個方面。每做一件事,我們都必須十分認真地去分析這件事究竟能不能做,既不能畏首畏尾,也不能盲目冒險。”金怡濂說,他支持直接研制千億次級絕非一時沖動,而是反復(fù)研究國外同行的成果近一年后得出的結(jié)論。“當我說出1000億時,心中至少已有了七八成的把握,剩下兩三成,也有一個初步判斷,預(yù)計那些問題可以解決?!?/p>
“計算機發(fā)展太快,早一年是先進的,晚一年就落后了?!彼€有另一層考慮,直接挑戰(zhàn)千億次級,將是一次在該領(lǐng)域迎頭趕上美日等國的機遇,機不可失。最終,新一代巨型機——“神威”的目標被確定為1000億次級。當時已退居二線的金怡濂被邀請出山,擔(dān)任總設(shè)計師。
在“神威”的研制過程中,金怡濂提出了比從前任何一個項目都更為嚴苛的質(zhì)量要求。他說:“我們的目標是,哪怕一個焊點、一枚螺絲釘,也要體現(xiàn)世界先進水平?!?996年9月,“神威”研制完成。經(jīng)測試,峰值運算速度達到每秒3120億次,跨入國際領(lǐng)先行列。這意味著,僅用4年時間,中國高性能計算機的水平就提高了300多倍,遠超“摩爾定律”每四年提升一個數(shù)量級的速度。
國慶50周年,“神威”準確計算出當天北京的天氣:清晨5時雨會停,3個小時過后將云開霧散。在天安門廣場盛況空前的國慶閱兵典禮現(xiàn)場,當太陽如期露出笑顏,受邀參加觀禮的“神威”總設(shè)計師金怡濂也笑了……
此后,金怡濂帶領(lǐng)他的團隊再次向世界最先進水平發(fā)起沖擊。這次,他們的目標更加明確——要在出機時達到世界第一。2001年底,“神威Ⅱ”研制完成,速度達到每秒13.1萬億次,其峰值速度和持續(xù)速度均超過了當時排名第一的高性能計算機;機器體積大為縮小,功耗也較低。
金怡濂始終關(guān)注著中國和世界高性能計算機未來的發(fā)展。當前,中國在高性能計算機領(lǐng)域已處于世界領(lǐng)先水平。國內(nèi)同行稱這種計算機為“巨型機”,而國際上更普遍的稱謂是“超級計算機”(Super computer)。金怡濂介紹說,預(yù)計到2020年前后,超級計算機的運算能力將突破每秒100億億次,全世界的同行都正在朝這個目標努力。