胡克非
“天下武功出少林,少林武功出達摩?!?/p>
在武俠小說中,達摩院的任務不是幫少林看家護院,更不是稱霸武林,而是研究天下武學,為少林功夫奠定基礎(chǔ)。
三年多前,阿里巴巴宣布成立達摩院,劍指科技創(chuàng)新。這不是一個輕率的決定,在阿里巴巴創(chuàng)立初期,馬云堅決反對成立研究機構(gòu),他認為自己和企業(yè)都沒有準備好。2017年,阿里已創(chuàng)辦18年后,馬云才覺得準備好了。
彼時的世界有個熱詞——人工智能:AlphaGo打敗圍棋世界第一柯潔,再掀高潮;國務院印發(fā)新一代人工智能發(fā)展規(guī)劃,AI成為國家戰(zhàn)略。它是個象征,也像個預言——2017年成為分水嶺,中國科技創(chuàng)新圖景,正加速重構(gòu)。
此后,被諾基亞收購的老牌研究院貝爾實驗室,退出最引以為傲的半導體領(lǐng)域,再無水花;被譽為中國AI“黃埔軍?!?微軟亞洲研究院著手研究麻將,可研究成果卻始終不如“業(yè)界明星”亮眼;而研發(fā)出沃森(Watson)的IBM中國研究院,更于最近關(guān)門大吉。
硬幣的另一面,是來自中國的新型研究機構(gòu)異軍突起。短短三年,達摩院已搭建完整的“科學—技術(shù)—產(chǎn)品”研究體系,在AI、芯片、自動駕駛、量子計算等多個領(lǐng)域?qū)崿F(xiàn)突破;達摩院不但在國際摘得60多項科技世界第一,發(fā)表千余篇國際頂級會議論文,還成功孵化兩家高科技企業(yè)——平頭哥半導體公司和小蠻驢智能科技有限公司。
達摩院是怎么做到的?
成立一個科研機構(gòu),即便是門外漢也明白,這個事需要人,而且得要人尖子。
2014年,研究大數(shù)據(jù)與人工智能的教授金榕,還在美國密歇根州立大學從事科研的工作。在象牙塔里待久了,他想尋找新的幸福感,回國干事業(yè)成為極具吸引力的選項。
他講了個故事。上世紀80年代,金榕的鄰居一家移民美國,20年后,金榕在美國又遇到了這一家人,他們竟然還在餐館以刷盤子為生!
這件事對金榕觸動很大。美國變化少,中國則一日一變。在這快速發(fā)展的大時代,中國有最好的成就自我、改變企業(yè)甚至世界的機會,金榕愿意貢獻其中:“任何一個學術(shù)圈來的人,都會希望自己的技術(shù)能服務千千萬萬的人,這是一個最好的機會?!?/p>
就這樣,金榕加入了阿里巴巴。他還帶回了自己的好朋友——自然語言處理科學家司羅。司羅又找來了Facebook機器翻譯主管黃非……散落在世界各地各領(lǐng)域的杰出科學家們,一個帶一個地回到了國內(nèi),成為達摩院“掃地僧”。
在達摩院的這三年,金榕打造出AI基礎(chǔ)研發(fā)體系,支持中國規(guī)模最大的國民應用;司羅搭建起世界領(lǐng)先的自然語言處理體系,用最前沿的技術(shù)服務最廣泛的人們;黃非和團隊做了支持214種語言的翻譯系統(tǒng),日均調(diào)用超過10億次。人工智能就這樣在達摩院扎下根,并逐漸通過阿里云服務全社會。
但這還不夠。
那幾年,量子計算成為最熱門的科技領(lǐng)域,被認為有顛覆經(jīng)典計算的潛力。這讓達摩院院長張建鋒“夜不能寐”,下定決心投入量子計算,并邀請資歷最老的、世界知名量子科學家施堯耘加入。
達摩院成立時,院長張建鋒闡述達摩院愿景。
施堯耘依舊記得當時張建鋒的一番話。張建鋒對他說,量子計算一定要做,因為可能你今天買成千上萬臺服務器,用性能最優(yōu)的芯片,但抵不過人家一臺量子計算機。
“這讓我覺得阿里做量子計算是非常嚴肅認真的?!笔﹫蛟耪f,他還感受到,在阿里,科學家有話語權(quán),他記得與張勇的一次對談。
施堯耘問:“什么是阿里巴巴?”
張勇回答:“你就是阿里巴巴?!?/p>
后來回想起,施堯耘覺得,是阿里管理層決定做量子計算,但怎么做最終要靠科學家自己,科學家擁有很大的自由度。
這讓他和一眾科學家們備受鼓舞:原來科學家在阿里、在達摩院,不但能做出成績,還極受尊重。顯然,這樣包容、信任的氛圍更有利于出科研成果。
在2017年達摩院成立之際,張建鋒說:“我們不是請科學家來做苦行僧的,更不是壯士,而是來做騎士的。我們想吸引全球一流的人才,人才是真正的生產(chǎn)力?!?/p>
短短幾年時間,達摩院在杭州、北京、上海、新加坡、以色列、西雅圖、硅谷等全球8個地區(qū)設(shè)立了研究中心,延攬知名高校教授三十多人、IEEE Fellow 級別科學家十多人,研究領(lǐng)域覆蓋AI、芯片、量子、自動駕駛、區(qū)塊鏈等,形成前沿技術(shù)、核心技術(shù)、應用技術(shù)相結(jié)合的完整科技布局。
在產(chǎn)業(yè)界做科研,最難的和最有成就感的是同一件事:從學術(shù)成果到應用落地。
曾擔任貝爾實驗室主任的凱利認為,要讓實驗室成為“創(chuàng)造性的科技研究所”,必須要將應用研究與基礎(chǔ)研究“配對”好,這樣才能縮短科學突破到應用之間的時間差,提高科技成果向?qū)嵱眉夹g(shù)轉(zhuǎn)化的效率。
誕生于貝爾實驗室的集成電路、太陽能電池、微波激射器和激光器、計算機操作系統(tǒng)UNIX等發(fā)明,皆出自凱利領(lǐng)導時期。貝爾實驗室培養(yǎng)出多位諾貝爾獎得主,但凱利觀察到,顛覆性科學理論涌現(xiàn)的時代已經(jīng)遠去,微小創(chuàng)新、快速迭代成為當今世界的科研新范式。
面對科研范式的轉(zhuǎn)變,達摩院有自己的解法。iDST(阿里巴巴數(shù)據(jù)科學與技術(shù)研究院)是達摩院前身,為了讓科學家們更有“問題”的體感,iDST號召科學家“上山下鄉(xiāng)”。
所謂“上山下鄉(xiāng)”,就是到實際的業(yè)務一線去:看業(yè)務人員怎么找到問題、制訂商業(yè)計劃、試水市場以及解決問題。
金榕當時去了天貓搜索事業(yè)部。在最初的交流中,金榕完全插不上嘴,索性安靜地記筆記,理解業(yè)務邏輯。
彼時,技術(shù)團隊有一個以圖搜物的新嘗試“拍立淘”,但體驗不夠好。整天和數(shù)據(jù)打交道的金榕,敏感地發(fā)現(xiàn)了業(yè)務團隊一直忽略的一個盲區(qū)。他興奮地拉上業(yè)務團隊提出了自己的改進建議,一看大家沒聽明白,立馬從數(shù)學語言切換成大白話講給同事聽。
最終技術(shù)團隊接受了金榕的建議,通過算法優(yōu)化了“拍立淘”。效果立馬顯現(xiàn):用戶搜索數(shù)和點擊數(shù)曲線立馬飆升,“拍立淘”一炮而紅,拿下年度創(chuàng)新大獎。
這讓金榕很興奮。對科學家來說,理論和科研成果用在解決業(yè)務的實際問題上,并且能立刻被千千萬萬的人使用體驗,自然相當有成就感。
語音智能科學家鄢志杰也深有感觸,他的iDST時期“代表作”,是用前沿技術(shù)解決一個社會問題。
此前,上海地鐵一直在探索實現(xiàn)語音購票,提升乘客體驗。鄢志杰帶領(lǐng)技術(shù)團隊實地考察時,卻傻眼了。地鐵站人聲鼎沸,不僅有乘客大聲打電話的聲音,還有地鐵站提醒乘客安檢的喇叭聲?!拔矣∠筇貏e深刻,‘逢包必檢!喇叭聲太大了,極大影響了語音識別的準確度?!臂持窘苷f。
鄢志杰帶領(lǐng)團隊經(jīng)過幾個月的現(xiàn)場蹲點研究,試了好多種方案,終于創(chuàng)新性地將人臉識別與語音識別結(jié)合,用多模態(tài)的方式解決了強噪音下的語音識別難題。
乘客面對語音售票機,只需說出目的地,比如“去東方明珠”,這臺機器就能準確地推薦最近的陸家嘴站。一般買票往往超過30秒,不熟的乘客甚至要花1分鐘,但語音購票全程只需10秒,極大方便了乘客。
這是典型的達摩院解法:從問題和需求中來,到解決問題和滿足需求中去。在這個過程中,實際問題得以解決,前沿科技也因?qū)嵺`的淬煉而變得厚重,完成迭代更新。
恩格斯有言:社會一旦有技術(shù)上的需要,比十所大學更能推進科學。說的就是這么回事。
達摩院量子實驗室科學家正在調(diào)試量子計算設(shè)備。
每年,達摩院都會發(fā)布十大科技趨勢,給全社會提供一份科技創(chuàng)新指南。中國工程院院士鄭南寧在今年的十大趨勢卷首語中指出,因為疫情,未來五十年的變化將提前壓縮到了未來十年里,科學技術(shù)將加速應用到社會經(jīng)濟領(lǐng)域。
這是時代提出的挑戰(zhàn)。它要求更廣泛、更包容的科技合作,在開放合作中提升自身科技創(chuàng)新能力。
達摩院要“活得比阿里巴巴長”,就不僅僅只服務于阿里,而要更加開放,帶動更多中小企業(yè)聯(lián)合創(chuàng)新,成為全社會、全球的科技創(chuàng)新引擎。
平頭哥研究員孟建熠,從浙江大學博士畢業(yè)后,一直從事芯片研究。在備受矚目的最強AI芯片含光800和性能最強RISC-V處理器玄鐵910之外,孟建熠的理想,是構(gòu)建一個基于開源生態(tài)的芯片社區(qū)。
“芯片應該說是這個世界上開源最難做的一條路,但我們今天在嘗試做。開源能夠給我們一種以不同方式去思考芯片產(chǎn)業(yè)的機會,它需要全社會協(xié)同?!泵辖谡f。
當前,平頭哥已經(jīng)開源MCU平臺,包含了玄鐵處理器、基礎(chǔ)接口、開發(fā)環(huán)境等?;谛F處理器和AI算法,平頭哥和國內(nèi)最大藍牙芯片廠商中科藍訊迅速展開新一代智能語音芯片的設(shè)計,極大降低了芯片研發(fā)的時間和成本投入。
開放,讓前沿科技成就更多中小企業(yè),已成為達摩院科學家們的共識。即便在最前沿的量子計算領(lǐng)域,達摩院也在主動融入全球創(chuàng)新網(wǎng)絡(luò)。
2020年12月,達摩院量子實驗室開源自研量子計算模擬器“太章2.0”及一系列量子應用案例,將有力支持從業(yè)人員設(shè)計量子硬件、測試量子算法,并探索其在材料、分子發(fā)現(xiàn)、優(yōu)化問題和機器學習等領(lǐng)域內(nèi)的應用。
太章2.0是達摩院最新的量子計算研究成果,曾因?qū)雀琛傲孔影詸?quán)”提出挑戰(zhàn)而聲名大噪。在施堯耘看來,學術(shù)界和產(chǎn)業(yè)界需要聚合力量,克服瓶頸,加速創(chuàng)新,“開放研究有利于加速量子時代來臨”。
智能計算實驗室已開源超大規(guī)模分布式圖計算平臺GraphScope,幫助金融、城市大腦、生命健康等領(lǐng)域盡早進入圖計算“普惠時代”;決策智能實驗室自研的數(shù)學規(guī)劃求解器MindOpt兩次國際奪冠,成為國內(nèi)首個免費開放的商業(yè)求解器;達摩院絕大部分AI科技,都已通過阿里云向外輸出……
在2017年達摩院成立之際,阿里提出希望給世界留下一個研究室,把阿里的技術(shù)、對人類技術(shù)的探討,都留下來?!斑_摩院不會是阿里巴巴體系內(nèi)的達摩院,它必須屬于中國,屬于世界,屬于這個時代”。