黃鐵軍
2017年7月20號,國務院印發(fā)了《新一代人工智能發(fā)展規(guī)劃》,這個規(guī)劃在全世界范圍引起了廣泛關注,它提出了“到2030年人工智能理論、技術與應用總體達到世界領先水平,成為世界主要人工智能創(chuàng)新中心,智能經濟、智能社會取得明顯成效,為躋身創(chuàng)新型國家前列和經濟強國奠定重要基礎”的戰(zhàn)略目標,還提到了“科技引領”“系統(tǒng)布局”“市場主導”“開源開放”四條中國發(fā)展人工智能的基本原則,其中最后一條原則—“開源開放”很清楚地表明中國政府發(fā)展新一代人工智能不是在搞封閉的技術研發(fā),而是以開源開放的方式做技術、以開源開放的方式實現(xiàn)目標。
依據(jù)規(guī)劃指導,我們致力于打造人工智能的開源開放平臺,不僅僅是做開源,還要借助開源成為一個有機的整體。所有的研發(fā)活動,所有的標準、知識產權、產業(yè)的推進都圍繞這樣一個開源開放平臺開展。平臺追尋“一體兩翼”目標,“一體”就是開源開放平臺,“兩翼”就是以專家為主體的工作組和以企業(yè)為主體的推進組。
開源開放是我們必須走的一條道路。人工智能是一個基礎性技術,是一個輻射性很強的技術,只有開源開放才能把效益最大程度上發(fā)揮出來,這是一個基本的判斷。
另外,人工智能本質上具有難以透徹理解的技術特性,盡管現(xiàn)在正在追求深度學習的可解釋性,但是新的機器學習算法、新的人工智能模型會不斷涌現(xiàn),我們人類要想完全徹底地理解人工智能系統(tǒng)的所有細節(jié)是不現(xiàn)實的,就像我們去理解人的智能背后機理一樣,目前來說是不可能完成的一個任務。人工智能系統(tǒng)必須開放,最好是開源,否則想贏得使用者和最終用戶的信任和采納是不現(xiàn)實的。
開源是數(shù)代接力的過程,未來開源項目的主力是年輕人、是新一代、是學生。在教育過程中,開源應該直接對接剛剛開始學習人工智能的學生,這是很多學校現(xiàn)在開展人工智能專業(yè)急需開展的方面。實際上中國科研體制里面長期存在著不少低水平重復,甚至于高水平重復的項目。通過開源開放可以減少重復項目,大家做真正獨特、真正有價值的東西,形成一個促進科技改革、科技體制創(chuàng)新的有效方式。
開源的發(fā)展需要尊重創(chuàng)新。在開源領域,中國有一些企業(yè)用得多,貢獻得少,原始創(chuàng)新者就不愿意把自己的成果開放出來,這種現(xiàn)象就像發(fā)表論文一樣,科研人員發(fā)表一篇論文,但作者本人完全看不到商業(yè)上對這篇論文的訴求,感受不到自己研究成果的影響力,顯然,這樣不利于鼓勵創(chuàng)新。為了解決這些問題,論文中設立了引用數(shù)量這一指標,通過論文被引用數(shù)量,作者可以知道自己論文的影響力和實用價值。開源可以考慮參考這種機制,給予開源代碼原創(chuàng)者一定程度上的認可。
開發(fā)是一個全球性行為。當一個深度學習的網(wǎng)絡搭建出來的時候,開發(fā)者需要進行運行驗證,這個過程需要在硬件載體上進行。為了方便進行這個過程,我們設立了兩個運行環(huán)境方面的開源項目,一個叫“章魚”,一個叫“珊瑚”,同時,在開發(fā)過程方面也有兩個項目,一個叫“磐石”,一個是華為軟件開發(fā)云。運行和開發(fā)的兩方結合給大家提供了一個在線代碼維護調試環(huán)境。此外,還有作為開源數(shù)據(jù)協(xié)作平臺的OpenI縱橫項目。
“章魚”是既能往上支撐,也能往下連接分布在各地的不同硬件體系的智能資源管理系統(tǒng);“珊瑚”是華為牽頭,對各種異構化的硬件進行有效驅動,使它們能夠協(xié)同配合的項目;“磐石”是國防科技大學在協(xié)同開發(fā)環(huán)境基礎上面向AI進行定制式開發(fā)的群體化協(xié)同創(chuàng)新環(huán)境,是一個深度學習可視化的工具。
作為開源數(shù)據(jù)協(xié)作平臺,OpenI縱橫項目可以為解決在機器學習中遇到的問題提供一些幫助,比如解決分布式數(shù)據(jù)如何進行有效使用的問題。這個平臺實質上是為了把數(shù)據(jù)管理好,它和開發(fā)是同等重要的。
總體來說,我們希望經過幾年的發(fā)展,把《新一代人工智能發(fā)展規(guī)劃》從基礎理論落實到應用實踐、關鍵技術、典型應用,以及整個人工智能發(fā)展生態(tài)當中,把它從一個文件變成一個物理的過程,這個實現(xiàn)過程不是某一家公司能做到的,而是大家一起共同構造的,能共同工作的前提就是開源,通過這樣的方式,我們可以打造一個人工智能的生態(tài)社區(qū)。
為開源、為中國的人工智能發(fā)展,我們有幾個初衷:第一,我們希望陸陸續(xù)續(xù)匯聚更多新成果。第二,我們希望為人工智能產業(yè)和應用提供一個可靠的基礎設施,不會因為一些因素或者其他變化遭受沖擊。第三,我們希望能夠建立一個產學研用合作的橋梁,產學研說了很多年,但是如何把它有效地整合在一起,我們希望能夠闖出一條路。這些期望不僅是對于中國,也是對全球人工智能產業(yè)和應用的期盼,可能要經過五年甚至更長時間才能做到。
人工智能會滲透到社會生活方方面面,將來用開源開放的方式打造的智能大陸會作為實現(xiàn)人類命運共同體、人類和智能的共同體夢想的可信基礎,成為人類世界邁向智能時代的堅實階梯。
(根據(jù)演講內容整理,未經本人審核)