自2006年以來,深度學(xué)習(xí)算法的突破,加上GPU等并行計算方式和海量數(shù)據(jù)的加持,AI在圖像、視覺和語音等方面表現(xiàn)出了超越人類的能力。
但深度學(xué)習(xí)的效果取決于網(wǎng)絡(luò)結(jié)構(gòu)和節(jié)點的設(shè)計、訓(xùn)練數(shù)據(jù)的質(zhì)量和訓(xùn)練方法的合理性等,還存在不少瓶頸,可能存在天花板。
算法方面存在問題
一是無論深度學(xué)習(xí)還是黑盒子,缺乏理論指導(dǎo),對神經(jīng)網(wǎng)絡(luò)內(nèi)部涌現(xiàn)出的所謂“智能”還不能做出合理解釋。二是事先無法預(yù)知學(xué)習(xí)的效果。為了提高訓(xùn)練的效果,除了不斷增加網(wǎng)絡(luò)深度和節(jié)點數(shù)量、為更多數(shù)據(jù)和增加算力,然后反復(fù)調(diào)整參數(shù)基本就沒別的招數(shù)了。三是調(diào)參還是在碰運氣。還沒有總結(jié)出一套系統(tǒng)經(jīng)驗做指導(dǎo),完全依賴個人經(jīng)驗,甚至靠運氣。四是通用性仍有待提高,沒有記憶能力。目前幾乎所有的機器學(xué)習(xí)系統(tǒng)都是被訓(xùn)練于執(zhí)行單一任務(wù),做之前任務(wù)的記憶。
計算能力仍處于初級階段
我們今天的人工智能其實還是一種蠻力計算,靠無數(shù)的計算資源解決一些問題,今天所有的技術(shù)都是開源的,開源的重要特征就是希望根據(jù)我的開源搞一套生態(tài),這是高手的玩法,就是一開始就要玩生態(tài),要玩生態(tài)必須開源,讓大家跟著你一塊走。我們今天說大數(shù)據(jù),大數(shù)據(jù)是石油,石油在地球上存在多少萬年了,為什么以前不是戰(zhàn)略資源,現(xiàn)在才是戰(zhàn)略資源,就跟數(shù)據(jù)一樣,因為我們處理石油的成本降低了,經(jīng)濟上劃算了,同樣我們處理數(shù)據(jù)的成本降低了。另外我們在GPU等并行式計算硬件取得了巨大進步,但算力仍然是性能的限制性瓶頸,并且能夠大幅提高算力的硅芯片已逼近物理和經(jīng)濟成本上的極限,摩爾定律即將失效,計算性能的增長曲線變得不可預(yù)測。
數(shù)據(jù)的處理仍落后
首先我們數(shù)據(jù)的透明度不夠高,雖然深度學(xué)習(xí)方法是公開透明的,但是訓(xùn)練用的數(shù)據(jù)往往是不透明的,在利益方的誘導(dǎo)下容易出現(xiàn)數(shù)據(jù)改變信仰的情況。其次如果輸入的數(shù)據(jù)細微抖動就可能導(dǎo)致算法的失效,如果發(fā)起對抗性樣本攻擊,系統(tǒng)很容易被“洗腦”癱瘓。最后深度學(xué)習(xí)需要海量的大數(shù)據(jù),并且需要打上標簽進行監(jiān)督學(xué)習(xí),而目前給海量的大數(shù)據(jù)都打上標簽幾乎不可能。
AI進步需要各方面大融合
目前AI取得的進步屬于“連接主義學(xué)派”(基于神經(jīng)生物學(xué)和認知科學(xué))。在對智能的基本認知方面,缺乏與具有邏輯推理能力的“符號主義學(xué)派”(認為智能源于數(shù)理邏輯)等的融合能力。比如,還無法理解實體的概念,無法分析因果關(guān)系,無法識別關(guān)鍵影響因素,不會直接學(xué)習(xí)知識,不善于解決復(fù)雜數(shù)學(xué)運算,缺乏倫理道德等方面的常識等。
到2017年,機器學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)已具有數(shù)千到數(shù)百萬個神經(jīng)元和數(shù)百萬個的連接。這樣的復(fù)雜度還只相當于一個蠕蟲的大腦,與有1000億神經(jīng)元和10000億連接的人類大腦,差了N個數(shù)量級。但盡管如此,神經(jīng)網(wǎng)絡(luò)下圍棋的能力已遠高于一只蠕蟲。與此同時,一只蠕蟲所具有的自繁衍、捕食和躲避天敵等智能,無論是人類智能還是人工智能,都還望塵莫及。
人工智能的發(fā)展需要依托三大基礎(chǔ)力量,新數(shù)據(jù)、新硬件、新算法。我們以前用CPU,后來有GPU,今天谷歌說我們需要給人工智能設(shè)計專用的硬件,所以硬件技術(shù)的進步使得它的算法或者能力提高了,當然算法的改進也是很重要的,但是所有的事情都是兩面性的,進入深度的時候一定是把廣度縮小了。
AI仍處于新一輪技術(shù)發(fā)展的初期,現(xiàn)在很多的突破并不是顛覆性的,是很穩(wěn)定的一個增長,主要靠的是蠻力,今天如果你不說大數(shù)據(jù),人工智能就是算法。
到2017年,機器學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)已經(jīng)具有數(shù)千到數(shù)百萬個神經(jīng)元和數(shù)百萬個鏈接,這樣的復(fù)雜程度相當于一個蠕蟲的大腦,為此大家很擔心隨著人工智能的發(fā)展其會不會控制人類,顛覆人類,但我認為是不會的。我們的IT行業(yè)有三個教父級的人物,我們今天使用的計算機是馮·諾依曼算法。比特的定義,是香農(nóng)定義的,他說比特是剝離了語義的。有些事情,是不可計算,這是阿蘭·圖靈講的,從三位教父的觀點我們可以得出一個結(jié)論,我個人的觀點是至少我們這一代的IT技術(shù),基于我們這一代IT技術(shù)的人工智能是不可能超過人類的,人工智能只是我們的工具,我們需要新的技術(shù)理論,技術(shù)架構(gòu),技術(shù)突破,這一代的技術(shù)是往南走的,人工智能會往北走,走是可以走的,大家會非常累。(本文根據(jù)2017年8月13日何寶宏公開發(fā)表文章進行整理,有刪節(jié),未經(jīng)本人確認。)