周志華
經(jīng)常有人問:“比人類更聰明的人工智能什么時(shí)候能夠出現(xiàn)?”這樣的問題非常難回答,因?yàn)檎劦饺斯ぶ悄?,有兩種完全不同的觀點(diǎn),其差別非常之大。
一種是“強(qiáng)人工智能”觀點(diǎn),認(rèn)為未來(lái)會(huì)研制出和人一樣聰明,甚至比人更聰明的機(jī)器;另一種是“弱人工智能”觀點(diǎn),認(rèn)為人更聰明,機(jī)器工作應(yīng)向人類借鑒而變得“聰明”。目前在人工智能科學(xué)界,探索主要集中在“弱人工智能”。
人工智能做的事情就是借鑒我們所看到的智能行為,做出工具幫助我們做更強(qiáng)大的事情。應(yīng)該說(shuō),人工智能研究的主要目的并不是“人造智能”,而是“intelligence-inspired computing”,智能啟發(fā)的計(jì)算。
人工智能發(fā)展的三個(gè)階段
人工智能作為一門學(xué)科誕生于1956年。彼時(shí)計(jì)算機(jī)的能力還很弱,但已經(jīng)有很多學(xué)者在思考“隨著計(jì)算能力的發(fā)展,計(jì)算機(jī)是不是可以做一些更復(fù)雜的事情?”同年夏天,在達(dá)特茅斯學(xué)院開了一個(gè)會(huì)議,后來(lái)被稱為人工智能之父的約翰·麥卡錫在這個(gè)會(huì)議上提出了“人工智能”這一概念。
經(jīng)過(guò)60余年的發(fā)展,從主流研究?jī)?nèi)容來(lái)看,人工智能的發(fā)展經(jīng)歷三個(gè)階段:
第一個(gè)階段是20世紀(jì)50年代中期到60年代初,這個(gè)階段主要是將邏輯推理能力賦予計(jì)算機(jī)系統(tǒng)。圖靈獎(jiǎng)得主西蒙和紐厄爾研制出來(lái)的“邏輯理論家”程序就是其中典型代表,可以說(shuō),當(dāng)時(shí)的計(jì)算機(jī)所具有的推理能力已經(jīng)達(dá)到了人類的巔峰水平。
慢慢地,人們意識(shí)到,計(jì)算機(jī)僅有邏輯推理能力是不夠的,即便是數(shù)學(xué)家,為了證明數(shù)學(xué)定理除了要有邏輯推理能力,還要有數(shù)學(xué)知識(shí)。所以人工智能的研究很自然地進(jìn)入了第二個(gè)階段,即“知識(shí)工程”時(shí)期。在這個(gè)階段,人們將知識(shí)總結(jié)出來(lái),教給計(jì)算機(jī)系統(tǒng),由此產(chǎn)生出很多“專家系統(tǒng)”,實(shí)實(shí)在在地解決了很多應(yīng)用問題。
隨著時(shí)間的推移,人們發(fā)現(xiàn)要把知識(shí)總結(jié)出來(lái)再教給系統(tǒng)非常困難。一方面,有時(shí)候我們雖然能夠解決一些問題,但是這個(gè)知識(shí)是什么可能說(shuō)不清楚。另一方面,有些時(shí)候人們并不愿意去分享知識(shí)。為了解決這一問題,人工智能研究先驅(qū)們希望讓機(jī)器可以自動(dòng)地學(xué)習(xí)知識(shí)。從20世紀(jì)90年代開始,人工智能的主流研究進(jìn)入第三個(gè)階段(機(jī)器學(xué)習(xí))且一直持續(xù)至今。
大數(shù)據(jù)時(shí)代的機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)的經(jīng)典定義是“利用經(jīng)驗(yàn)改善系統(tǒng)自身的能力”。不論怎樣的經(jīng)驗(yàn),一旦放在計(jì)算機(jī)系統(tǒng)中,必然以數(shù)據(jù)形式存在。機(jī)器學(xué)習(xí)要研究怎么去利用經(jīng)驗(yàn),就必須對(duì)數(shù)據(jù)進(jìn)行分析。因此,機(jī)器學(xué)習(xí)這一階段發(fā)展到今天,主要研究的是如何利用計(jì)算機(jī)對(duì)數(shù)據(jù)進(jìn)行分析的理論和方法。
20世紀(jì)末,人類發(fā)現(xiàn)自己淹沒在一個(gè)數(shù)據(jù)的海洋里,我們需要對(duì)數(shù)據(jù)進(jìn)行分析,而機(jī)器學(xué)習(xí)恰恰在這個(gè)時(shí)候走上歷史的舞臺(tái),給人類提供了一個(gè)機(jī)會(huì)。因此,我們對(duì)機(jī)器學(xué)習(xí)快速發(fā)展的需求高漲。
今天被定義為“大數(shù)據(jù)時(shí)代”,但僅有大數(shù)據(jù)并不意味著獲得了價(jià)值。大數(shù)據(jù)是一座礦山,我們擁有了礦山,但如果想要得到礦山的價(jià)值,必須有強(qiáng)大的數(shù)據(jù)分析技術(shù),而這個(gè)數(shù)據(jù)分析技術(shù)就是要機(jī)器學(xué)習(xí)。在大數(shù)據(jù)時(shí)代,想要讓數(shù)據(jù)發(fā)揮作用,離不開機(jī)器學(xué)習(xí)技術(shù)。
機(jī)器學(xué)習(xí)在今天可以說(shuō)是無(wú)處不在,無(wú)論是互聯(lián)網(wǎng)搜索還是人臉識(shí)別、汽車自動(dòng)駕駛、火星機(jī)器人,甚至包括美國(guó)總統(tǒng)大選、軍隊(duì)的戰(zhàn)場(chǎng)數(shù)據(jù)情況分析,任何地方只要有數(shù)據(jù)存在,只要人們希望用計(jì)算機(jī)來(lái)幫助進(jìn)行數(shù)據(jù)的分析,就可能使用機(jī)器學(xué)習(xí)技術(shù)。我們說(shuō)人工智能現(xiàn)在很“熱”,恰恰是因?yàn)闄C(jī)器學(xué)習(xí),特別是深度學(xué)習(xí)技術(shù)在過(guò)去的十年里取得了巨大的發(fā)展,在大數(shù)據(jù)時(shí)代發(fā)揮了巨大的作用。如今,很多企業(yè)的解決方案是基于深度學(xué)習(xí)技術(shù)來(lái)實(shí)現(xiàn)的。
機(jī)器學(xué)習(xí)的技術(shù)局限與下一步發(fā)展
在談到機(jī)器學(xué)習(xí)的時(shí)候,有些人想到的是算法,有些人想到的是數(shù)據(jù)??梢哉f(shuō),今天的機(jī)器學(xué)習(xí)是以“算法加數(shù)據(jù)”的形態(tài)存在的。在這種形態(tài)下,技術(shù)存在一定的局限性。
數(shù)據(jù)需求大
首先,我們需要大量的訓(xùn)練樣本。在一些應(yīng)用里,我們的樣本總量很少,比如在做油田定位時(shí),數(shù)據(jù)必須通過(guò)人工誘發(fā)地震才能獲得,數(shù)據(jù)的獲得成本是非常高,不可能有大量的數(shù)據(jù);其次,數(shù)據(jù)可能很多,但滿足精準(zhǔn)需求的很少。比如銀行在做欺詐檢測(cè)時(shí),每天一個(gè)銀行的信用卡交易數(shù)據(jù)可能有幾百萬(wàn)甚至上千萬(wàn)條,但其中信用卡欺詐的數(shù)據(jù)可能很少;另外,數(shù)據(jù)的總量很多,但是已經(jīng)被標(biāo)注了結(jié)果的很少。比如做軟件的缺陷檢測(cè),我們擁有大量的程序代碼,但程序代碼中缺陷被標(biāo)記出來(lái)的非常少。
環(huán)境適應(yīng)弱
一個(gè)已經(jīng)訓(xùn)練好的機(jī)器學(xué)習(xí)模型,如果環(huán)境發(fā)生變化,就很有可能失效。比如在一個(gè)傳感器世界里,放出一百個(gè)傳感器。一個(gè)月之后有60個(gè)傳感器失效了,這時(shí)候重新部署60個(gè)傳感器,原有模型的性能會(huì)大幅度衰減。因?yàn)樾碌膫鞲衅魉l(fā)出的信號(hào)質(zhì)量和強(qiáng)度和原來(lái)的也會(huì)有很大的變化,原有模型已經(jīng)很難適應(yīng)。
可解釋性差
今天的機(jī)器學(xué)習(xí)系統(tǒng)絕大多數(shù)都是黑箱,我們可以利用機(jī)器學(xué)習(xí)非常精確的預(yù)測(cè),但是很難解釋是如何做出這樣的預(yù)測(cè)的。這就會(huì)導(dǎo)致機(jī)器學(xué)習(xí)系統(tǒng)在一些高風(fēng)險(xiǎn)應(yīng)用里很難使用。比如做地震預(yù)報(bào),我們預(yù)報(bào)明天有地震,請(qǐng)群眾撤離。領(lǐng)導(dǎo)肯定會(huì)問是如何做出這樣的決策,這時(shí)候如果機(jī)器學(xué)習(xí)模型是黑箱,我們將無(wú)法說(shuō)明做出預(yù)報(bào)的理由,這樣的預(yù)報(bào)很難被采納。
性能差異大
我們?cè)谑褂脵C(jī)器學(xué)習(xí)技術(shù)時(shí),即使對(duì)同樣的數(shù)據(jù),普通用戶所能得到的結(jié)果和專家所能得到的結(jié)果差別可能非常大。怎樣處理數(shù)據(jù)、如何使用機(jī)器學(xué)習(xí)模型,每個(gè)人的知識(shí)和經(jīng)驗(yàn)差別會(huì)導(dǎo)致獲得結(jié)果的巨大差異。
數(shù)據(jù)分享難
以現(xiàn)有的醫(yī)院情況舉例。如今各地都在發(fā)力智慧醫(yī)療,大型醫(yī)院里很多病例數(shù)據(jù),基于這些病例數(shù)據(jù)能夠做出非常優(yōu)秀的診斷系統(tǒng)。相比之下,社區(qū)醫(yī)院的病例數(shù)據(jù)較少,基于已有數(shù)據(jù)很難做出好的模型,需要大型醫(yī)院的數(shù)據(jù)支撐。但是大型醫(yī)院一旦與社區(qū)醫(yī)院分享病例數(shù)據(jù),會(huì)涉及到數(shù)據(jù)隱私、數(shù)據(jù)所有權(quán)、數(shù)據(jù)保護(hù)等問題,對(duì)接起來(lái)非常不舒暢,存在一個(gè)數(shù)據(jù)分享的“墻”。
學(xué) 件
關(guān)于機(jī)器學(xué)習(xí),還有很多其他問題。幾乎每個(gè)研究方向都有人在做相關(guān)的探索。但如果將所有問題逐一獨(dú)立解決,很難擺脫“頭疼醫(yī)頭、腳疼醫(yī)腳”的狀態(tài)。應(yīng)該考慮在一個(gè)整體性的框架之下全面地去思考并解決這些問題。最近研究者提出了一個(gè)想法,叫做“學(xué)件”(Learnware)。目的是讓那些在某一領(lǐng)域的機(jī)器學(xué)習(xí)應(yīng)用中已經(jīng)建立好的模型被分享出來(lái),建立一個(gè)“市場(chǎng)”讓人們能夠分享這些模型。這樣,當(dāng)一個(gè)新用戶想要做機(jī)器學(xué)習(xí)應(yīng)用時(shí),就不用從頭去建模型,而是可以先到學(xué)件市場(chǎng)上在已有模型中尋找合適的模型作為基礎(chǔ)。
為了達(dá)到這一目的,學(xué)件應(yīng)由兩部分組成。一部分是模型(Model),另一部分是用于描述這個(gè)模型的規(guī)約(Specification)。模型需要滿足三個(gè)重要要求:可重用性、可演進(jìn)性、可了解性;規(guī)約要能夠給模型提供足夠的描述。如果學(xué)件市場(chǎng)可以成為現(xiàn)實(shí),我們將解決機(jī)器學(xué)習(xí)的局限性問題。