孫茂松
人工智能的“熱”現(xiàn)狀
人工智能很“熱”,我們現(xiàn)在談?wù)撊斯ぶ悄芨嗍菑膽?yīng)用來(lái)看,從大眾角度來(lái)說(shuō)。人工智能的研究初心是讓機(jī)器人具有人類個(gè)體的智能,也就是感知和認(rèn)知的能力。感知,雖然不是人類獨(dú)有的,但與人類認(rèn)知密切相關(guān)。認(rèn)知?jiǎng)t是人們獲得知識(shí)或應(yīng)用知識(shí)的過(guò)程,或信息加工的過(guò)程,像語(yǔ)言、記憶、推理、思維、想象等,都屬于認(rèn)知。人工智能這些年的發(fā)展,特別是隨著互聯(lián)網(wǎng)的興起,產(chǎn)生了超越初心的部分——群體智能,這是個(gè)體智能所沒(méi)有的,比如智慧城市等。人工智能發(fā)展歷史經(jīng)歷了大的“三起兩落”,發(fā)端于2010年的第三次“起”趨于真實(shí),人工智能研究從象牙塔走向社會(huì),其最早的顯著性標(biāo)志是語(yǔ)音識(shí)別。進(jìn)入21世紀(jì)后大約有十年的時(shí)間,全世界研究者嘗試了各種機(jī)器學(xué)習(xí)的方法,語(yǔ)音識(shí)別的錯(cuò)誤率怎么也降不下去。2010年人工智能進(jìn)化到以深層神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí),使得語(yǔ)音識(shí)別的錯(cuò)誤率大幅下降,開(kāi)啟了這一波人工智能的高潮。2012年圖像識(shí)別、2015年機(jī)器翻譯也取得了類似的效果。圖像識(shí)別用的深層神經(jīng)網(wǎng)絡(luò)是卷積神經(jīng)網(wǎng)絡(luò)CNN,差不多可以說(shuō)它是直接借鑒了腦的視覺(jué)處理機(jī)理,在國(guó)際公開(kāi)測(cè)試集上前幾年已超過(guò)了人類的識(shí)圖能力。機(jī)器翻譯用的是循環(huán)神經(jīng)網(wǎng)絡(luò)RNN。最近,有研究者發(fā)現(xiàn)人腦中存在類似的機(jī)制,這個(gè)腦科學(xué)的發(fā)現(xiàn)反而是受到了計(jì)算機(jī)科學(xué)的啟發(fā)。2016年谷歌研發(fā)的人工智能AlphaGo,利用了人類歷史上所有的優(yōu)秀棋譜,同時(shí)加上機(jī)器學(xué)習(xí),讓機(jī)器自己跟自己下,終于戰(zhàn)勝了人類頂尖棋手;不過(guò),其后迭代出的AlphaGo Zero卻不再需要任何人類棋局,完全由機(jī)器自己跟自己下,結(jié)局是AlphaGo Zero完勝AlphaGo。如此種種,令人工智能留給公眾“神乎技矣”的深刻印象,大家對(duì)它產(chǎn)生了高度關(guān)注和期待。
人工智能的“冷”思考
這一代人工智能技術(shù)是以CNN和RNN為主要手段的深度學(xué)習(xí)技術(shù),在大數(shù)據(jù)、大算力的支持下,人工智能得以發(fā)揮作用,產(chǎn)生了驚艷的效果。需要注意的是,我們現(xiàn)在可能過(guò)多強(qiáng)調(diào)了人工智能“強(qiáng)勢(shì)”的一面,對(duì)其局限性則關(guān)注不夠。前幾年,我們總在討論人工智能是否會(huì)超越人類,答案應(yīng)該是“否”。實(shí)際上,這一代的人工智能技術(shù)要超越人類,需具備幾個(gè)基本條件。
首先是單一任務(wù),任務(wù)的邊界是清楚的,比如下棋就是下棋,不能是炒菜。該任務(wù)還必須同時(shí)滿足如下性質(zhì):第一,其可能狀態(tài)是有限的,不能有超出預(yù)期的狀態(tài)出現(xiàn);第二,元規(guī)則要確定,比如下棋,規(guī)定好你走一步我走一步,什么叫“死棋”,什么叫“活棋”;第三,信息完備,信息對(duì)雙方都是公開(kāi)的;第四,也是最為重要的是,結(jié)果判斷可量化。人工智能面對(duì)滿足上述條件的任務(wù),一定能夠戰(zhàn)勝人類頂級(jí)高手。但問(wèn)題是,現(xiàn)實(shí)任務(wù)同時(shí)符合這幾個(gè)條件的幾乎沒(méi)有,無(wú)論是圖像識(shí)別、語(yǔ)音識(shí)別、機(jī)器翻譯還是自動(dòng)駕駛,都至少不具備其中一個(gè)條件。在這些領(lǐng)域,目前的深度學(xué)習(xí)技術(shù),即使給它足夠大的數(shù)據(jù),要超越人類頂級(jí)高手實(shí)質(zhì)上是不可能的,但確實(shí)有可能比大多數(shù)人做得好,所以可以輔助人類去替代一些相對(duì)簡(jiǎn)單、重復(fù)性的智力勞動(dòng),這是這一代人工智能技術(shù)應(yīng)用的基本定位。
為什么這一代人工智能有局限性?深層神經(jīng)網(wǎng)絡(luò)的中間是一層一層的神經(jīng)元,層與層之間的神經(jīng)元以各種權(quán)重連接。它的長(zhǎng)處是通過(guò)大量與任務(wù)相關(guān)的輸入輸出數(shù)據(jù),可以自主學(xué)出來(lái)一個(gè)求解該任務(wù)的“函數(shù)”。理論上已經(jīng)證明,如果一個(gè)神經(jīng)網(wǎng)絡(luò)足夠復(fù)雜,它可以模擬、逼近任何函數(shù)。所以它的能力非常強(qiáng),這是相當(dāng)了不起的;但問(wèn)題也恰恰出在這兒——說(shuō)到底,它僅僅是一個(gè)針對(duì)特定任務(wù)的“函數(shù)”而已,我們并不清楚其中的功能機(jī)理,所以它的可解釋性、魯棒性都比較弱,運(yùn)用顯式知識(shí)的能力差,推理能力缺乏,可用性也會(huì)打折扣。也就是說(shuō),它的長(zhǎng)處和短處是共生并存的。如果某個(gè)輸入數(shù)據(jù)超出了這個(gè)“函數(shù)”的視野所及,是它沒(méi)有學(xué)過(guò)的,很可能馬上就會(huì)“犯糊涂”,產(chǎn)生種種令人意想不到的錯(cuò)誤。如在自動(dòng)駕駛中,本已訓(xùn)練好的AI系統(tǒng)可以很好地識(shí)別STOP交通標(biāo)志,但如果存心在上面貼上若干小紙條之類,人看一點(diǎn)兒?jiǎn)栴}也沒(méi)有,機(jī)器卻很可能會(huì)識(shí)別錯(cuò),你要是自動(dòng)駕駛或許一下子就掉下懸崖了。
深層神經(jīng)網(wǎng)絡(luò)的特點(diǎn)決定了AI很容易被沒(méi)有見(jiàn)到的情景所迷惑,而犯人不會(huì)犯的低級(jí)錯(cuò)誤。人容易犯的高級(jí)錯(cuò)誤,AI因?yàn)閷W(xué)習(xí)充分卻可能不會(huì)犯。人工智能可能隨時(shí)會(huì)犯低級(jí)錯(cuò)誤,所以在自動(dòng)駕駛之類關(guān)乎人的生命安全的應(yīng)用場(chǎng)合中,一定要十分慎重,設(shè)計(jì)好應(yīng)急措施。我們要正視人工智能的缺陷,辯證地看問(wèn)題。
人工智能與腦科學(xué)及智慧教育一瞥
這些年人工智能和腦科學(xué)的研究一直在試圖互相借鑒。人工智能學(xué)界始終在留意腦科學(xué)的最新研究成果,看看哪些對(duì)設(shè)計(jì)新的人工智能算法或模型有啟發(fā),雖然目前為止收獲不大,但這肯定是會(huì)越來(lái)越得到更多重視的一個(gè)方向。另一方面,現(xiàn)階段或許腦科學(xué)更容易從深度學(xué)習(xí)中找到新的實(shí)驗(yàn)方法。腦科學(xué)的實(shí)驗(yàn)數(shù)據(jù)足夠大,符合人工智能大數(shù)據(jù)運(yùn)算的特點(diǎn),利用深度學(xué)習(xí)技術(shù),很有希望提出腦科學(xué)數(shù)據(jù)分析的新手段甚至開(kāi)辟出新范式。
當(dāng)前人工智能作用于教育并取得確定性成效的工作還不太多,雖然國(guó)際上已經(jīng)有了不少初步的工作,如在線學(xué)習(xí)會(huì)產(chǎn)生大量數(shù)據(jù),可通過(guò)人工智能技術(shù)發(fā)現(xiàn)學(xué)習(xí)者的特點(diǎn),進(jìn)行個(gè)性化學(xué)習(xí),也就是因材施教。有研究根據(jù)學(xué)習(xí)者的以往學(xué)習(xí)數(shù)據(jù),比如某個(gè)視頻看了多長(zhǎng)時(shí)間、做題效果如何等,通過(guò)RNN神經(jīng)網(wǎng)絡(luò)預(yù)先判斷作業(yè)的難度,有針對(duì)性地推送適合學(xué)生個(gè)體水平的、難度適中的作業(yè);也有研究根據(jù)學(xué)習(xí)者行為讓AI自動(dòng)判斷課程中哪一部分內(nèi)容比較難。其實(shí)不同的學(xué)生感到困難的地方是不一樣的,并非固定不變,而以前決定課程內(nèi)容的難度,多是基于教師的主觀判斷;此外還有通過(guò)CNN神經(jīng)網(wǎng)絡(luò),借助視頻技術(shù)來(lái)分析老師講課的狀態(tài),如是精神飽滿還是比較平淡的照本宣科。教育學(xué)研究表明,在線教育中教師講課的生動(dòng)性,是能否抓住學(xué)習(xí)者的關(guān)鍵因素。對(duì)教學(xué)視頻進(jìn)行大規(guī)模的自動(dòng)分析,再同學(xué)習(xí)者大數(shù)據(jù)建立關(guān)聯(lián),有望對(duì)教師的在線教學(xué)提出改進(jìn)建議??傮w上看,人工智能賦能的智慧教育,其進(jìn)展還是可圈可點(diǎn)的,但人工智能融合腦科學(xué)的智慧教育,似乎才剛剛起步。