編譯 李升偉
一種稱為深度學(xué)習(xí)的人工智能技術(shù)目前正在用來(lái)模擬空間導(dǎo)航,這種人工智能系統(tǒng)建立了一種空間的表現(xiàn),類似于在哺乳動(dòng)物大腦內(nèi)發(fā)現(xiàn)的網(wǎng)格細(xì)胞。
深度學(xué)習(xí)是一種人工智能方法,它的靈感來(lái)自大腦神經(jīng)網(wǎng)絡(luò)。由于這種技術(shù)的貢獻(xiàn),催生了一系列的技術(shù),從自動(dòng)化視頻分析到語(yǔ)言翻譯。在《自然》雜志的一篇在線論文中,巴尼諾(Banino)等人使用這種框架獲得了關(guān)于真實(shí)生命神經(jīng)網(wǎng)絡(luò)的新認(rèn)識(shí),尤其是關(guān)于空間的幾何常規(guī)表示方法是如何促進(jìn)靈活的導(dǎo)航策略的。
可以訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò)怎樣從輸入得到特定的輸出,例如,學(xué)會(huì)從許多張不同人的照片中識(shí)別一幅特定的臉形。深度學(xué)習(xí)網(wǎng)絡(luò)由重復(fù)計(jì)算單元的連續(xù)層次組成,每個(gè)單元接收來(lái)自前一個(gè)層次的相似單元的輸入,然后向下一個(gè)層次發(fā)送輸出。從數(shù)學(xué)上來(lái)說(shuō),這樣一個(gè)網(wǎng)絡(luò)可以被視為一種高維函數(shù),可以通過(guò)改變一層的輸出在下一層的加權(quán)情況來(lái)調(diào)節(jié)。
在訓(xùn)練階段,網(wǎng)絡(luò)對(duì)函數(shù)進(jìn)行了調(diào)整,這通常依賴于一組輸入-輸出示例。例如,一個(gè)深度學(xué)習(xí)系統(tǒng)可能瀏覽了一系列相片,并知道哪張相片包含有它想要識(shí)別的臉形。深度學(xué)習(xí)系統(tǒng)的權(quán)重可以通過(guò)優(yōu)化算法自動(dòng)調(diào)整,直到其學(xué)會(huì)正確識(shí)別。深度學(xué)習(xí)網(wǎng)絡(luò)具有驚人的能力:能認(rèn)出和利用在例圖中重復(fù)出現(xiàn)的最有用的容貌特征和模式,能區(qū)別不同的臉形。但深度學(xué)習(xí)網(wǎng)絡(luò)的一個(gè)缺點(diǎn)是:最終的網(wǎng)絡(luò)往往是一個(gè)黑箱,在訓(xùn)練過(guò)程形成的計(jì)算方案經(jīng)常不能從各層之間分配的無(wú)數(shù)權(quán)重中得到解釋。
深度學(xué)習(xí)網(wǎng)絡(luò)可以成功地執(zhí)行感知任務(wù),但對(duì)如同導(dǎo)航這樣的復(fù)雜行為任務(wù)還研究甚少?,F(xiàn)實(shí)生活中導(dǎo)航的一個(gè)關(guān)鍵方面是通過(guò)根據(jù)方位和旅行距離計(jì)算每一步的位移來(lái)估計(jì)每一步之后的位置,這個(gè)過(guò)程稱之為路徑整合。神經(jīng)科學(xué)家、認(rèn)知科學(xué)家和計(jì)算機(jī)科學(xué)家認(rèn)為,這個(gè)過(guò)程對(duì)生成環(huán)境的認(rèn)知地圖至關(guān)重要。有幾種神經(jīng)元與大腦的認(rèn)知地圖相關(guān)聯(lián),包括位置細(xì)胞和頭部方向細(xì)胞,前者在生物體占領(lǐng)了環(huán)境中一個(gè)特定位置時(shí)會(huì)激活,后者標(biāo)志著頭的方向。
第三種神經(jīng)元,即網(wǎng)格細(xì)胞,當(dāng)動(dòng)物處于環(huán)境中形成六角形網(wǎng)格模式的任何一個(gè)點(diǎn)時(shí),它就會(huì)發(fā)出信號(hào)。一般認(rèn)為:網(wǎng)格細(xì)胞是具有幾何屬性的認(rèn)知地圖,有助于規(guī)劃和跟蹤軌跡。這些細(xì)胞存在于大腦的海馬體,在人腦內(nèi),海馬體負(fù)責(zé)空間學(xué)習(xí)、自身記憶和關(guān)于世界的一般事實(shí)的認(rèn)知。
巴尼諾等人期望在深度學(xué)習(xí)網(wǎng)絡(luò)中生成路徑整合。因?yàn)槁窂秸仙婕暗接涀∫郧疤幚聿襟E的輸出,將其作為下一個(gè)處理步驟的輸入,作者使用了一個(gè)包含反饋回路的網(wǎng)絡(luò)。他們通過(guò)模擬覓食鼠類路徑來(lái)訓(xùn)練網(wǎng)絡(luò)。此系統(tǒng)接收了如下的信息:模擬鼠類的線性速度和角速度,關(guān)于位置細(xì)胞和方向細(xì)胞的模擬活動(dòng);后者可以看作鼠類目前位置和頭部方向的“預(yù)言”。
作者發(fā)現(xiàn),在訓(xùn)練期間,類似網(wǎng)格細(xì)胞的活動(dòng)模式自發(fā)地出現(xiàn)在網(wǎng)絡(luò)中間層內(nèi)的計(jì)算單元內(nèi),盡管網(wǎng)絡(luò)或訓(xùn)練協(xié)議內(nèi)沒有明確這類模式。類似網(wǎng)格單元的出現(xiàn)是令人印象深刻的例子,說(shuō)明深度學(xué)習(xí)在做其最擅長(zhǎng)的事情,即發(fā)明一個(gè)原始、經(jīng)常是不可預(yù)測(cè)的內(nèi)部表示來(lái)幫助解決任務(wù)。
人工智能系統(tǒng)學(xué)會(huì)走捷徑 在哺乳動(dòng)物大腦中,位置細(xì)胞在動(dòng)物處于某環(huán)境內(nèi)特定位置時(shí)激活,頭部方向細(xì)胞在頭部處于某個(gè)特定方向時(shí)激活,而網(wǎng)格細(xì)胞則在動(dòng)物在環(huán)境中形成六邊形網(wǎng)格時(shí)激活。巴尼諾等人訓(xùn)練了一種稱為“深度學(xué)習(xí)網(wǎng)絡(luò)”的人工智能系統(tǒng)來(lái)進(jìn)行導(dǎo)航,通過(guò)向其提供鼠類覓食方式的模擬來(lái)訓(xùn)練,包括訓(xùn)練位置細(xì)胞和頭部方向細(xì)胞的活動(dòng)。網(wǎng)絡(luò)內(nèi)的一些計(jì)算單元建立起了類似網(wǎng)格細(xì)胞的激活方式(沒有顯示)。a,當(dāng)學(xué)習(xí)向某個(gè)目標(biāo)進(jìn)行導(dǎo)航時(shí),使用網(wǎng)格細(xì)胞的系統(tǒng)(黑線表示一種樣本路徑)和使用位置細(xì)胞和頭部方向細(xì)胞的系統(tǒng)(灰線)采用的是相同的路徑。b,但是當(dāng)導(dǎo)入捷徑時(shí),例如打開了以前關(guān)閉的門時(shí),只有使用網(wǎng)格細(xì)胞的系統(tǒng)發(fā)現(xiàn)了較短的路線,彰顯了類似網(wǎng)格細(xì)胞的活動(dòng)改善靈活導(dǎo)航策略的能力
類似網(wǎng)格的單元可以使網(wǎng)絡(luò)在路徑整合的基礎(chǔ)上保持對(duì)位置的跟蹤,這樣的單元能否幫助深度學(xué)習(xí)系統(tǒng)學(xué)會(huì)有效地從其目前位置導(dǎo)航到目標(biāo)位置呢?為了解決這個(gè)問(wèn)題,巴尼諾等人添加了一個(gè)強(qiáng)化學(xué)習(xí)元件,使得深度學(xué)習(xí)網(wǎng)絡(luò)學(xué)會(huì)賦值給特定位置的特定動(dòng)作。作為獎(jiǎng)勵(lì),更高的值賦與使模擬鼠類更接近目標(biāo)的動(dòng)作。類似網(wǎng)格的表示顯著改善了網(wǎng)絡(luò)解決目標(biāo)定向任務(wù)的能力,優(yōu)于起始和目標(biāo)位置由位置細(xì)胞和方向細(xì)胞編碼的對(duì)照模擬。當(dāng)諸如關(guān)閉的門等障礙物被移除時(shí),經(jīng)過(guò)訓(xùn)練的網(wǎng)絡(luò)會(huì)發(fā)現(xiàn)捷徑,甚至能夠在以前未被探索過(guò)的熟悉環(huán)境的附件內(nèi)推測(cè)達(dá)到目標(biāo)的路徑。這些結(jié)果支持這樣的觀念:網(wǎng)格細(xì)胞使大腦能夠執(zhí)行矢量計(jì)算(關(guān)于路徑的長(zhǎng)度和方向的計(jì)算),以幫助在以前未被探索的環(huán)境中進(jìn)行路徑規(guī)劃。
將來(lái),作者的深度學(xué)習(xí)網(wǎng)絡(luò)可用來(lái)探索網(wǎng)格細(xì)胞和位置細(xì)胞之間相互作用的后果。在目前的網(wǎng)絡(luò)內(nèi),模擬的位置層在訓(xùn)練期間并不發(fā)生改變。但是,在大腦內(nèi),網(wǎng)格細(xì)胞和位置細(xì)胞彼此相互影響,其途徑還未被充分認(rèn)識(shí)。盡管在缺乏網(wǎng)格細(xì)胞輸入的情況下,真實(shí)生命的位置細(xì)胞可以保持對(duì)空間的選擇;但是,當(dāng)動(dòng)物遠(yuǎn)離可用于定義位置的外部標(biāo)志時(shí),這些輸入似乎會(huì)很重要。在這些情況下,位置細(xì)胞依賴路徑整合,而網(wǎng)格細(xì)胞則保持對(duì)位置的精確估計(jì)。通過(guò)建立這樣的網(wǎng)絡(luò),使得位置細(xì)胞層可以受到類似網(wǎng)格輸入的調(diào)控,我們可以開始認(rèn)識(shí)位置細(xì)胞與網(wǎng)格細(xì)胞的關(guān)系。
從更廣義的視角來(lái)看,如下的方面是非常有趣的,即深度學(xué)習(xí)網(wǎng)絡(luò)可以發(fā)現(xiàn)類似大腦的路徑整合的解決方案,該解決方案來(lái)自非常普通的計(jì)算假定,不考慮特定的生物學(xué)機(jī)制。網(wǎng)絡(luò)集中于這樣一種解決方案是令人信服的證據(jù),表明網(wǎng)格細(xì)胞活動(dòng)模式存在一些特殊之處,支持路徑整合。但是,深度學(xué)習(xí)系統(tǒng)的黑箱特性意味著可能會(huì)很難確定那些特殊之處是什么。
同樣地,網(wǎng)格表示增強(qiáng)了目標(biāo)定向的事實(shí),令人信服地證明了大腦內(nèi)網(wǎng)格細(xì)胞的作用的概念。但是,作者必須使用相關(guān)性分析,以定性的直覺為指導(dǎo),間接推斷出網(wǎng)絡(luò)正在進(jìn)行向量計(jì)算。由于在模型內(nèi)無(wú)法直接操作這些計(jì)算,使得研究網(wǎng)格細(xì)胞成為有效導(dǎo)航方案的計(jì)算原理、算法和編碼策略變得困難。因此,理論家最終陷入了與實(shí)驗(yàn)主義者同樣的困境:試圖將一個(gè)不太為人所了解的復(fù)雜體系拆開來(lái)理解它。使深度學(xué)習(xí)系統(tǒng)更能理解人類推理是未來(lái)一項(xiàng)令人興奮的挑戰(zhàn)。
資料來(lái)源 Nature