俞洪波
復(fù)旦大學(xué)生命科學(xué)學(xué)院,上海 200433
管中窺腦
俞洪波?
復(fù)旦大學(xué)生命科學(xué)學(xué)院,上海 200433
近年來,腦科學(xué)在技術(shù)方法上獲得了長足的進(jìn)步,多種成像手段能夠?yàn)槲覀兲峁哪X功能區(qū)到亞細(xì)胞結(jié)構(gòu)的活體實(shí)時(shí)成像數(shù)據(jù)。同時(shí),深度學(xué)習(xí)算法等神經(jīng)網(wǎng)絡(luò)算法被廣泛應(yīng)用,獲得了突破性進(jìn)展。這些算法與神經(jīng)生物學(xué)的基本原則相符,也將成為模擬腦的有力工作平臺(tái)。
雙光子成像;內(nèi)源性光學(xué)成像;功能核磁共振;深度學(xué)習(xí);人工智能
在過去的20年間,腦科學(xué)出現(xiàn)了突破性的進(jìn)展。一方面,各種新型的研究方法層出不窮,使得研究者能夠一層層打開腦的黑盒子;另一方面,神經(jīng)網(wǎng)絡(luò)算法在沉寂多年后,由量變到質(zhì)變,開始推動(dòng)人工智能的爆發(fā)式發(fā)展。這一浪潮方興未艾,推進(jìn)速度之快、面之廣、點(diǎn)之深、應(yīng)用之豐富,讓人始料未及,它未來的發(fā)展邊界目前還難以預(yù)見。這對(duì)人類社會(huì)是福音,是挑戰(zhàn),也是前所未有的威脅。
人類的腦質(zhì)量只有1.5 kg左右,直徑20 cm上下,但內(nèi)有乾坤。第一,在如此之小的空間內(nèi),容納著80多億個(gè)神經(jīng)元,數(shù)量龐大。第二,單個(gè)神經(jīng)元的形態(tài)各異,幾乎找不到形態(tài)上一模一樣的兩個(gè)神經(jīng)元。第三,每個(gè)神經(jīng)元可以伸出如樹干般的樹突,在樹突上分布著大量突觸,通過突觸與其他成千上百個(gè)神經(jīng)元相連,交換信息。這些數(shù)量達(dá)千億之多的突觸排列組合,意味著幾乎無限的可能。第四,突觸的連接可以在短時(shí)間內(nèi)被快速改變,增強(qiáng)或減弱,乃至于新生和消失。這些事實(shí)意味著,大腦是一個(gè)隨時(shí)在變化的千億個(gè)突觸隨機(jī)組合的復(fù)雜體系。
大腦不是一個(gè)靜態(tài)的穩(wěn)定體系,它隨時(shí)接受信息,處理并指揮軀體做出相應(yīng)的反應(yīng)。在這個(gè)過程中,傳遞著形形色色的電信號(hào),釋放著多種多樣的神經(jīng)遞質(zhì),其中涉及了多個(gè)不同的腦區(qū),其時(shí)間精確度在毫秒級(jí)別。以人類讀書這一行為為例:在系統(tǒng)層次,眼睛聚焦于閱讀的詞上,使得這個(gè)詞的像投射于視網(wǎng)膜的中央凹;視網(wǎng)膜進(jìn)行光電轉(zhuǎn)換,產(chǎn)生的動(dòng)作電位編碼,以數(shù)字信號(hào)的形式傳遞到外膝體;在外膝體經(jīng)過換元,再以動(dòng)作電位形式傳入初級(jí)視覺皮層;初級(jí)視覺皮層的信號(hào)沿著視覺的腹側(cè)通路繼續(xù)向上傳遞,進(jìn)入語言中樞;為人類所理解后,運(yùn)動(dòng)中樞再通過上丘發(fā)出眼動(dòng)信號(hào),支配眼動(dòng)肌,將注視點(diǎn)移動(dòng)到下一個(gè)詞上。更為重要的是,積極的閱讀,還包括注意力的控制,內(nèi)側(cè)顳葉區(qū)對(duì)新內(nèi)容的學(xué)習(xí)記憶,以及對(duì)分布于其他腦區(qū)的過往記憶的提取,以便在注意力的轉(zhuǎn)換之間對(duì)新老內(nèi)容進(jìn)行比對(duì)反芻,由此觸發(fā)包括前額葉皮層在內(nèi)的邏輯推理等思維過程。閱讀過程中,帶給人的憤怒、愉快等情緒有時(shí)會(huì)激活杏仁核、前扣帶回等多個(gè)情緒中心;這些情緒中心反過來,又會(huì)影響前述的信息處理過程。因此,信息的傳遞猶如多米諾骨牌,逐一觸發(fā),但復(fù)雜的是,其分支眾多,而且循環(huán)往復(fù),身陷其中,恍如多重羅生門。在上述每一個(gè)環(huán)節(jié)中,大腦信息處理還具有無處不在的隨機(jī)性。這一隨機(jī)性可以由外界刺激帶來,也可以是大腦自身的波動(dòng)性,這些隨機(jī)性可以在某一時(shí)刻成為決定信息分支走向的決定性因素,使得我們的思維靈動(dòng)、可預(yù)估但難以唯一求解。這些系統(tǒng)層次上的分析已經(jīng)是撲朔迷離,而每一個(gè)層次本身,又是多個(gè)神經(jīng)元所構(gòu)成的神經(jīng)網(wǎng)絡(luò),從還原論的角度來看,向下還可以是單個(gè)細(xì)胞層次、突觸層次、離子通道層次和生物大分子層次。每個(gè)層次都有其固有的多分支、動(dòng)態(tài)、隨機(jī)特性(圖1)。
圖1 腦的復(fù)雜度可以與宇宙相比。生物大分子具有獨(dú)特的空間構(gòu)象((a)一個(gè)蛋白質(zhì)的三維立體結(jié)構(gòu));眾多生物大分子組合成為細(xì)胞膜上分布的離子通道(b);突觸上分布著形形色色的離子通道((c)紅色的軸突終鈕與綠色的樹突小棘,可以構(gòu)成一個(gè)突觸結(jié)構(gòu)),進(jìn)行著神經(jīng)元之間的信號(hào)傳遞;多個(gè)神經(jīng)元組成的神經(jīng)網(wǎng)絡(luò)可以涌現(xiàn)出嶄新的功能特性((d)一個(gè)實(shí)現(xiàn)方位選擇性的回饋神經(jīng)網(wǎng)絡(luò));在每個(gè)腦區(qū)中都有無數(shù)不同類型的神經(jīng)網(wǎng)絡(luò)執(zhí)行不同的功能,不同腦區(qū)間呈現(xiàn)信息的層次化處理((e)視覺信息從視網(wǎng)膜到外膝體,再到初級(jí)視覺皮層);整個(gè)大腦是眾多腦區(qū)協(xié)同工作的復(fù)雜體系(f)
對(duì)研究者來說,面對(duì)數(shù)量如同恒河之沙、復(fù)雜如同一沙一世界、變幻如同一瞬一世的腦,首要的任務(wù)是建立起有效的觀察手段,能夠在某一個(gè)局限的時(shí)空,對(duì)腦的有限部分進(jìn)行研究。在活體工作狀態(tài)下,實(shí)時(shí)觀測腦的功能與結(jié)構(gòu)變化,顯得尤為重要。
鑒于腦區(qū)間信息的主要傳遞方式是動(dòng)作電位,長期以來經(jīng)典的研究手段是電生理記錄方法。通過尖端細(xì)小的微電極插入記錄腦區(qū)附近,可以記錄尖端100 μm附近神經(jīng)元的放電情況,經(jīng)過后續(xù)的分類處理等分析手法,能分離出單個(gè)細(xì)胞的動(dòng)作電位發(fā)放,稱之為單細(xì)胞記錄。該方法時(shí)間分辨率足夠高,直接記錄動(dòng)作電位放電,但缺陷也很明顯:它一次只能記錄有限個(gè)神經(jīng)元的反應(yīng),而且無從得知這些神經(jīng)元的形態(tài)與連接方式,好比從恒河中撈出幾粒沙子聽聲音,卻不知道是白沙還是黑沙。此外,它是一種有創(chuàng)的記錄方式,需要將微電極插入開顱的腦區(qū),在人類的腦研究中大大受限。
為了解決記錄神經(jīng)元數(shù)量少的問題,電極陣列,甚至于記錄芯片被相繼開發(fā)。一個(gè)8×8的電極陣列,在被植入腦后,可以同時(shí)記錄幾十個(gè)神經(jīng)元的放電,描繪出相應(yīng)腦區(qū)的功能反應(yīng)。為了克服植入后的連線問題,電極陣列向無線傳輸、小型化芯片方向發(fā)展,甚至于有可能在將來發(fā)展為柔性的、插入式的納米金屬網(wǎng)。這些電極陣列,不僅僅可以用來記錄觀測,也可以用來輸入刺激電流,改變局部神經(jīng)環(huán)路,是未來控腦的一個(gè)潛在生長點(diǎn)。
在全腦尺度上,無創(chuàng)的功能核磁共振等腦成像手段[1]提供了另一種視角。由于興奮的腦區(qū)神經(jīng)元活動(dòng)增加,會(huì)造成該腦區(qū)耗氧量增加,從而改變脫氧與含氧血紅蛋白的比例,已知脫氧與含氧血紅蛋白中鐵原子的磁性不同,因此,通過探測腦區(qū)中磁性的變化,即可間接地反映腦區(qū)的激活程度。磁性信號(hào)具有良好的穿透性,得以透過顱骨和腦組織檢測,因此能夠在無創(chuàng)情況下進(jìn)行,使得該方法在人腦研究中呈現(xiàn)出井噴式發(fā)展。該方法的局限性也很明顯,由于是間接的血氧信號(hào),它與神經(jīng)元的興奮性之間并不完全是線性對(duì)應(yīng)關(guān)系,因此準(zhǔn)確性不足。另外,常用的3 T磁場強(qiáng)度下,其空間和時(shí)間分辨率都不高,處于毫米和秒的量級(jí),與神經(jīng)元微米的尺度和微秒的功能反應(yīng)相比,相差甚多。在目前的實(shí)踐中,該方法用于比較大尺度的功能定位和慢時(shí)間尺度下的功能研究。盡管如此,功能核磁共振技術(shù)已經(jīng)深刻改變了人類對(duì)自身腦的認(rèn)識(shí),研究者對(duì)腦的功能結(jié)構(gòu)從束手無策到一窺大概,已經(jīng)是本質(zhì)性的進(jìn)步。由此衍生的許多改進(jìn)方法,例如彌散張量成像(DTI)已經(jīng)可以在無創(chuàng)情況下,勾勒腦區(qū)之間神經(jīng)纖維的連接方式;靜息態(tài)功能成像可以勾勒腦區(qū)之間的功能聯(lián)系程度。它們的結(jié)合能夠提供較大尺度下腦的功能連接圖譜,這在20年前是不可想象的夢想。隨著新的更強(qiáng)成像儀的研制,該方法的分辨率會(huì)越來越高,更為細(xì)致的圖譜將逐漸呈現(xiàn)出來。
與功能核磁共振類似,內(nèi)源性光學(xué)成像技術(shù)[2]也是利用局部腦區(qū)興奮所帶來的耗氧量增加。由于脫氧血紅蛋白和含氧血紅蛋白在605 nm的橙光下,光的吸收率差別很大,脫氧血紅蛋白會(huì)吸收更多的光子,因此,局部耗氧增加的腦區(qū)視覺上會(huì)更“暗”一些,這一差值大概在千分之一的水平,利用攝像機(jī),可以把這一差值記錄下來,通過光學(xué)的方法了解腦區(qū)的激活程度。這一方法空間分辨率強(qiáng)于功能核磁共振,大概在幾十微米的水平,在視覺、聽覺、體感等初級(jí)感覺皮層有很好的應(yīng)用,但是由于光的穿透力遠(yuǎn)遜于電磁信號(hào),無法穿過顱骨,因此必須要制備透明窗口,會(huì)帶來手術(shù)的創(chuàng)傷,在人腦的研究中大為受限。
以上的腦成像方法都無法直接觀察單個(gè)神經(jīng)元的形態(tài)與功能,而傳統(tǒng)的組織學(xué)方法需要對(duì)腦進(jìn)行灌流、固定、切片,所研究的是已經(jīng)喪失整體功能的腦。雙光子激光熒光成像技術(shù)[3]有效地彌補(bǔ)了這一空白,在熒光分子同時(shí)接受兩個(gè)光子能量之后,該熒光分子會(huì)實(shí)現(xiàn)能級(jí)躍遷,但高能級(jí)態(tài)并不穩(wěn)定,在跳回到低能級(jí)狀態(tài)的同時(shí),該熒光分子會(huì)釋放出一個(gè)光子,釋放出的熒光因此波長要長于激發(fā)光(兩個(gè)光子),能實(shí)現(xiàn)較好的波長上的分離。更為重要的是,要實(shí)現(xiàn)兩個(gè)光子的同步吸收,需要極高的光子密度,這一點(diǎn)是通過物鏡在空間上的聚焦,以及時(shí)間上激光的鎖模脈沖式發(fā)放實(shí)現(xiàn)(使得光子能量被壓縮于一個(gè)飛秒的時(shí)間窗口內(nèi)),這樣,僅僅在極小的聚焦點(diǎn)上才會(huì)釋放熒光;反過來說,在該時(shí)刻所獲得的所有熒光均來自于這一聚焦點(diǎn)。那么,如果對(duì)聚焦點(diǎn)進(jìn)行三維空間上的掃描,根據(jù)每個(gè)掃描點(diǎn)的熒光強(qiáng)度就可以重構(gòu)出該三維空間的形態(tài)。該方法光毒副作用小,漂白作用微乎其微,非常適合于活體樣本的成像。簡單來說,就好比將顯微鏡放在活體腦之上,實(shí)時(shí)地觀測腦結(jié)構(gòu)。它的空間分辨率可以小于1 μm,可以對(duì)神經(jīng)細(xì)胞,乃至于它們的樹突、軸突、樹突小棘等亞細(xì)胞結(jié)構(gòu)進(jìn)行精細(xì)的成像。根據(jù)熒光標(biāo)記物的不同,它可以用來觀測不同的信號(hào)。例如,如果熒光與細(xì)胞內(nèi)的鈣離子濃度相關(guān),就可以檢測刺激誘發(fā)下的鈣離子濃度變化,推導(dǎo)出神經(jīng)元的動(dòng)作電位發(fā)放頻率;如果熒光與某生化途徑特異性相關(guān),就可以研究細(xì)胞中該生化途徑的時(shí)空動(dòng)力學(xué)曲線;如果將熒光蛋白標(biāo)記與特定的基因片段相連,就可以找到特異性表達(dá)該基因的細(xì)胞,并描記出它的表達(dá)過程。所以,多種不同類型的熒光蛋白猶如明燈,而多光子熒光成像技術(shù)好比是點(diǎn)亮這些明燈并探測它們光芒的有利工具,使得對(duì)活體腦顯微結(jié)構(gòu)的研究不再是一片漆黑。
光學(xué)方法在腦科學(xué)中的應(yīng)用方興未艾(圖2)。2008年諾貝爾化學(xué)獎(jiǎng)授予了綠色熒光蛋白的發(fā)現(xiàn)與改造;短短6年之后,2014年的諾貝爾化學(xué)家再次授予了超高分辨率成像技術(shù)。這一技術(shù),突破了光學(xué)的衍射極限,使得研究者得以在活體狀態(tài)下觀測僅僅幾十納米的生物大分子,神經(jīng)元軸突中的微管、突觸前膜中的囊泡等及其微小的結(jié)構(gòu)在功能實(shí)現(xiàn)過程中的變化得以被一窺究竟,將成像的空間分辨率大大提升[4]。從另一個(gè)角度,無標(biāo)記的光學(xué)成像技術(shù)也在快速發(fā)展,二次諧波成像、拉曼波譜成像等非線性成像方法在快速地從物理學(xué)界遷移到生命科學(xué)中。它們無需外源性的熒光標(biāo)記物,利用生物大分子所特有的光學(xué)特性,予以特異性的成像,在未來具有廣闊的發(fā)展前景。
光學(xué)方法的另一個(gè)重要應(yīng)用是采用光遺傳學(xué)方法[5]控制大腦。研究者利用光敏感蛋白的基因序列,將其轉(zhuǎn)入神經(jīng)細(xì)胞,通過外源光控制細(xì)胞膜上光敏感蛋白介導(dǎo)的離子通道的開關(guān),人為地興奮或抑制特定類型的神經(jīng)細(xì)胞,實(shí)現(xiàn)控制大腦的目的。光具有迅速、模式轉(zhuǎn)換方便、空間分辨率強(qiáng)等特點(diǎn),理論上有可能對(duì)腦中的多個(gè)關(guān)鍵節(jié)點(diǎn)實(shí)現(xiàn)精準(zhǔn)的時(shí)空控制,這和腦信號(hào)的時(shí)空反應(yīng)特性匹配。因此,利用該方法,神經(jīng)科學(xué)研究者已經(jīng)得以在小鼠中對(duì)記憶等腦活動(dòng)進(jìn)行操控,意義重大。這些工作只是剛剛啟動(dòng)帷幕而已。
圖2 多尺度活體腦的光學(xué)成像手段。對(duì)同一腦區(qū),可以采用不同的光學(xué)成像手段獲取不同分辨率的結(jié)構(gòu)與功能圖。采用內(nèi)源性光學(xué)成像手段,可以同時(shí)觀察10 mm范圍內(nèi)的功能反應(yīng)圖((a)初級(jí)視覺皮層上獲得的最優(yōu)方位功能圖);對(duì)其中某個(gè)小區(qū)域,可以采用鈣指示劑染色的方法,標(biāo)記上百個(gè)神經(jīng)元(b),并記錄它們對(duì)外界刺激的功能反應(yīng)((c)單個(gè)細(xì)胞的方位功能圖,不同顏色顯示它們不同的方位選擇性);對(duì)其中某個(gè)細(xì)胞,可以進(jìn)行定點(diǎn)染色,標(biāo)記出它完整的細(xì)胞形態(tài)(e),甚至于細(xì)致的亞細(xì)胞結(jié)構(gòu)((d)一段樹突上的樹突小棘)
以上列舉的僅僅是近年來腦科學(xué)技術(shù)進(jìn)步的有限部分,更多的側(cè)重于對(duì)腦功能的實(shí)時(shí)記錄與控制,而在腦科學(xué)的分子遺傳學(xué)機(jī)制方面所獲得的突破,也同樣是不勝枚舉。這些不同技術(shù)的不斷發(fā)展應(yīng)用,將勾勒出越來越精細(xì)的腦結(jié)構(gòu)與功能,使得我們在各個(gè)不同層次獲得海量的實(shí)驗(yàn)數(shù)據(jù)。但如果僅僅獲得了某一層次的數(shù)據(jù),也只是盲人摸象、管中窺豹,對(duì)腦這樣一個(gè)復(fù)雜體系,只是如實(shí)地描繪某一環(huán)節(jié)的運(yùn)行方式,是遠(yuǎn)遠(yuǎn)不夠的。以人類社會(huì)為例,幾十億人的所有信息理論上都有技術(shù)手段能完整獲取,但其運(yùn)行的方式和未來的軌跡,在沒有了解機(jī)制的情況下,是無從下手的。因此,在腦科學(xué)的發(fā)展提供了前所未有的觀測精度的情況下,未來的關(guān)注焦點(diǎn)將越來越多地投入到基本運(yùn)行機(jī)制的研究上。
在神經(jīng)科學(xué)研究者努力探尋腦工作機(jī)制的同時(shí),相關(guān)的研究思路也影響著基于神經(jīng)網(wǎng)絡(luò)的算法研究。有所不同的是,在人工智能研究領(lǐng)域,可以在計(jì)算機(jī)中便捷地搭建任何類型的計(jì)算網(wǎng)絡(luò),可以自由構(gòu)建仿真腦的層次性結(jié)構(gòu),但不必與真實(shí)的大腦完全等同。本質(zhì)上來說,它們與腦科學(xué)共享一些基本思路,但屬于并不相同的兩個(gè)體系。在經(jīng)過多年探索后,以深度學(xué)習(xí)算法[6]為代表的人工智能應(yīng)用近幾年來獲得了根本性的突破。2012年,“谷歌大腦”團(tuán)隊(duì)讓該網(wǎng)絡(luò)自主地學(xué)會(huì)了貓的概念,他們利用百萬張貓的圖片,訓(xùn)練一個(gè)具有多個(gè)層級(jí)的神經(jīng)網(wǎng)絡(luò),每次的訓(xùn)練都會(huì)對(duì)網(wǎng)絡(luò)進(jìn)行一次基于特定算法(而非人為)的修正,經(jīng)過多次自主學(xué)習(xí),該網(wǎng)絡(luò)可以非常準(zhǔn)確地識(shí)別出從未見過的貓圖片。在這個(gè)過程中,沒有特定的人為指導(dǎo)去界定什么是貓,一切源于自主學(xué)習(xí),貓的概念在經(jīng)過百萬次學(xué)習(xí)后固化,存儲(chǔ)于多個(gè)層次的神經(jīng)網(wǎng)絡(luò)里每個(gè)節(jié)點(diǎn)的連接權(quán)重中。自此之后,人工智能的發(fā)展一日千里,目前在人臉識(shí)別能力上已經(jīng)全面超越人本身,在語音識(shí)別、大數(shù)據(jù)的特征提取、語言翻譯、自動(dòng)駕駛、智力競賽等多個(gè)方面都獲得了根本性的突破,使得原本很多經(jīng)驗(yàn)依賴性的工作,能越來越多地被智能算法所替代,大有引領(lǐng)新一代工業(yè)革命的勢頭(圖3)。
圖3 人工智能在深刻改變?nèi)祟惿鐣?huì)。2012年“谷歌大腦”團(tuán)隊(duì)利用深度學(xué)習(xí)網(wǎng)絡(luò)讓計(jì)算機(jī)自發(fā)學(xué)會(huì)了貓的概念(a),隨后它被運(yùn)用于計(jì)算機(jī)的看圖說話中((b)計(jì)算機(jī)可以說出“一群年輕人在草地上玩飛盤”),語言的同聲翻譯中((c)大量語音識(shí)別與翻譯App已經(jīng)涌現(xiàn)),自動(dòng)駕駛車輛已經(jīng)在高速路上行駛(d),IBM的Waston機(jī)器人參加人類的智力競賽并多次奪冠(e)
人工智能領(lǐng)域的快速進(jìn)展,也推動(dòng)著研究者對(duì)人腦的認(rèn)識(shí)。腦科學(xué)研究者迫切地想知道是什么促成了深度學(xué)習(xí)算法的成功。在深度學(xué)習(xí)框架中,包括很多自下而上傳遞信息的層次,每個(gè)層次本身是一個(gè)多點(diǎn)的矩陣,每個(gè)像素點(diǎn)可以類比為一個(gè)神經(jīng)元(或一個(gè)功能單元)。每個(gè)神經(jīng)元可以向下一層次的多個(gè)神經(jīng)元傳遞信息,其傳遞的節(jié)點(diǎn)類似于神經(jīng)系統(tǒng)中的突觸,其算法的核心是傳遞的權(quán)重在學(xué)習(xí)中不斷改變,類似于神經(jīng)系統(tǒng)中的突觸可塑性。因此,下一級(jí)神經(jīng)元的輸入是上一級(jí)中多個(gè)神經(jīng)元輸入的權(quán)重加和,而該神經(jīng)元的輸出是輸入總和的非線性函數(shù)(多采用S型曲線),前一個(gè)加和過程在神經(jīng)系統(tǒng)中類似于突觸后電位的整合,后一個(gè)編碼過程類似于從突觸后電位轉(zhuǎn)變?yōu)閯?dòng)作電位的閾上發(fā)放。在整個(gè)訓(xùn)練過程中,以圖像識(shí)別為例,刺激圖像首先激活第一層的神經(jīng)網(wǎng)絡(luò),并依次整合,傳遞到下一層神經(jīng)網(wǎng)絡(luò),在傳遞過程中,下一級(jí)的神經(jīng)元接受刺激的范圍逐級(jí)擴(kuò)大,刺激本身會(huì)改變連接權(quán)重(類似于神經(jīng)系統(tǒng)中的Hebb準(zhǔn)則,同步激活的神經(jīng)元間的連接權(quán)重會(huì)增加),在信息不斷向上傳遞的過程中,信息高度整合,會(huì)在最高層次做出判斷(是不是貓?),如果和標(biāo)注(人工事先判定是否是貓)一致,則固化這些連接權(quán)重改變,如果不一致,則從上而下地進(jìn)行誤差反傳,依次修改每一層次的連接權(quán)重,直到與標(biāo)注一致為止。誤差反傳算法的參數(shù)在不同研究者中有所不同,但一旦設(shè)定,不會(huì)做出人為干預(yù)。因此,該算法本質(zhì)上是一類只進(jìn)行結(jié)果判斷的自組織學(xué)習(xí)。
綜上所述,這些基本過程都與經(jīng)典的神經(jīng)生物學(xué)相符,是一些非?;镜男畔鬟f方式,并沒有涉及復(fù)雜的網(wǎng)絡(luò)構(gòu)建、特異性的時(shí)空動(dòng)力學(xué)設(shè)計(jì),但它為何會(huì)在近幾年獲得根本性的突破?主要的因素在于大樣本訓(xùn)練,深層次網(wǎng)絡(luò)運(yùn)算。具體來說,在網(wǎng)絡(luò)化時(shí)代之前,想要獲得上百萬張有標(biāo)注的貓的圖片非常困難,但隨著自媒體、網(wǎng)絡(luò)和搜索引擎的快速發(fā)展,Google得以獲得這樣的大樣本資源,用于訓(xùn)練。在上百萬次的訓(xùn)練中,貓的概念得以成型,這是典型的由量變到質(zhì)變的過程。在人類發(fā)育早期的學(xué)習(xí)過程中,嬰兒甚至于無法聽懂父母的教誨,有的只是多次的刺激與簡單的反饋(例如吃手、抓東西等簡單任務(wù)學(xué)習(xí)),這種自發(fā)學(xué)習(xí)的過程與深度學(xué)習(xí)算法非常相似。該算法成功的另外一個(gè)重要引擎是深層次的神經(jīng)網(wǎng)絡(luò)運(yùn)算,之前的神經(jīng)網(wǎng)絡(luò)很少能超過5層,原因不是研究者不想,只是因?yàn)椴荒埽總€(gè)層次的增加都會(huì)帶來巨大的運(yùn)算量,而且自上而下的誤差反傳很難反向傳遞到底層。在云計(jì)算等運(yùn)算能力達(dá)到臨界點(diǎn),以及誤差反傳算法簡化到可實(shí)用性階段后,深層次的運(yùn)算終于實(shí)現(xiàn)。目前,某些算法框架中層次可以達(dá)到上百層,在深層次的神經(jīng)網(wǎng)絡(luò)中,天然地具備高精度處理復(fù)雜信息的潛能。這一點(diǎn)和人腦非常相似,以視覺系統(tǒng)為例,人類與視覺相關(guān)的腦區(qū)超過30個(gè),包括腹側(cè)與背側(cè)通路兩個(gè)主要的分支,而每一個(gè)腦區(qū)本身從解剖上來看就有6層。處理視覺任務(wù)的深度學(xué)習(xí)網(wǎng)絡(luò)框架與人的視覺系統(tǒng)高度相似,從電子工程和生命科學(xué)兩個(gè)不同的角度交互驗(yàn)證了體系構(gòu)造的合理性(圖4)。
令人振奮的是,初步的深度學(xué)習(xí)算法框架已經(jīng)能夠解決大量人工智能產(chǎn)業(yè)的實(shí)際問題,更為深入、類腦的算法改進(jìn)將帶來更多的沖擊。潛在的方向包括,如何在總體上自下而上的深度學(xué)習(xí)算法中引入反饋機(jī)制。在腦科學(xué)中,反饋無處不在,其投射總量甚至于超過前饋本身。已有的腦科學(xué)實(shí)驗(yàn)表明,反饋在注意力控制、情緒的影響、記憶的提取與比對(duì)、信息的選擇性閘門控制等諸多方面起著決定性作用。在人腦中,很多知識(shí)的獲取并不需要上百萬次的訓(xùn)練,而貓的概念建立可以很容易地幫助狗的概念的建立,這使得人腦在多任務(wù)開放體系中顯著占優(yōu)。目前,深度學(xué)習(xí)算法存在遷移能力差的問題,解決這些瓶頸問題,都有賴于腦科學(xué)的幫助。
圖4 深度學(xué)習(xí)的計(jì)算模型高度類腦。深度學(xué)習(xí)網(wǎng)絡(luò)包括多個(gè)層次,信息自下而上逐層傳遞,不斷整合(a);人類的視覺系統(tǒng)也是由眾多層次組成,信號(hào)從視網(wǎng)膜逐層向上傳遞(b)。它們的核心是自組織、自學(xué)習(xí)、多層次。但在人腦中,存在著無處不在的大量的反饋,而深度學(xué)習(xí)網(wǎng)絡(luò)還有所欠缺
同時(shí),腦科學(xué)也有自身難以攻克的難題。一個(gè)百億神經(jīng)元、多層次的神經(jīng)網(wǎng)絡(luò),以毫秒級(jí)別在運(yùn)算,以分鐘級(jí)別隨時(shí)在改變連接方式,采用任何技術(shù)手段,也無法勾勒全景,事實(shí)上,也沒有必要勾勒全景。原因在于,每個(gè)人的大腦都不相同,即便了解了某個(gè)人的全景,也無從復(fù)制到另外一個(gè)個(gè)體上。腦科學(xué)的未來不能停留在對(duì)某個(gè)腦區(qū)、某個(gè)現(xiàn)象的描述上,而應(yīng)該關(guān)注基本的組織規(guī)律和運(yùn)行規(guī)則。解決復(fù)雜系統(tǒng)的希望在于計(jì)算模擬,而非全景式的活體記錄。只有在超級(jí)計(jì)算平臺(tái)上,研究者才能便捷地探索腦的深層次神經(jīng)網(wǎng)絡(luò)及其時(shí)空動(dòng)力學(xué),才有可能在形形色色的個(gè)體表象背后,尋找真正的規(guī)律。這一點(diǎn),類似于經(jīng)典物理學(xué)中的牛頓三大定律,從此出發(fā),可以勾勒、驗(yàn)證并預(yù)測萬物的運(yùn)動(dòng)軌跡,這是腦科學(xué)研究者的夢想。深度學(xué)習(xí)等形形色色的機(jī)器學(xué)習(xí)網(wǎng)絡(luò)模型,已經(jīng)獲得了巨大成功,并在諸多基本理念上與神經(jīng)科學(xué)相符,是開展腦模擬的理想計(jì)算平臺(tái)。這樣的模擬平臺(tái)構(gòu)建簡單,運(yùn)算可控而快速,最為重要的是它完全透明,整個(gè)過程可以被研究者細(xì)致觀察。在模擬腦功能的基礎(chǔ)上,如果再利用多種腦科學(xué)技術(shù)手段,進(jìn)行有針對(duì)性的生物實(shí)驗(yàn),對(duì)關(guān)鍵問題進(jìn)行反復(fù)驗(yàn)證[7],可以預(yù)見,它將成為腦科學(xué)研究的一個(gè)重要研究方向。
我們處在一個(gè)偉大時(shí)代的開端,人類對(duì)自身的了解在未來的幾十年間將遠(yuǎn)超以往,從管中窺腦到一探究竟;人工智能的浪潮也僅僅開端,腦科學(xué)與人工智能的交互融合將大大加速這一進(jìn)程,成為基礎(chǔ)科學(xué)與社會(huì)變革緊密結(jié)合的典范。在可預(yù)見的未來,我們的生活將隨之而巨變,許多原本借助人力的服務(wù)將由機(jī)器完成,成本顯著降低,個(gè)性化的關(guān)懷服務(wù)不再是目前高昂的私人定制,而會(huì)變成一種社會(huì)標(biāo)準(zhǔn)。人類也許會(huì)在歷史上第一次從緊張的生產(chǎn)活動(dòng)中解放出來,享受生活并致力于創(chuàng)造性實(shí)踐。在敦煌壁畫中,繪制著西方極樂世界的圖景,寒暑隨著人的意愿轉(zhuǎn)換,生活富足,健康長壽,這一直是多少世代的追求,如今我們看到了它實(shí)現(xiàn)的一絲可能。但具有諷刺意味的是,即便在這樣一個(gè)社會(huì),佛教故事也描繪了人心的不足與貪婪,物質(zhì)生活水平的提升并沒滿足人類終極的精神生活需求。人們有理由擔(dān)心,如果未來的科技為少部分人所壟斷,社會(huì)財(cái)富的分配缺少公正與公義,宛如電影《黑客帝國》的一幕是否會(huì)成真?如果大部分人類錦衣玉食,缺少了生活的追求,是否成為人類墮落的開始?如果控腦技術(shù)發(fā)展成熟,它是否會(huì)被某些人利用,人類的自由意識(shí)將前所未有地受到威脅?如果人類發(fā)展的人工智能系統(tǒng)自我演化,脫離人類的控制,是否將意味著人類的終結(jié)?因此,這一傳統(tǒng)意義上理工學(xué)科的發(fā)展必然對(duì)法學(xué)、社會(huì)學(xué)、倫理學(xué)、哲學(xué)提出嶄新的挑戰(zhàn)。本質(zhì)上,人的精神家園也牢牢地植根于腦中,因此這也是一個(gè)腦科學(xué)的命題,我們的思想、道德、本我、意識(shí)在腦中是什么,它在哪里,如何運(yùn)作,去往何方?
(2016年11月14日收稿)
[1] OGAWA S, LEE T M, NAYAK A S, et al. Oxygenation-sensitive contrast in magnetic resonance image of rodent brain at high magnetic felds [J]. Magn Reson Med, 1990, 14(1): 68-78.
[2] GRINVALD A, SHOHAM D, SHMUEL A, et al. In-vivo optical imaging of cortical architecture and dynamics [M]//WINDHORST U, JOHANSSON H. Modern Techniques in Neuroscience Research. Berlin, Heidelberg: Springer,1999: 893-969.
[3] DENK W, STRICKLER J H, WEBB W W. Two-photon laser scanning fuorescence microscopy [J]. Science, 1990, 248(4951): 73.
[4] SUAREZ F, TING A Y. Fluorescent probes for super-resolution imaging in living cells [J]. Nat Rev Mol Cell Biol, 2008, 9(12): 929-943.
[5] DEISSEROTH K, FENG G, MAJEWSKA A K, et al. Next-generation optical technologies for illuminating genetically targeted brain circuits [J]. Journal of Neuroscience, 2006, 26(41): 10380.
[6] HINTON G E, OSINDERO S, TEH Y. A fast learning algorithm for deep belief nets [J]. Neural Computation, 2006, 18: 1527-1554.
[7] YU H, FARLEY B J, JIN D Z, et al. The coordinated mapping of visual space and response features in visual cortex [J]. Neuron, 2005, 47: 267-280.
(編輯:段艷芳)
Research brain function with multiple imaging techniques
YU Hongbo
School of Life Sciences, Fudan University, Shanghai 200433, China
Modern techniques in brain sciences have improved greatly in the past 20 years. The combination of multiple imaging techniques provides us in vivo live images of brain functional domains, as well as sub-cellular structures of a neuron. At the same time, deep learning neural network was widely applied and ground breaking improvement was achieved in various felds. This neural network shares similar organization principles in neurobiology, which may be a powerful platform to simulate the brain function.
two photon imaging, intrinsic signal optical imaging, function MRI, deep learning, artifcial intelligence
10.3969/j.issn.0253-9608.2016.06.002
?通信作者,E-mail: hongboyu@fudan.edu.cn