祝翠琴
(北京理工大學(xué)計(jì)算機(jī)學(xué)院,北京100081)
通用人工智能(Artificial General Intelligence,AGI)通常有兩種開發(fā)方式:一種基于電腦思維(以計(jì)算機(jī)科學(xué)為導(dǎo)向),另一種基于人腦思維(以神經(jīng)科學(xué)為導(dǎo)向)。兩種方法的計(jì)算方式和編碼程序完全不同。在通往通用人工智能的道路上,前者的探索實(shí)踐更長、研究完備性更強(qiáng)。但是另一方面,人類在認(rèn)識世界和改造世界的過程中,也從自然界和生物特征上汲取了大量的靈感和經(jīng)驗(yàn),基于腦與認(rèn)知的通用人工智能研究已經(jīng)成為近年來學(xué)術(shù)界和業(yè)界的一個(gè)重要研究熱點(diǎn)[1-2]。腦與認(rèn)知是受生物大腦神經(jīng)運(yùn)行機(jī)制和認(rèn)知行為機(jī)制啟發(fā),以計(jì)算建模為手段,通過軟硬件協(xié)同實(shí)現(xiàn)的機(jī)器智能??v觀腦與認(rèn)知領(lǐng)域近期技術(shù)與應(yīng)用成果,重要發(fā)展方向包括:類腦仿生研究與應(yīng)用改進(jìn)人工智能系統(tǒng)重建復(fù)雜的大腦皮層神經(jīng)網(wǎng)與回路是當(dāng)前研究重點(diǎn);神經(jīng)擬態(tài)計(jì)算延續(xù)火熱勢頭,脈沖神經(jīng)網(wǎng)絡(luò)被認(rèn)為是目前深度神經(jīng)網(wǎng)絡(luò)的“繼承者”;腦機(jī)接口技術(shù)發(fā)展呈現(xiàn)非侵入式趨勢,面向語言障礙病患實(shí)現(xiàn)語音合成的腦機(jī)接口技術(shù)成為近期新興研究方向。
圖1 腦與認(rèn)知技術(shù)是發(fā)展通用人工智能的重要環(huán)節(jié)Fig.1 Brain and cognition technology is an important component of Artificial General Intelligence(AGI)
類腦仿生技術(shù)充分學(xué)習(xí)人腦(及其他生物腦)的思維模式,從仿生角度努力尋求人工智能的突破,成為一門前景可觀、應(yīng)用范圍廣闊的熱門學(xué)科。在某種程度上,一個(gè)國家類腦仿生技術(shù)的發(fā)展水平將極大程度影響該國在軍事、工業(yè)等眾多行業(yè)的未來發(fā)展,因此類腦仿生技術(shù)的發(fā)展顯得尤為重要與急迫。2019年8月,《Nature Communications》認(rèn)為,對于建模人類和動物的大腦結(jié)構(gòu)與機(jī)理,進(jìn)行動物大腦的模仿與借鑒,比當(dāng)前廣泛采取的基于有監(jiān)督策略訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)更為重要[3]。因?yàn)閯游镌诼L的歷史進(jìn)化過程中發(fā)育和具備了高度結(jié)構(gòu)化的大腦連接,使它們能夠快速學(xué)習(xí)和適應(yīng),這種“先天”的神經(jīng)結(jié)構(gòu)直接決定了動物的技能與習(xí)性。從另一個(gè)角度,動物(包括人類)出生后具備快速學(xué)習(xí)和適應(yīng)的能力,很大程度上是因?yàn)樘焐途邆湟粋€(gè)高度結(jié)構(gòu)化的大腦連接。近年來的研究已經(jīng)證明,類腦仿生研究在加強(qiáng)對人腦認(rèn)知和理解方面具有重要意義。以昆蟲大腦(僅含1000 個(gè)神經(jīng)元)為模型的人工智能比試圖重建人類大腦(86億個(gè)神經(jīng)元和100 萬億突觸)要容易得多。這些生物可能會表現(xiàn)出更強(qiáng)的主觀性,這就將簡單的查表法擴(kuò)展到了與人工智能相關(guān)的潛在問題解決上。此外,生物系統(tǒng)甚至可以幫助研究者在機(jī)器人身上復(fù)制“意識”的元素??v觀近期人工神經(jīng)網(wǎng)絡(luò)的一些發(fā)展,不難看出其中很多成果都有神經(jīng)科學(xué)的影子。例如,DeepMind的Alpha家族的成功就是從動物學(xué)習(xí)的研究中汲取的靈感,計(jì)算機(jī)視覺領(lǐng)域最核心的模型卷積神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)靈感則來自于視覺皮層的結(jié)構(gòu)等。
2019年1月,美國國防預(yù)先研究計(jì)劃局(DARPA)發(fā)布微觀仿生魯棒性人工智能網(wǎng)絡(luò)(Micro-BRAIN)項(xiàng)目,旨在尋找能夠理解微型昆蟲的感覺和神經(jīng)系統(tǒng)并將其轉(zhuǎn)化為“原型計(jì)算模型”的方案和模型。預(yù)期該方案和模型可實(shí)現(xiàn)硬件集成以模擬昆蟲的思維和行為,為衍生更小、更節(jié)能、更容易訓(xùn)練的機(jī)器人鋪平道路。
2019年7月,哥倫比亞大學(xué)團(tuán)隊(duì)宣布完整破解線蟲神經(jīng)網(wǎng)絡(luò),這對解密大腦功能產(chǎn)生機(jī)理具有重要意義。該成果成功繪制出秀麗隱桿線蟲(腦細(xì)胞占比超過30%)全部神經(jīng)元的完整圖譜以及全部神經(jīng)元之間所有的7000個(gè)連接。進(jìn)一步地,把所有神經(jīng)元分到了不同層次,進(jìn)而解釋了信息在線蟲神經(jīng)網(wǎng)絡(luò)里的傳遞流程與規(guī)律。該成果發(fā)表于《Nature》[4]。雖然該研究也面臨可遷移性較差的問題,因?yàn)榧幢闶蔷€蟲個(gè)體之間也會存在差異,而目前學(xué)術(shù)界對此尚無有效解決辦法,但是該研究的意義仍是巨大的,它是歷史上首次補(bǔ)全了線蟲頭部負(fù)責(zé)執(zhí)行繁重計(jì)算任務(wù)的神經(jīng)環(huán),首次完整提供了動物神經(jīng)系統(tǒng)對腦結(jié)構(gòu)的直觀解釋,首次闡釋了大腦功能如何從神經(jīng)回路中產(chǎn)生。該成果被認(rèn)為是邁出了認(rèn)知神經(jīng)元相互作用機(jī)理以產(chǎn)生不同行為的重要一步。
2019年8月,美國谷歌公司基于果蠅的大腦切片,自動重建了完整的果蠅大腦神經(jīng)圖。整個(gè)過程中,谷歌公司使用了數(shù)千個(gè)TPU 進(jìn)行計(jì)算,并應(yīng)用Flood-Filling 網(wǎng)絡(luò)來自動追蹤果蠅大腦中的每一個(gè)神經(jīng)元,最終獲得了擁有40萬億像素的果蠅大腦神經(jīng)圖。谷歌公司計(jì)劃與美國霍華德·休斯醫(yī)學(xué)研究所和英國劍橋大學(xué)合作,利用該重建技術(shù)加速研究果蠅大腦的學(xué)習(xí)、記憶和感知機(jī)理。
2019年11月,德國馬克斯·普朗克腦研究所推出跨度七年的重要研究成果:重建復(fù)雜的大腦皮層神經(jīng)網(wǎng)絡(luò),揭示了迄今為止最大哺乳動物神經(jīng)線路圖,首次闡釋了哺乳動物神經(jīng)元的連接機(jī)理。該成果利用人工智能的方法,通過高空間分辨率從小鼠桶狀皮質(zhì)的第四層重建了約50 萬立方微米的體積(比以前從哺乳動物的大腦皮層進(jìn)行的密集重建約大300 倍)。該成果為進(jìn)一步探明大腦高效計(jì)算原理奠定基礎(chǔ),被認(rèn)為是仿生人工神經(jīng)網(wǎng)絡(luò)研究發(fā)展歷程中的一個(gè)重要里程碑事件。該成果發(fā)表于《Science》。
近年來,設(shè)計(jì)像真實(shí)神經(jīng)元那樣響應(yīng)神經(jīng)系統(tǒng)電信號的人工神經(jīng)元一直是醫(yī)學(xué)領(lǐng)域的主要目標(biāo),這有可能治療神經(jīng)元無法正常工作、突起在脊椎損傷中嚴(yán)重受損或死亡等情況。人工神經(jīng)元可以通過仿制生物回路的健康功能與充分響應(yīng)生物反饋來修復(fù)病變的生物回路,從而恢復(fù)身體功能。2019年12月,英國研究團(tuán)隊(duì)發(fā)布一款硅芯片人工神經(jīng)元,它不僅表現(xiàn)得像生物神經(jīng)元,而且僅需要微處理器十億分之一的功率,因此非常適合用于醫(yī)療植入物和其他生物電子儀器。該成果發(fā)表于《Nature Communications》[5]。
神經(jīng)擬態(tài)計(jì)算是一種高能效的神經(jīng)網(wǎng)絡(luò)計(jì)算架構(gòu),通過模仿人類大腦的運(yùn)作極力去求解一個(gè)問題答案。相關(guān)研究最早起源于20 世紀(jì)80年代,由于生物神經(jīng)元的發(fā)射是非確定性的,繼而引發(fā)出設(shè)計(jì)集成電路來模仿活神經(jīng)元細(xì)胞組織這一研究思路,以克服經(jīng)典馮諾依曼“確定性”計(jì)算架構(gòu)在很大程度上讓計(jì)算機(jī)無法模仿人類大腦的困難。神經(jīng)擬態(tài)計(jì)算技術(shù)利用脈沖信息,通過神經(jīng)網(wǎng)絡(luò)的通信方式來解決問題,可以被應(yīng)用于很多類的問題中,包括自學(xué)習(xí)、機(jī)器人控制、動態(tài)控制、稀疏編碼等經(jīng)典問題。
自2017年發(fā)布模仿人腦的“神經(jīng)擬態(tài)類”深度學(xué)習(xí)芯片Loihi之后,英特爾公司在神經(jīng)擬態(tài)計(jì)算領(lǐng)域的研究與突破不斷,并于2018年成立了英特爾神經(jīng)擬態(tài)研究社區(qū),全面推動神經(jīng)擬態(tài)的發(fā)展。2019年7月,英特爾公司發(fā)布全新神經(jīng)擬態(tài)系統(tǒng)Pohoiki-Beach。該系統(tǒng)集成了64 顆14nm 工藝的Loihi 芯片[6](該芯片受到大腦啟發(fā),將生物大腦原理應(yīng)用于計(jì)算機(jī)體系結(jié)構(gòu),單芯片集成128 個(gè)神經(jīng)擬態(tài)計(jì)算核心、13 萬個(gè)神經(jīng)元、1.3 億個(gè)突觸,并提供Python API 等編程工具鏈)、1320 億個(gè)晶體管,擁有800 萬個(gè)神經(jīng)元、80億個(gè)突觸。英特爾公司計(jì)劃在2020年初將載荷提升到768 顆芯片、1.5 萬億個(gè)晶體管、1億個(gè)神經(jīng)元、1萬億個(gè)突觸。未來的突破遠(yuǎn)不止于此,因?yàn)長oihi芯片擺脫了傳統(tǒng)硅芯片的馮諾依曼計(jì)算模型并且模仿人腦原理的神經(jīng)擬態(tài)計(jì)算方式和異步脈沖神經(jīng)網(wǎng)絡(luò),理論上講可以擴(kuò)展至16384 顆芯片互連,相當(dāng)于超過20 億個(gè)神經(jīng)元(人類大腦大約有86億個(gè)神經(jīng)元)。
2019年5月,瑞士神經(jīng)擬態(tài)處理器研發(fā)公司aiCTX 開源脈沖神經(jīng)網(wǎng)絡(luò)仿真平臺,該平臺是面向類腦計(jì)算的全球首款打通“傳統(tǒng)深度學(xué)習(xí)-脈沖神經(jīng)網(wǎng)絡(luò)-類腦芯片通路”的系統(tǒng)仿真平臺。2019年7月,aiCTX 宣布與博世公司(Boshc)、英飛凌公司(Infineon)、飛利浦公司等14 家合作伙伴共同開啟為期三年的項(xiàng)目。該項(xiàng)目面向?qū)崿F(xiàn)超低功耗神經(jīng)擬態(tài)運(yùn)算的重大需求,通過新興硬件架構(gòu)及配套存儲技術(shù)來滿足智能終端設(shè)備對復(fù)雜深度學(xué)習(xí)算法的應(yīng)用需求;同時(shí),審視當(dāng)前主流人工智能技術(shù)可能性,并嘗試將它們與深度神經(jīng)網(wǎng)絡(luò)和脈沖神經(jīng)網(wǎng)絡(luò)神經(jīng)形態(tài)運(yùn)算結(jié)合,對每種技術(shù)可能性與兼容性進(jìn)行評估,為人工智能邊緣計(jì)算趨勢的到來做好準(zhǔn)備。
脈沖神經(jīng)網(wǎng)絡(luò)被認(rèn)為是目前深度神經(jīng)網(wǎng)絡(luò)的“繼承者”,因其在運(yùn)算中合理有效地運(yùn)用了時(shí)域動力學(xué),所以非常適合于實(shí)時(shí)處理真實(shí)世界的傳感器數(shù)據(jù)(例如視頻或者聲頻),尤其是在需要快速實(shí)時(shí)響應(yīng)的情況下[7]。所以,神經(jīng)擬態(tài)計(jì)算的優(yōu)勢可總結(jié)為:從算法設(shè)計(jì)角度,脈沖神經(jīng)網(wǎng)絡(luò)中的脈沖神經(jīng)元提供了可以在時(shí)間域進(jìn)行實(shí)時(shí)信息處理的神經(jīng)網(wǎng)絡(luò)的基本方法;從硬件實(shí)現(xiàn)角度,類腦架構(gòu)能夠利用脈沖機(jī)制進(jìn)行高度稀疏的脈沖驅(qū)動運(yùn)算,大幅度節(jié)省了能耗。
神經(jīng)擬態(tài)計(jì)算被認(rèn)為是通向強(qiáng)人工智能的路徑,它基于大腦運(yùn)作機(jī)理,與目前主流深度神經(jīng)網(wǎng)絡(luò)的方式截然不同,有幾個(gè)顯著的改進(jìn):由于并非所有的神經(jīng)元每次都會激活,所以單個(gè)脈沖神經(jīng)網(wǎng)絡(luò)神經(jīng)元可以替代傳統(tǒng)深度神經(jīng)網(wǎng)絡(luò)中的數(shù)百個(gè)神經(jīng)元,從而在功耗和體積方面更勝一籌,成功開辟小型化道路[8];神經(jīng)擬態(tài)計(jì)算的遷移能力更強(qiáng),可以從一種環(huán)境中學(xué)習(xí)并到另一個(gè)環(huán)境中應(yīng)用示范,并且突破性地具備記憶和概括能力;神經(jīng)擬態(tài)計(jì)算已被證明可以使用無監(jiān)督的技術(shù)從環(huán)境中“從零開始”學(xué)習(xí),即只需很少的標(biāo)注樣本就可以快速學(xué)習(xí),突破傳統(tǒng)深度學(xué)習(xí)對標(biāo)注樣本的嚴(yán)重依賴。
腦機(jī)接口又名腦機(jī)融合感知或大腦端口,通常是指在人(或動物)腦與外部設(shè)備間建立的直接神經(jīng)鏈路,對運(yùn)動、感覺、語言等能力缺陷人群具有非常重要的意義。近年來,日益成熟的深度學(xué)習(xí)技術(shù)(模擬類腦深度神經(jīng)網(wǎng)絡(luò))被應(yīng)用到腦機(jī)接口研究中,腦機(jī)接口也成為深度學(xué)習(xí)研究的一個(gè)重要方向[9]。臨床實(shí)驗(yàn)證明,腦機(jī)接口技術(shù)可以幫助人類快速交流、控制機(jī)械臂、恢復(fù)癱瘓肢體的感覺和運(yùn)動等。依托腦機(jī)接口技術(shù)幫助肢體癱瘓患者也取得了一些進(jìn)展和技術(shù)積累[10],近期新興研究點(diǎn)關(guān)注于驗(yàn)證腦機(jī)接口技術(shù)對于語言障礙的病患實(shí)現(xiàn)語音合成。腦機(jī)接口技術(shù)應(yīng)用正向著“擴(kuò)大人類能力”的目標(biāo)不斷拓展。
2019年3月,美國初創(chuàng)腦機(jī)接口公司Neuralink發(fā)布了一項(xiàng)能夠快速將電線植入老鼠大腦的方法,即在移除一塊老鼠頭骨并插入一根針頭之后將柔性電極植入老鼠的腦組織。該成果被認(rèn)為是向人類大腦直接插入計(jì)算機(jī)潛在應(yīng)用系統(tǒng)邁出的重要一步。2019年7月,Neuralink 公司發(fā)布一項(xiàng)在截癱病患身上植入設(shè)備以輔助其操控外部設(shè)備(例如手機(jī)或電腦等)的新技術(shù)。它是將一條只有人頭發(fā)絲1/4粗細(xì)的電極線路植入人腦中,這條電極線路上有一系列微小電極和傳感器,可從大量細(xì)胞中捕獲信息并將其無線發(fā)送到計(jì)算機(jī)以供分析。該成果中電極通道數(shù)量可擴(kuò)容并使用高分子柔性細(xì)線,既可采集更多信號,也保障了電極線易植入且不受損,此舉超越了以往相關(guān)研究,并展示出良好前景,有望創(chuàng)造一個(gè)通過機(jī)器人手術(shù)植入的“高寬帶”腦機(jī)接口。
2019年4月,美國加州大學(xué)舊金山分校團(tuán)隊(duì)發(fā)布一項(xiàng)基于人工智能技術(shù)識別大腦電信號并將其輸出為合成語音的技術(shù)。該技術(shù)包括基于高密度皮層腦電圖的言語和發(fā)音器官運(yùn)動跟蹤、基于遞歸神經(jīng)網(wǎng)絡(luò)的多級解碼合成聲頻等兩個(gè)階段,旨在直接從癱瘓患者的大腦中“讀出”他們的意圖,并利用這些信息控制外部設(shè)備或移動癱瘓的肢體,使癱瘓患者每分鐘生成150 個(gè)單詞(接近正常人類水平)。該成果發(fā)表于《Nature》[11]。重構(gòu)的語音可理解程度仍明顯低于自然語音,腦機(jī)接口技術(shù)能否通過收集更大、更高質(zhì)量的數(shù)據(jù)集并繼續(xù)提高算法性能來不斷改進(jìn)重構(gòu)語音效果還有待觀察。
2019年7月,F(xiàn)acebook 公司發(fā)布一項(xiàng)用于構(gòu)建非侵入式可穿戴設(shè)備的腦機(jī)接口研究最新進(jìn)展——基于脈搏血氧儀來檢測神經(jīng)元的氧氣消耗。它通過實(shí)時(shí)感知捕獲大腦活動中的預(yù)期語音來幫助神經(jīng)損傷的病患者像正常人一樣交流,實(shí)現(xiàn)了人們在對話時(shí)大腦產(chǎn)生的活動可以實(shí)時(shí)解碼為電腦屏幕上的文字,突破了以往“離線”模式,在腦機(jī)接口研究領(lǐng)域首次實(shí)現(xiàn)了實(shí)時(shí)“翻譯文字”。該成果發(fā)表于《Nature Communications》[12]。這一成果證明了未來通過增強(qiáng)現(xiàn)實(shí)可穿戴設(shè)備來提高人機(jī)交互能力的新的可行性,也預(yù)示著相關(guān)研究邁向神經(jīng)植入物的重要一步,能夠幫助因中風(fēng)、脊髓損傷等失去對話能力的病患者輔助交流。
2019年10月,俄羅斯腦機(jī)接口公司Neurobotics發(fā)布一項(xiàng)非侵入式腦機(jī)接口技術(shù),實(shí)現(xiàn)了利用人工神經(jīng)網(wǎng)絡(luò)和腦電圖將人腦中的圖像實(shí)時(shí)可視化。與美國Neuralink公司成果不同,該技術(shù)無需激光開顱植入電極,因此在臨床應(yīng)用上更加容易實(shí)現(xiàn)。
美國Neuralink公司曾預(yù)測,腦機(jī)接口技術(shù)能夠在2021年之前治療嚴(yán)重的腦損傷。在現(xiàn)實(shí)中,通往臨床可行的語音合成腦機(jī)接口的道路上仍會面臨很多挑戰(zhàn)與障礙。此外,無法產(chǎn)生語音相關(guān)動作的病患者是否能夠使用語音合成腦機(jī)接口技術(shù)是未來研究的一個(gè)關(guān)鍵方向。能夠解碼腦活動的腦機(jī)接口商用之路還非常漫長,一方面因?yàn)榧夹g(shù)成熟度有待提高,且缺乏真實(shí)場景的可靠性驗(yàn)證;另一方面,不同科技巨頭對腦機(jī)接口技術(shù)的研發(fā)路線各異、標(biāo)準(zhǔn)尚待統(tǒng)一,例如,Neuralink公司的技術(shù)路線是開發(fā)包含大規(guī)模柔性電極的可植入陣列以增強(qiáng)腦功能,F(xiàn)acebook 公司的技術(shù)路線是制造借助紅外光從外部接收大腦信號的增強(qiáng)現(xiàn)實(shí)頭戴設(shè)備等。
人工智能旨在使機(jī)器具備類人智能,而腦與認(rèn)知技術(shù),則從人類和動物腦回路結(jié)構(gòu)與神經(jīng)元連接機(jī)理角度推動人工智能不斷發(fā)展,逐漸成為通過訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)之外另一個(gè)推動人工智能研究的路徑。當(dāng)今在通往通用人工智能道路上取得的成果主要源于人工神經(jīng)網(wǎng)絡(luò)的進(jìn)展,但離預(yù)期的達(dá)到人類智慧水平還相差很遠(yuǎn)。人工神經(jīng)網(wǎng)絡(luò)可以在游戲,如國際象棋、圍棋甚至星際爭霸等即時(shí)戰(zhàn)略類游戲中擊敗人類對手,但在大多數(shù)偏向認(rèn)知的方面,比如語言、推理、常識等方面,還無法接近四歲兒童的認(rèn)知能力。在這種情況下,從某種層面而言,腦與認(rèn)知的研究是探究甚至實(shí)現(xiàn)人工智能的最直接技術(shù)路線,而且可以為人工神經(jīng)網(wǎng)絡(luò)研究提供基礎(chǔ)導(dǎo)向,因?yàn)槿祟惡蛣游铩跋忍臁钡慕Y(jié)構(gòu)對其技能和習(xí)性有著決定性作用。