陶建華陳云霽1 中國科學(xué)院自動(dòng)化研究所 北京 1001902 中國科學(xué)院計(jì)算技術(shù)研究所 北京 1001903 中國科學(xué)院腦科學(xué)與智能技術(shù)卓越創(chuàng)新中心 上海 200031
類腦計(jì)算芯片與類腦智能機(jī)器人發(fā)展現(xiàn)狀與思考*
陶建華1,3**陳云霽2,3
1 中國科學(xué)院自動(dòng)化研究所 北京 100190
2 中國科學(xué)院計(jì)算技術(shù)研究所 北京 100190
3 中國科學(xué)院腦科學(xué)與智能技術(shù)卓越創(chuàng)新中心 上海 200031
類腦智能是以計(jì)算建模為手段,受腦神經(jīng)和人類認(rèn)知行為機(jī)制啟發(fā),并通過軟硬件協(xié)同實(shí)現(xiàn)的機(jī)器智能。類腦器件以及類腦機(jī)器人分別作為類腦智能研究的重要內(nèi)容,其在類腦研究領(lǐng)域受到國內(nèi)外學(xué)者的廣泛關(guān)注。文章首先分析了類腦器件與計(jì)算系統(tǒng)中的類腦芯片和類腦機(jī)器人的發(fā)展現(xiàn)狀和應(yīng)用前景,重點(diǎn)探討了類腦芯片在模擬人腦神經(jīng)元模型和認(rèn)知計(jì)算方面,以及類腦機(jī)器人在感知控制和智能生長方面的研究內(nèi)容。然后,文章介紹了在中科院先導(dǎo)專項(xiàng)支持下,我國在這一方面的初步研究進(jìn)展以及未來發(fā)展方向。最后,針對(duì)現(xiàn)有研究中遇到的問題,文章對(duì)類腦計(jì)算芯片與類腦智能機(jī)器人的進(jìn)一步研究提出了建議,并指出未來研究在仿人運(yùn)動(dòng)模型、類人神經(jīng)運(yùn)動(dòng)控制、人機(jī)協(xié)同的智能機(jī)器人控制等方面有望取得重大突破。
類腦計(jì)算芯片,類腦智能機(jī)器人,人機(jī)協(xié)同,智能生長
近年來,以圖像識(shí)別、語音識(shí)別、機(jī)器翻譯、廣告推薦和數(shù)據(jù)挖掘?yàn)榇淼囊幌盗幸灾悄転楹诵牡膽?yīng)用已經(jīng)成為計(jì)算機(jī)的主流負(fù)載。據(jù)市場(chǎng)調(diào)研機(jī)構(gòu) TrendForce 的報(bào)告,2015 年全球智能終端的出貨量接近 17 億臺(tái),并以每年 25% 的速度增長。智能終端、智能機(jī)器人、智能硬件、智能互聯(lián)網(wǎng)等與人工智能、大數(shù)據(jù)技術(shù)交叉融合,一起促使人類社會(huì)邁向信息時(shí)代的高級(jí)階段:智能時(shí)代。
隨著智能時(shí)代對(duì)大規(guī)模數(shù)據(jù)處理的要求,現(xiàn)有的處理器結(jié)構(gòu)日益顯得乏力。例如,谷歌大腦用了上萬個(gè)通用處理器和耗時(shí)數(shù)天來學(xué)習(xí)如何識(shí)別貓臉;AlphaGo下圍棋時(shí)使用了上千個(gè)通用處理器和數(shù)百個(gè)圖形處理器,平均每局耗電電費(fèi)近 3 000 美元。對(duì)于很多智能技術(shù)來說,采用傳統(tǒng)通用處理器的實(shí)現(xiàn)方案會(huì)導(dǎo)致計(jì)算成本和計(jì)算速度均難以承受。而人的大腦由大量的神經(jīng)元(Neuron)通過突觸(Synapse)連接在一起,構(gòu)成了極其復(fù)雜的運(yùn)算網(wǎng)絡(luò)。目前,通過模擬人腦神經(jīng)元信息處理機(jī)制的深度神經(jīng)網(wǎng)絡(luò)技術(shù)已經(jīng)成為智能時(shí)代最為重要的建模方法,將深度神經(jīng)網(wǎng)絡(luò)技術(shù)融合到計(jì)算芯片(又稱為類腦計(jì)算芯片)也日益受到重視。事實(shí)上,在 20 世紀(jì) 80 年代,超大型體積電路(VLSI)主要研制者之一 Carver Mead 已經(jīng)開始利用大規(guī)模集成電路來實(shí)現(xiàn)此類神經(jīng)網(wǎng)絡(luò)計(jì)算功能,這項(xiàng)工作獲得了美國太空總署(NASA)與國家衛(wèi)生研究院(NIH)的重視。然而在相當(dāng)長的一段時(shí)間里,基于傳統(tǒng)互補(bǔ)金屬氧化物半導(dǎo)體(CMOS)技術(shù)的類腦計(jì)算芯片的實(shí)現(xiàn)一直進(jìn)展緩慢。2007 年納米尺寸憶阻器(Memristor)的出現(xiàn)使得類腦計(jì)算芯片的研究有了突飛猛進(jìn)的發(fā)展,它可有效實(shí)現(xiàn)可調(diào)節(jié)突觸強(qiáng)度的生物神經(jīng)突觸和神經(jīng)元之間的互聯(lián),從而為類腦計(jì)算芯片的快速發(fā)展奠定重要基礎(chǔ)。
與類腦計(jì)算芯片同步發(fā)展的還有類腦智能機(jī)器人。我國政府提出的《中國制造 2025》規(guī)劃綱要將機(jī)器人產(chǎn)業(yè)發(fā)展作為智能制造重點(diǎn)推進(jìn)的領(lǐng)域之一。目前,機(jī)器人已經(jīng)被廣泛應(yīng)用于汽車及零部件制造、機(jī)械加工、電子電氣及食品工業(yè)等諸多領(lǐng)域,成為衡量國家制造業(yè)水平和科技水平的重要標(biāo)志。盡管已有機(jī)器人經(jīng)常也被稱為“智能”機(jī)器人,然而這些“智能”機(jī)器人能夠?qū)崿F(xiàn)的動(dòng)作及行為能力基本是通過預(yù)定義的規(guī)則實(shí)現(xiàn)的,而人類進(jìn)行動(dòng)作、行為的學(xué)習(xí)主要是通過模仿及與環(huán)境的交互實(shí)現(xiàn)的。此外,目前“智能”機(jī)器人還不具有類腦的多模態(tài)感知及基于感知信息的類腦自主決策能力。在運(yùn)動(dòng)機(jī)制方面,目前智能機(jī)器人不具備類人的外周神經(jīng)系統(tǒng),其靈活性和自適應(yīng)性與人類運(yùn)動(dòng)系統(tǒng)還具有較大差距。
隨著人工智能、機(jī)器人和傳感器技術(shù)的不斷發(fā)展,機(jī)器人已經(jīng)由傳統(tǒng)在線示教工作模式向智能工作模式方向發(fā)展,結(jié)合腦科學(xué)研究成果,有希望為機(jī)器人理論和應(yīng)用研究帶來新的突破,最終有望成功制造類腦智能機(jī)器人。類腦智能機(jī)器人系統(tǒng)是融合了視覺、聽覺、思考和執(zhí)行等能力的綜合智能系統(tǒng),它能夠以類似于人腦的工作方式運(yùn)行。同時(shí),類腦智能機(jī)器人力圖將人的內(nèi)部機(jī)理融入機(jī)器人系統(tǒng),從而提高機(jī)器人的認(rèn)知、學(xué)習(xí)和動(dòng)作控制能力。通過融入對(duì)人的機(jī)理的探索,有望實(shí)現(xiàn)類腦智能機(jī)器人與人“共情”,從而產(chǎn)生更深度的交互與合作,也有望對(duì)國防、工業(yè)、服務(wù)業(yè)等領(lǐng)域提供更多的幫助[1]。
本文針對(duì)類腦計(jì)算芯片和類腦智能機(jī)器人發(fā)展的迫切需要,分析其技術(shù)發(fā)展現(xiàn)狀,并對(duì)迫切需要展開的研究內(nèi)容進(jìn)行一些思考。
廣義上來講,“類腦芯片”是指參考人腦神經(jīng)元結(jié)構(gòu)和人腦感知認(rèn)知方式來設(shè)計(jì)的芯片。很顯然,“神經(jīng)形態(tài)芯片”就是一種類腦芯片,顧名思義,它側(cè)重于參照人腦神經(jīng)元模型及其組織結(jié)構(gòu)來設(shè)計(jì)芯片結(jié)構(gòu),這代表了類腦芯片研究的一大方向。隨著各國“腦計(jì)劃”的興起和開展,涌現(xiàn)出了大量神經(jīng)形態(tài)芯片研究成果,受到國際上的廣泛重視并為學(xué)界和業(yè)界所熟知。例如,歐盟支持的 SpiNNaker 和 BrainScaleS、斯坦福大學(xué)的 Neurogrid、IBM 公司的 TrueNorth 以及高通公司的 Zeroth。
TrueNorth 是 IBM 潛心研發(fā)近 10 年的類腦芯片。美國 DARPA 計(jì)劃從 2008 年起就開始資助 IBM 公司研制面向智能處理的脈沖神經(jīng)網(wǎng)絡(luò)芯片。2011 年,IBM 公司通過模擬大腦結(jié)構(gòu),首次研制出兩個(gè)具有感知認(rèn)知能力的硅芯片原型,可以像大腦一樣具有學(xué)習(xí)和處理信息的能力。類腦芯片的每個(gè)神經(jīng)元都是交叉連接,具有大規(guī)模并行能力。2014 年,IBM 公司發(fā)布了稱為“TrueNorth”的第二代類腦芯片。與第一代類腦芯片相比,TrueNorth芯片性能大幅提升,其神經(jīng)元數(shù)量由 256 個(gè)增加到 100 萬個(gè);可編程突觸數(shù)量由 262 144 個(gè)增加到 2.56 億個(gè);每秒可執(zhí)行 460 億次突觸運(yùn)算,總功耗為 70 mW,每平方厘米功耗 20 mW。與此同時(shí),TrueNorth 處理核體積僅為第一代類腦芯片的 1/15。目前,IBM 公司已開發(fā)出一臺(tái)神經(jīng)元計(jì)算機(jī)原型,它采用 16 顆 TrueNorth 芯片,具有實(shí)時(shí)視頻處理能力[2]。TrueNorth 芯片的超強(qiáng)指標(biāo)和卓越表現(xiàn)在其發(fā)布之初就引起了學(xué)界的極大轟動(dòng)。
與 TrueNorth 不同,Zeroth 則是高通公司近幾年才開展研究的“認(rèn)知計(jì)算平臺(tái)”,但它卻在業(yè)界引起了巨大的震動(dòng)。原因就在于它可以融入到高通公司量產(chǎn)的 Snapdragon 處理器芯片中,以協(xié)處理的方式提升系統(tǒng)的認(rèn)知計(jì)算性能[3],并可實(shí)際應(yīng)用于手機(jī)和平板電腦等設(shè)備中,支持諸如語音識(shí)別、圖像識(shí)別、場(chǎng)景實(shí)時(shí)標(biāo)注等實(shí)際應(yīng)用并且表現(xiàn)卓越。
類腦芯片研究的另一大方向則是參考人腦感知認(rèn)知的計(jì)算模型而非神經(jīng)元組織結(jié)構(gòu)。具體講就是設(shè)計(jì)芯片結(jié)構(gòu)來高效支持成熟的認(rèn)知計(jì)算算法,如人工神經(jīng)網(wǎng)絡(luò)算法或目前備受關(guān)注的深度神經(jīng)網(wǎng)絡(luò)。例如,2012 年,中科院計(jì)算所研制了當(dāng)時(shí)國際上首個(gè)支持深度神經(jīng)網(wǎng)絡(luò)處理器架構(gòu)芯片“寒武紀(jì)”[4,5]。該技術(shù)兩次獲得計(jì)算機(jī)體系結(jié)構(gòu)領(lǐng)域主要國際會(huì)議 ASPLOS[4]和 MICRO[5]最佳論文,其設(shè)計(jì)方法和達(dá)到的性能得到了國際上很好的認(rèn)可。該芯片可以作為類腦芯片這個(gè)研究方向上的杰出代表。
圖1 的兩個(gè)芯片可以作為類腦芯片兩大方向上的代表成果。比較而言,TrueNorth 芯片采用了神經(jīng)形態(tài)的組織結(jié)構(gòu)和新興的“脈沖神經(jīng)網(wǎng)絡(luò)”算法,因此具有更低的功耗。但也正因?yàn)槿绱?,其?shù)據(jù)編碼信息損失很大,導(dǎo)致算法準(zhǔn)確度不及目前的成熟算法。例如,在手寫數(shù)字識(shí)別上,TrueNorth 的脈沖神經(jīng)網(wǎng)絡(luò)準(zhǔn)確度大約是 90%左右,而 20 世紀(jì) 80 年代的人工神經(jīng)網(wǎng)絡(luò)已經(jīng)可以達(dá)到95% 的準(zhǔn)確度,目前深度神經(jīng)網(wǎng)絡(luò)技術(shù)的準(zhǔn)確度更超過了 99%。
圖1 IBM 研制的“TrueNorth”芯片(a)和中科院計(jì)算所研制的“寒武紀(jì)”芯片及其板卡(b)
這個(gè)比較并非說明類腦芯片這兩大方向孰優(yōu)孰劣,而是展示了類腦芯片研制的客觀現(xiàn)狀。卻也恰恰能夠明確了這樣一個(gè)事實(shí):即參考已知的神經(jīng)元模型、結(jié)構(gòu)與工作方法可以發(fā)展出很好的“類腦智能”。隨著神經(jīng)科學(xué)的進(jìn)一步發(fā)展,人們對(duì)大腦神經(jīng)系統(tǒng)工作方式的逐漸清晰,脈沖神經(jīng)網(wǎng)絡(luò)算法可望進(jìn)一步發(fā)展,其準(zhǔn)確度也可望得到進(jìn)一步提高從而可以實(shí)用,這也正是類腦芯片研究的目標(biāo)。
實(shí)際上,類腦芯片研究的這兩大方向只是側(cè)重點(diǎn)不同,而并非彼此互斥,而且很多研究會(huì)逐漸模糊化這兩個(gè)方向之間的界限。類腦芯片完全可以同時(shí)參考神經(jīng)元組織結(jié)構(gòu)并支持成熟的認(rèn)知計(jì)算算法,這并不矛盾。當(dāng)然,這種趨勢(shì)也并不排除對(duì)該領(lǐng)域中某一點(diǎn)的重點(diǎn)研究。如憶阻器可以很好地模擬神經(jīng)元之間的突觸連接及其可塑性,其研究進(jìn)展使得構(gòu)建大規(guī)模神經(jīng)元結(jié)構(gòu)的可能性更大。2012 年,英特爾正是以憶阻器和橫向自旋閥(Lateral Spin Valves)兩項(xiàng)技術(shù)為基礎(chǔ)開始了神經(jīng)形態(tài)類腦芯片的研制[6]。
在當(dāng)前大數(shù)據(jù)和人工智能火熱的時(shí)代,類腦芯片的研究受到了各國政府、大學(xué)和研究機(jī)構(gòu)、國際大公司甚至是很多新興的創(chuàng)新型小公司的青睞和聚焦,從不為人知突然進(jìn)入到了公眾視野。隨著類腦芯片的百花齊放,勢(shì)必會(huì)帶來芯片應(yīng)用領(lǐng)域的一場(chǎng)革命,甚至將改變?nèi)藗兊娜粘I罘绞健?/p>
類腦智能機(jī)器人首先涉及到的是機(jī)器人的仿生機(jī)構(gòu)和感知控制,而仿肌肉驅(qū)動(dòng)器是其中的重要部分,這些仿肌肉驅(qū)動(dòng)器可以省卻齒輪、軸承,避免復(fù)雜的結(jié)構(gòu),同時(shí)減輕重量,具有更好的應(yīng)用效果。如 Shahinpoor 等人[7]用 4 片重 0.1g 的人工肌內(nèi)材料 IPMC 作手指組成的機(jī)械手,在 5 V 的電壓下提起了 10.3g 的石子, 所需功率為 25 mW。如用傳統(tǒng)機(jī)械裝置實(shí)現(xiàn)這個(gè)動(dòng)作, 其機(jī)構(gòu)將非常復(fù)雜。
雖然自20世紀(jì)60年代以來,日本以及美國DRAPA等機(jī)構(gòu)不斷進(jìn)行仿肌肉驅(qū)動(dòng)器的研究,但還是隨著近10年材料和新型傳動(dòng)系統(tǒng)的發(fā)展才真正實(shí)現(xiàn)一系列的突破。目前制作的仿肌肉驅(qū)動(dòng)器可以分為材料類、機(jī)械類和生物類。材料類的仿肌肉驅(qū)動(dòng)器主要代表有形狀記憶合金(Shape Memory Alloy,SMA)、電致收縮聚合物(Electroactive Polymer,EAP)、壓電陶瓷(Piezoelectric Transducer,PZT)、磁致收縮聚合物、功能凝膠、液晶收縮聚合物等。此類仿肌肉驅(qū)動(dòng)器的共同特點(diǎn)是模擬動(dòng)物肌肉收縮產(chǎn)生力這一工作特性,利用材料在不同的外部控制下,如電壓、電流、pH 值等,材料內(nèi)部的成分發(fā)生物理變化,產(chǎn)生形變和力。機(jī)械類的仿肌肉驅(qū)動(dòng)器,主要代表有氣動(dòng)人工肌肉(Pneumatic Artificial Muscle,PAM)、液壓人工肌肉(Hydraulic Artificial Muscle)、電致收縮器、磁致收縮器等,其中由波士頓動(dòng)力研制的Atlas 類人機(jī)器人就采用了液壓人工肌肉。不同于材料類仿肌肉驅(qū)動(dòng)器,機(jī)械類仿肌肉驅(qū)動(dòng)器都是結(jié)構(gòu)發(fā)生變化,產(chǎn)生收縮和力。生物類的仿肌肉驅(qū)動(dòng)器目前尚處于實(shí)驗(yàn)室研制階段,目前主要是利用動(dòng)物活體細(xì)胞來充當(dāng)驅(qū)動(dòng)器,美國 DRAPA 資助麻省理工學(xué)院研制的魚形仿生機(jī)器人,由活體肌肉驅(qū)動(dòng),最大速度 45 mm/s,而在類人機(jī)器人上尚未進(jìn)行類似的研究[8]。
在這些研究的基礎(chǔ)上,瑞士蘇黎世大學(xué)搭建了擁有“肌腱”和“骨頭”的機(jī)器人平臺(tái) ECCE Robot(圖 2),相關(guān)研究成果在 2010 年獲得美國 Popular Mechanics 報(bào)道,列為 2010 年10 大創(chuàng)新概念首位[9]。此外,波士頓動(dòng)力還試圖研制一款更新型仿生肢體,試圖采用 3D 打印的方式,將所有的液壓元件直接打印到其機(jī)器人肢體的“骨頭”結(jié)構(gòu)中,使之更具有仿生元素,比如“類動(dòng)脈式的液壓管道布局”、看上去很像骨頭的支架等(圖 3)。
圖2 ECCE Robot 平臺(tái)[9]
圖3 波士頓動(dòng)力正在研制的新型仿生肢體結(jié)構(gòu)圖
除了具有仿生結(jié)構(gòu)和仿生運(yùn)動(dòng)能力,類腦智能機(jī)器人還以腦科學(xué)和神經(jīng)科學(xué)的研究為基礎(chǔ),使機(jī)器人以類腦的方式實(shí)現(xiàn)對(duì)外界的感知和自身的控制。人的運(yùn)動(dòng)系統(tǒng)由骨骼、關(guān)節(jié)和肌肉組成,相關(guān)的肌肉收縮或舒張由中樞神經(jīng)系統(tǒng)與外周神經(jīng)系統(tǒng)協(xié)同控制。以類腦的方式實(shí)現(xiàn)感知與控制的一體化,使得機(jī)器人能夠模仿外周神經(jīng)系統(tǒng)感知、中樞神經(jīng)系統(tǒng)的輸出與多層級(jí)反饋回路,實(shí)現(xiàn)機(jī)器人從感知外界信息到自身運(yùn)動(dòng)的快速性和準(zhǔn)確性。
針對(duì)這項(xiàng)技術(shù),瑞士洛桑理工學(xué)院(EPFL)于 2015年開發(fā)了一個(gè)神經(jīng)系統(tǒng)仿真工具(The Neural Simulation Tool,NEST)。在該仿真工具中,研究人員建立了一個(gè)數(shù)字化的老鼠大腦計(jì)算模型和虛擬老鼠身體模型,通過把這兩個(gè)模型結(jié)合起來,來模擬大腦和身體的互作用的神經(jīng)機(jī)制,這為類腦機(jī)器人的神經(jīng)系統(tǒng)模擬提供了基礎(chǔ)[10]。目前,他們已在模型中模擬出一只小白鼠完整大腦中約2 100 萬個(gè)神經(jīng)元中的 3.1 萬個(gè)模擬神經(jīng)元[11]。雖然,將神經(jīng)系統(tǒng)和仿生機(jī)器人相結(jié)合進(jìn)行研究,還只是處在初步階段,但已經(jīng)建立的腦網(wǎng)絡(luò)模型,以及運(yùn)動(dòng)神經(jīng)和各種運(yùn)動(dòng)控制上的一系列研究成果,已為類腦智能機(jī)器人的感知與控制回路的進(jìn)一步研究奠定了很好的基礎(chǔ)。
與類腦智能機(jī)器人密切相關(guān)的技術(shù),如腦機(jī)接口[12]、神經(jīng)假體[13]等,近幾年也取得了積極的進(jìn)展。腦機(jī)接口可以使計(jì)算機(jī)從大腦神經(jīng)活動(dòng)獲知人的行為意
向,其關(guān)鍵在于神經(jīng)解碼,將大腦的神經(jīng)信號(hào)轉(zhuǎn)化為對(duì)外部設(shè)備的控制信號(hào)[12],其又分為侵入式腦機(jī)接口和非侵入式腦機(jī)接口。其中侵入式腦機(jī)接口能在癱瘓病人的大腦運(yùn)動(dòng)區(qū)植入電極陣列,提取人的運(yùn)動(dòng)意向從而控制機(jī)械手臂的動(dòng)作[13];非侵入式腦機(jī)接口是用緊貼頭皮的多個(gè)電極采集大腦腦電圖(EEG)信號(hào)從而控制機(jī)械臂或飛行器[14]。而在神經(jīng)假體方面,美國 DARPA 正投資研發(fā)一種芯片,通過植入該芯片可以幫助腦部受傷的人恢復(fù)記憶,并干擾甚至消除一些不愉快的記憶(如戰(zhàn)爭記憶)。目前此技術(shù)已在老鼠上取得了不錯(cuò)效果。此外,科研人員在視覺神經(jīng)假體、運(yùn)動(dòng)神經(jīng)假體方面也均取得很好進(jìn)展,并已成功進(jìn)行應(yīng)用,以幫助人們恢復(fù)部分視覺功能或部分替代四肢功能[15,16]。雖然腦機(jī)接口和神經(jīng)假體等方面的研究還有很大的提升空間,但已有的研究成果為類腦智能機(jī)器人的研究提供了很多的借鑒。
在類腦智能機(jī)器人研究中,如何從根本上提升機(jī)器人的智能,是機(jī)器人研究領(lǐng)域的一個(gè)重要問題。經(jīng)歷了長期的發(fā)展過程,人們普遍認(rèn)為機(jī)器通常在動(dòng)力、速度、精巧性方面具有一定的優(yōu)勢(shì),而人類具有智能、感知、情感等機(jī)器部分具有或者不具有的能力和特點(diǎn)。人們自然希望可以將二者各自的優(yōu)點(diǎn)融合在一起,實(shí)現(xiàn)“人機(jī)協(xié)作”。早在 20 世紀(jì) 50 年代,已有研究人員開展了相關(guān)的工作,從具體任務(wù)出發(fā)(如工業(yè)制造),研究離線狀態(tài)下的人機(jī)交互,讓機(jī)器人在人的指引下完成任務(wù)學(xué)習(xí)。20 世紀(jì) 90 年代,人們開始研究實(shí)時(shí)交互問題,將服務(wù)機(jī)器人與人結(jié)合在一起。然而這種協(xié)作主要從功能角度使人和機(jī)器人共享智能,并不算真正意義上的融合。在這一過程中,人做一部分工作,機(jī)器人做一部分工作,二者分工完成同一任務(wù)。自 2010 年來,人們更加關(guān)注“認(rèn)知-合作”,機(jī)器人作為人的“同事”,和人在一起工作。智能人機(jī)協(xié)同需要計(jì)算機(jī)在陌生的環(huán)境通過對(duì)周圍環(huán)境的觀察以及周圍環(huán)境的反饋刺激,自主整合新舊知識(shí),并進(jìn)行綜合智能決策,即要求計(jì)算機(jī)具有類腦的交互學(xué)習(xí)機(jī)制。隨著人工智能技術(shù)和新材料技術(shù)興起,智能機(jī)器人行業(yè)將是未來“腦科學(xué)研究”和“腦認(rèn)知與類腦計(jì)算”研究成果的重要產(chǎn)出方向。在實(shí)際的應(yīng)用場(chǎng)合,新一代的機(jī)器人或者新型人工智能必須要具有通過交互從外界獲得知識(shí),并通過智能增長的方式進(jìn)一步了解外部世界的能力。建立基于交互的從零學(xué)習(xí)及智能生長認(rèn)知模型,使得計(jì)算機(jī)能夠像嬰兒一樣,在與人的交互過程中進(jìn)行錯(cuò)誤糾正與知識(shí)積累,實(shí)現(xiàn)模仿人類認(rèn)識(shí)外部世界的智能增長[17]。
國際上一些機(jī)構(gòu)已紛紛開展人機(jī)協(xié)同下機(jī)器人智能生長的研究,如麻省理工學(xué)院人工智能實(shí)驗(yàn)室增量人機(jī)協(xié)同研究組(Increasing Man-Machine Collaboration MIT)采用增強(qiáng)學(xué)習(xí)讓人與機(jī)器人(包括飛機(jī)與小汽車等)在未知環(huán)境自由協(xié)作,讓計(jì)算機(jī)自動(dòng)配合人并與人交互,在共同決策完成既定任務(wù)的同時(shí),機(jī)器人也通過交互過程不斷學(xué)到新的知識(shí)。此外,谷歌和百度的無人駕駛汽車平臺(tái)也在進(jìn)行著類似的嘗試。
DeepMind 公司(2014 年被 Google 公司收購)提出了 Neural Turing Machine 方法,利用深度增強(qiáng)學(xué)習(xí),實(shí)現(xiàn)了靠不斷試錯(cuò)學(xué)習(xí)就可獲得提高的游戲人工智能[16]。這些智能靠著對(duì)游戲視頻的觀察來自動(dòng)尋找出模式,然后操作控制器,并獲得得分的反饋結(jié)果(高分獎(jiǎng)勵(lì)),通過這樣的交互方式不斷學(xué)習(xí)新的知識(shí)和技能。此外,Deep-Mind 還在研制基于長短期記憶的遞歸神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory-Recurrent Neural Network, LSTMRNN)控制的無人機(jī),通過交互式的學(xué)習(xí)可不斷提高無人機(jī)飛行的效果。
在未來,人們希望可以將人的智能更深程度地引入機(jī)器人系統(tǒng),從機(jī)理上對(duì)人進(jìn)行模仿,使機(jī)器人能夠像人一樣思考,從而“配合”人的工作,共同完成任務(wù)。類腦智能機(jī)器人不但是未來人工智能研究重要的外顯載體,而且其在未來服務(wù)業(yè)、智能家居、醫(yī)療、國家與社會(huì)安全等領(lǐng)域都具有極為廣泛的應(yīng)用價(jià)值。
作為腦科學(xué)研究的重要組成部分,類腦智能的研究已受到我國科研人員的高度重視,尤其是近兩年來,在中科院“腦功能鏈接圖譜與類腦智能研究”B 類先導(dǎo)專項(xiàng)的支持下,中科院自動(dòng)化所(承擔(dān)類腦機(jī)器人與人機(jī)協(xié)同的智能生長研究)、中科院計(jì)算所(承擔(dān)類腦計(jì)算芯片研究)、中科院半導(dǎo)體所(承擔(dān)類腦計(jì)算芯片研究)、中科院上海微系統(tǒng)所(承擔(dān)類腦視覺器件研究)等單位的合作,使我國在類腦芯片和類腦智能機(jī)器人方面的研究獲得了非常積極的進(jìn)展。
在類腦計(jì)算芯片方面,項(xiàng)目組繼“寒武紀(jì)”芯片設(shè)計(jì)完成后,已經(jīng)成功地進(jìn)行了流片,通過了初步階段的全部功能測(cè)試,并于 2016 年提出了國際上首個(gè)神經(jīng)網(wǎng)絡(luò)通用指令集,該指令集直接面對(duì)大規(guī)模神經(jīng)元和突觸的處理,一條指令即可完成一組神經(jīng)元的處理。模擬實(shí)驗(yàn)已經(jīng)表明,采用該指令集的深度學(xué)習(xí)處理器相對(duì)于 x86 指令集的 CPU 有兩個(gè)數(shù)量級(jí)的性能提升[18]。進(jìn)一步的研究將集中在類神經(jīng)形態(tài)的神經(jīng)元計(jì)算芯片的構(gòu)建和優(yōu)化上。
在類腦智能機(jī)器人方面,項(xiàng)目組在人機(jī)動(dòng)力學(xué)模型及表面肌電圖(sEMG)信號(hào)的運(yùn)動(dòng)意圖識(shí)別方法的基礎(chǔ)上,實(shí)現(xiàn)了機(jī)械臂的交互控制,并實(shí)現(xiàn)了生理控制的康復(fù)機(jī)器人的應(yīng)用[18]。此外,項(xiàng)目組還將人類的“大腦—小腦—脊髓—肌肉”的中樞與外周運(yùn)動(dòng)神經(jīng)系統(tǒng)模型引入到機(jī)器人的運(yùn)動(dòng)規(guī)劃與控制當(dāng)中來,針對(duì)仿人的“多輸入-多輸出”機(jī)器人運(yùn)動(dòng)執(zhí)行機(jī)構(gòu),建立了運(yùn)動(dòng)信號(hào)的類神經(jīng)編解碼模型,使得機(jī)器人可以在運(yùn)動(dòng)反應(yīng)速度不降低的情況下,提高機(jī)器人的運(yùn)動(dòng)精度,并具備運(yùn)動(dòng)的學(xué)習(xí)能力。項(xiàng)目組建立了生物啟發(fā)式仿人視覺演示平臺(tái)與生物啟發(fā)式仿人運(yùn)動(dòng)演示平臺(tái)(圖 4),基于人的中樞神經(jīng)與外周神經(jīng)機(jī)理,實(shí)現(xiàn)了在運(yùn)動(dòng)中逐步提升精度,而速度不下降的學(xué)習(xí)過程[19]。
為使類腦機(jī)器人具備針對(duì)復(fù)雜環(huán)境下物體的魯棒識(shí)別能力,并具有很好的泛化能力,項(xiàng)目組進(jìn)行了神經(jīng)啟發(fā)式模型的相關(guān)研究,將人類的聯(lián)想記憶機(jī)制、注意力調(diào)控機(jī)制、泛化學(xué)習(xí)與記憶機(jī)制引入到模型當(dāng)中。在研究中,項(xiàng)目組首先將聯(lián)想和記憶機(jī)制引入計(jì)算模型HMAX 中,減少識(shí)別時(shí)的存儲(chǔ)量,加快識(shí)別速度,從而提高機(jī)器人的反應(yīng)速度?;谝陨瞎ぷ?,依據(jù)靈長類動(dòng)物視皮層中前內(nèi)顳葉皮層對(duì)部件、視角的調(diào)節(jié)功能以及后內(nèi)顳葉皮層的多視覺任務(wù)處理能力,繼續(xù)改進(jìn) HMAX 模型,保證了旋轉(zhuǎn)、遮擋情況下魯棒的識(shí)別,擴(kuò)大機(jī)器人認(rèn)知的適用場(chǎng)景范圍,為機(jī)器人個(gè)性化服務(wù)奠定基礎(chǔ)[20]。
圖4 生物啟發(fā)式仿人視覺演示平臺(tái)(a)和生物啟發(fā)式仿人運(yùn)動(dòng)演示平臺(tái)(b)
為進(jìn)一步探索類腦智能機(jī)器人的智能生長技術(shù),項(xiàng)目組進(jìn)一步模擬了嬰兒對(duì)物體的自發(fā)、動(dòng)態(tài)認(rèn)知過程,使機(jī)器人能夠通過深度置信網(wǎng)絡(luò)自發(fā)學(xué)習(xí),進(jìn)而實(shí)現(xiàn)知識(shí)的動(dòng)態(tài)更新,提高機(jī)器人的自學(xué)習(xí)和歸納泛化能力。目前,項(xiàng)目組已經(jīng)在如下幾個(gè)方面取得了積極進(jìn)展:(1)模仿大腦在單樣本或者極少量樣本條件下的基于交互學(xué)習(xí)的目標(biāo)分類能力,借助目前腦科學(xué)中腦功能分區(qū)、大腦生長與神經(jīng)連接生長等知識(shí),構(gòu)建新型類腦機(jī)器學(xué)習(xí)和認(rèn)知模型,采用特征分析、無監(jiān)督聚類、合并歸納等推理方法,實(shí)現(xiàn)單樣本或極少量樣本條件下同一物體的再次準(zhǔn)確識(shí)別;(2)在機(jī)器人從零學(xué)習(xí)模型的基礎(chǔ)上,采用語音交互和手勢(shì)交互的模式教授計(jì)算機(jī)目標(biāo)與環(huán)境知識(shí),使得計(jì)算機(jī)具有從錯(cuò)誤中學(xué)習(xí)新知識(shí)的能力;(3)在機(jī)器人基于交互的錯(cuò)誤辨識(shí)糾正與記憶模型基礎(chǔ)上,構(gòu)建面向視覺、聽覺、言語感知的多通道信息融合的智能模仿模型,實(shí)現(xiàn)計(jì)算機(jī)借助視聽覺方式對(duì)外界環(huán)境的智能增長學(xué)習(xí),并具有一定模仿人類特定行為的能力(圖 5)。
圖5 人機(jī)協(xié)同的交互式智能手勢(shì)動(dòng)作學(xué)習(xí)系統(tǒng)
此外,為配合類腦智能機(jī)器人的交互過程,使機(jī)器人的視覺通道具有更多的擬人特性,項(xiàng)目組還通過類腦視覺感知原理研制了新型三維光場(chǎng)相機(jī)(圖 6a),相機(jī)能夠自動(dòng)對(duì)感興趣目標(biāo)進(jìn)行最佳對(duì)焦,從而對(duì)注意的圖像內(nèi)容進(jìn)行凸顯,從而使機(jī)器人能更好地理解所觀察到的內(nèi)容。與此同時(shí),項(xiàng)目組還研制了具有自學(xué)習(xí)在線校準(zhǔn)功能的仿生雙眼視覺系統(tǒng)(圖 6 b),能模仿人的眼球運(yùn)動(dòng)機(jī)制,實(shí)現(xiàn)雙目攝像機(jī)的運(yùn)動(dòng)控制,以及雙目視覺跟蹤和三維重建,為基于視覺的機(jī)器人人機(jī)交互奠定了很好的基礎(chǔ),并進(jìn)一步推動(dòng)了人機(jī)協(xié)同的機(jī)器人智能生長的研究。
圖6 三維光場(chǎng)相機(jī)及其原理示意圖(a)和主動(dòng)仿生雙眼視覺系統(tǒng)(b)
由于類腦芯片與類腦智能機(jī)器人的研究,既涉及到腦科學(xué)和神經(jīng)科學(xué)的最新研究成果,又和傳統(tǒng)芯片設(shè)計(jì)、機(jī)器人仿生結(jié)構(gòu)與控制等內(nèi)容密切相關(guān),未來研究迫切需要在如下方面進(jìn)行進(jìn)一步的攻關(guān)。
(1)類腦計(jì)算芯片方面。需從不精確、非完整信息的類腦神經(jīng)計(jì)算技術(shù)出發(fā),通過提煉神經(jīng)網(wǎng)絡(luò)處理中的共性運(yùn)算特性,發(fā)展類腦神經(jīng)元計(jì)算模型,通過改變控制參數(shù),使相同神經(jīng)元電路模塊能完成不同的神經(jīng)元功能,增強(qiáng)神經(jīng)計(jì)算電路模塊的通用性,降低設(shè)計(jì)、制造的難度。此外,還需要迫切解決類腦計(jì)算芯片的功耗問題,需要研究建立神經(jīng)網(wǎng)絡(luò)處理器相關(guān)的功耗模型,通過結(jié)構(gòu)設(shè)計(jì)參數(shù)的選擇,降低相對(duì)功耗。發(fā)展基于統(tǒng)一抽象的、實(shí)時(shí)可調(diào)的軟件抽象層設(shè)計(jì),通過和硬件結(jié)合,對(duì)低功耗設(shè)計(jì)與評(píng)估進(jìn)行實(shí)時(shí)反饋和調(diào)節(jié),為上層設(shè)計(jì)提供一個(gè)可靠且便利的軟硬件間的橋梁,解決能適應(yīng)多種應(yīng)用需求的兼容性問題。
(2)類腦智能機(jī)器人方面。需更多借鑒類腦計(jì)算模型和仿人運(yùn)動(dòng)神經(jīng)機(jī)理研究新的機(jī)器人感知、交互和動(dòng)作計(jì)算模型,從根本上提高機(jī)器人的智能性,形成具有動(dòng)態(tài)立體視覺感知、快速自感知、多模態(tài)信息融合、運(yùn)動(dòng)自學(xué)習(xí)能力、協(xié)調(diào)人機(jī)協(xié)作、快速反應(yīng)和高精度操作的類腦智能機(jī)器人。其中,尤其需要解決類人運(yùn)動(dòng)執(zhí)行機(jī)構(gòu)帶來的類腦運(yùn)動(dòng)神經(jīng)控制、人機(jī)融合環(huán)境帶來的機(jī)器人多模態(tài)信息融合、交互式學(xué)習(xí)控制和雙目可動(dòng)攝像頭帶來的攝像頭高速在線校準(zhǔn) 3 個(gè)問題。
在神經(jīng)科學(xué)和深度神經(jīng)網(wǎng)絡(luò)等領(lǐng)域快速發(fā)展的綜合推動(dòng)下,類腦計(jì)算芯片與類腦智能機(jī)器人經(jīng)過最近幾年的發(fā)展,獲得了科研人員的普遍重視,并已經(jīng)產(chǎn)生了一系列研究成果。其中,類腦計(jì)算芯片已經(jīng)形成實(shí)際的產(chǎn)品,并有希望在近期產(chǎn)生重要的應(yīng)用;類腦智能機(jī)器人也在研究內(nèi)容上不斷進(jìn)行細(xì)化和深入,結(jié)合神經(jīng)科學(xué)和仿生學(xué)等最新的研究成果,已經(jīng)形成了一系列原型技術(shù),并在類腦智能機(jī)器人的自主學(xué)習(xí)和交互式主動(dòng)學(xué)習(xí)機(jī)制上形成了一批積極的成果。未來研究有望在仿人運(yùn)動(dòng)模型和“自主學(xué)習(xí)-動(dòng)作”類人神經(jīng)運(yùn)動(dòng)控制以及在人機(jī)協(xié)同的智能機(jī)器人控制和交互式學(xué)習(xí)、自適應(yīng)和自主決策方法等方面取得重大突破。
1 喬紅, 尹劼沛, 李睿, 等. 機(jī)器人與神經(jīng)科學(xué)交叉的意義——關(guān)于智能機(jī)器人未來發(fā)展的思考. 中國科學(xué)院院刊, 2015,30(6):762-771.
2 唐旖濃.美國類腦芯片發(fā)展歷程. [2016-5-21] .http://www. eepw.com.cn/article/271641.htm
3 電子產(chǎn)品世界. 高通 zeroth 認(rèn)知平臺(tái), 讓手機(jī)認(rèn)識(shí)世界. [2015-3-9]. http://www.eepw.com.cn/article/270655.htm
4 Chen T, Du Z, Sun N, et al. Diannao: A small-footprint highthroughput accelerator for ubiquitous machine-learning//ACM Sigplan Notices. New York: ACM, 2014, 49(4): 269-284
5 Chen Y, Luo T, Liu S, et al. Dadiannao: A machine-learning supercomputer//Proceedings of the 47th Annual IEEE/ ACM International Symposium on Microarchitecture. Washington:IEEE Computer Society, 2014: 609-622.
6 與非網(wǎng).惹高通、IBM、英特爾、惠普四大巨頭關(guān)注,神經(jīng)形態(tài)芯片有啥用. [2015-09-29] . http://www.eefocus.com/mcudsp/350954
7 Shahinpoor M. Ionic polymer-metal composites (ipmcs) as biomimetic sensor. Actuators and Artificial Muscles-a Review. Smart Materials and Structures, 1998, (7):15 -30.
8 王煒, 秦現(xiàn)生. 仿肌肉驅(qū)動(dòng)器及其在仿生機(jī)器人中的應(yīng)用. 微特電機(jī), 2009, 37(6): 56-60.
9 ECCEROBOT. [2015-10-25]. http://eccerobot.org/index.html
10 NEST Simulator | The Neural Simulation Tool. [2015-10-25]. http://www.nest-simulator.org/
11 A simulated mouse brain in a virtual mouse body. [2015-10-25]. https://www.humanbrainproject.eu/-/a-simulated-mousebrain-ina-virtual-mouse-bo-2
12 Leigh R. Hochberg, Daniel B, et al. Reach and grasp by people with tetraplegia using a neurally controlled robotic arm. Nature,2012, 485(7398): 372-375.
13 Using thoughts to control airplanes.[2016-5-28]. http://www. tum.de/en/about-tum/news/press-releases/short/article/31531/
14 Wolpaw J R, Birbaumer N, Heetderks W J, et al. Brain-computer interface technology:A review of the first international meeting. IEEE Transactions on Rehabilitation Engineering, 2000, 8(2): 164-173.
15 Mandel Y, Goetz G, Lavinsky D, et al. Cortical responses elicited by photovoltaic subretinal prostheses exhibit similarities to visually evoked potentials. Nature communications, 2013 , 4.
16 人工視覺正在邁出第三步. [2016-5-28]. http://hsb.hsw. cn/2013-09/21/content_8512176.htm.
17 曾毅, 劉成林, 譚鐵牛. 類腦智能研究的回顧與展望. 計(jì)算機(jī)學(xué)報(bào), 2016, 39(1):212-222.
18 Liu S L, Du Z D, Tao J H, et al. Cambricon: An instruction setarchitecture for neural networks//Proceedings of the 43rd ACM/ IEEE International Symposium on Computer Architecture.2016.
19 Qiao H, Li C, Yin P, et al. Human-inspired motion model of upper-limb with fast response and learning ability -A promising direction for robot system and control.Assembly Automation, 2016,36(1): 97-107.
20 Qiao H, Li Y L, Tang T, et al. Introducing memory and association mechanism into a biologically inspired visual model. IEEE Transactions on Cybernetics, 2014, 44(9): 1485-1496.
陶建華中科院自動(dòng)化所研究員、模式識(shí)別國家重點(diǎn)實(shí)驗(yàn)室副主任。國家杰出青年科學(xué)基金獲得者,中國計(jì)算機(jī)學(xué)會(huì)常務(wù)理事,中國人工智能學(xué)會(huì)理事,中國中文信息學(xué)會(huì)理事,國家“863”重大項(xiàng)目首席科學(xué)家,IEEE TAFFC 期刊指導(dǎo)委員會(huì)委員。長期從事人工智能、人機(jī)交互等方面研究。研究成果多次在國內(nèi)外重要學(xué)術(shù)會(huì)議上獲獎(jiǎng),兩次獲得北京市科技進(jìn)步獎(jiǎng)二等獎(jiǎng)。主要研究領(lǐng)域包括:人機(jī)交互與智能生長、語音技術(shù),情感計(jì)算。E-mail: jhtao@nlpr.ia.ac.cn
Tao JianhuaProfessor and the deputy director in National Laboratory of Pattern Recognition, Institute of Automation, Chinese Academy of Sciences. He is also the winner of the National Science Fund for Distinguished Young Scholars, standing committee member of China Computer Federation, Chief Scientist of National High-Tech Research and Development Program of China (“863” Program). Prof. TAO received several awards from important conferences, and won twice the Scientific Technology Advance Award of Beijing municipal government. His research interests includes human-computer interaction and intelligence growth, speech processing, and affective computing. E-mail: jhtao@nlpr.ia.ac.cn
Current Status and Consideration on Brain-like Computing Chip and Brain-like Intelligent Robot
Tao Jianhua1,3Chen Yunji2,3
(1 Institute of Automation, Chinese Academy of Sciences, Beijing 100190, China;2 Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100190, China;3 Center for Excellence in Brain Science and Intelligence Technology, Chinese Academy of Sciences, Shanghai 200031, China)
Brain inspired Intelligence has received more and more attention in artificial intelligence area in recent years. The paper focuses on the research activities on the brain-inspired chips and brain inspired robot (or named as human like robot) which are important parts of brain inspired Intelligence and have played the important roles for recent research of artificial neural network modeling, cognitive computing and perceptual controlling system. The paper also introduces the preliminary achievements of these two technologies within the Strategic Priority Research Program of the Chinese Academy of Sciences. Furthermore, the paper gives some analysis and suggestions for the future research on brain-inspired chips and brain inspired robot.
brain inspired chip, brain inspired robot, human machine collaboration, intelligence growing
10.16418/j.issn.1000-3045.2016.07.009
*資助項(xiàng)目:中科院戰(zhàn)略性先導(dǎo)科技專項(xiàng)項(xiàng)目(B類)(XDB02080000)
** 通訊作者
修改稿收到日期:2016年6 月3日