Chris Palmer
Senior Technology Writer
為了尋求更加快速、高效的計算,研究人員與制造商正忙于探索新穎的處理架構(gòu)。其中,神經(jīng)形態(tài)計算這一在計算機芯片中模仿大腦運作的方法在深度學習應用的推進中尤為突出,具有巨大潛能。深度學習是一種日益普遍的人工智能(AI)形式,其利用受大腦啟發(fā)的神經(jīng)網(wǎng)絡以揭示大型數(shù)據(jù)集中的規(guī)律。
在使用常規(guī)計算機硬件的傳統(tǒng)機器學習中,內(nèi)存和處理節(jié)點的位置是分開的。相反,神經(jīng)形態(tài)計算機硬件模擬了神經(jīng)元,并將這兩個功能放在同一位置。該架構(gòu)無需在處理站點和存儲站點之間來回傳輸數(shù)據(jù),因而可以大大降低某些特定學習任務(如圖像識別和分類)的計算時間和功耗需求。
雖然神經(jīng)形態(tài)計算的概念起源于20世紀80年代末期,但是由于算法開發(fā)的速度緩慢,構(gòu)建一體的內(nèi)存/處理節(jié)點需要新型材料,以及在擴大規(guī)模方面存在挑戰(zhàn),神經(jīng)形態(tài)計算的發(fā)展受到了阻礙。美國紐約州伊薩卡市康奈爾大學的心理學教授Thomas Cleland表示,早期的神經(jīng)形態(tài)神經(jīng)網(wǎng)絡沒有可塑性。一旦設置完畢,就只能訓練它們完成一項特定的任務。要想完成其他的任務,就需要對其進行重建和重新訓練。Cleland說道,這種限制具有“非常大的局限性”。
現(xiàn)在,技術(shù)進步已經(jīng)在很大程度上打破了這一限制?!霸谶^去的10年中,人工智能最重要的進步之一就是提出了更快更好的學習方法,”美國馬薩諸塞州劍橋市哈佛大學醫(yī)學院的眼科學教授兼大腦、思維和機器中心副主任Gabriel Kreiman說道,“直接賦予硬件可塑性,可以讓人們不用從頭開始就可以重新訓練機器,這是具有相當變革意義的?!?/p>
神經(jīng)形態(tài)計算的兩種新的應用展示了這種設計的潛力,即以極快的速度和最小的功耗有效解決各種各樣的問題:一種應用是電子鼻,它僅在接觸一次化學物質(zhì)之后即可識別該物質(zhì)的氣味[1];另一種應用是具有圖像傳感器的機器視覺設備,它可以兼作一種人工神經(jīng)網(wǎng)絡,并且處理圖像的速度比傳統(tǒng)技術(shù)快數(shù)千倍[2,3]。
電子鼻是由Cleland和Nabil Imam共同構(gòu)建的一種“一次性學習”(one-shot learning)嗅覺系統(tǒng)。Nabil Imam是美國加利福尼亞州圣克拉拉市英特爾神經(jīng)形態(tài)計算實驗室的一位工程師。該系統(tǒng)運用了英特爾第五代神經(jīng)形態(tài)芯片(圖1 [1])Loihi,其中包含128個中央處理器,每個中央處理器都配有內(nèi)置的學習模塊和超過13萬個的計算神經(jīng)元,而且每個神經(jīng)元都與周圍的數(shù)千個神經(jīng)元相連[4]。
圖1. 美國康奈爾大學和英特爾公司的研究人員開發(fā)的一種電子鼻,該電子鼻僅在接觸一次用于神經(jīng)形態(tài)計算的英特爾第五代研究芯片Loihi上釋放的化學物質(zhì),即可識別該化學物質(zhì)的氣味[1]。如圖所示,該芯片將內(nèi)存和處理節(jié)點放置在各個模塊中,從而能夠高效檢測氣味和其他有規(guī)律的刺激[4]。圖片來源:Tim Herman/Intel Corporation。
Cleland和Imam為了評估該系統(tǒng),將電子鼻與傳統(tǒng)的神經(jīng)網(wǎng)絡進行比較,讓兩者檢測通過風洞吹出的10種氣味,其中風洞中裝有72個金屬氧化物氣體傳感器(數(shù)據(jù)來源于公開的數(shù)據(jù)集[5])。神經(jīng)形態(tài)系統(tǒng)的訓練只需在每種氣味下暴露一次,而傳統(tǒng)的人工智能的訓練則需要暴露數(shù)百次。識別出的每種氣味僅占測試總氣味的20%~80%,這說明在現(xiàn)實世界中,許多氣味通常是混合在一起的。神經(jīng)形態(tài)人工智能對目標氣味的識別率為92%,而傳統(tǒng)人工智能的識別率為52% [1]。
“我們可以利用純凈的氣味訓練我們的算法,如使用橙子味或乙酸戊酯味(一種類似香蕉的氣味),并在許多不同的環(huán)境下辨識這種氣味,”Cleland表示,“你可以在面包店、垃圾場或沼澤中測試,它都能識別這種氣味。”
標準人工智能的訓練不僅耗時、耗能,而且每次添加新氣味時都必須從頭開始。而神經(jīng)形態(tài)人工智能只需在網(wǎng)絡中添加新的神經(jīng)元便可繼續(xù)識別新的氣味。Cleland目前想讓自動機器人也使用這一系統(tǒng)。“我們希望只花幾秒鐘時間就能將系統(tǒng)訓練完畢,并使其能夠準確地識別氣味,即使氣味被無法控制的污染物掩蓋,也不會影響其準確性,”他說,“我們不想說,‘哦,是的,當物品呈酸性,或是太潮濕,或有任何其他情況時,它就不起作用?!?/p>
該系統(tǒng)的潛在應用包括空氣質(zhì)量監(jiān)測、有毒廢物識別、地雷檢測、痕量藥物檢測和醫(yī)療診斷。但是,Cleland表示,該算法不只局限于化學感知。他和他的團隊利用該算法,從高光譜衛(wèi)星圖像中對地面覆蓋物進行了分類,同時識別出南美叢林中的蛙叫聲[6]?!爸灰凶銐驍?shù)量的傳感器,我們就可以檢測任何東西,”他說,“唯一的前提是,傳感器需要足夠好到能夠檢測你想要檢測的任何東西。”
Cleland和Imam利用了英特爾公司的Loihi芯片,而維也納工業(yè)大學(TU Wien)的研究人員設計了自己的神經(jīng)形態(tài)芯片,可實現(xiàn)極其快速的圖像處理(圖2 [2,3])。機器視覺技術(shù)通常涉及攝像機逐行掃描圖像像素,同時將視頻幀轉(zhuǎn)換為數(shù)字信號,然后將數(shù)據(jù)傳輸至外接計算機進行分析——所有這些步驟都會導致嚴重的延遲。維也納工業(yè)大學的研究人員試圖通過開發(fā)一種圖像傳感器來加速這一過程,該傳感器本身起到了一種類似人工神經(jīng)網(wǎng)絡的作用,能夠同時獲取并分析圖像。維也納工業(yè)大學光子學研究所的研究生Lukas Mennel說:“感測與計算相結(jié)合這一步的確為圖像判讀開辟了一個全新的方向?!?/p>
新傳感器由一個3×3像素陣列組成,每個像素代表一個神經(jīng)元[2]。每個像素又由三個光電二極管組成,每個光電二極管代表一個突觸。每個光電二極管由三個原子厚的二硒化鎢制成,這是一種對光具有可調(diào)節(jié)響應的半導體。這種可調(diào)性使光電二極管能夠以一種可程控的方式記住光并對光產(chǎn)生響應。
為了測試他們的系統(tǒng),維也納工業(yè)大學的研究人員使用激光將字母“n”“v”和“z”投射到神經(jīng)網(wǎng)絡圖像傳感器上[3]。傳感器能夠以相當于2000萬幀每秒(fps)的速度正確處理字母的圖像。相比之下,常規(guī)的機器視覺技術(shù)則是以不超過約1000 fps的速度處理圖像。
圖2.(a)維也納工業(yè)大學的研究人員開發(fā)的圖像傳感器芯片兼有人工神經(jīng)網(wǎng)絡的作用,其處理圖像的速度比常規(guī)技術(shù)快數(shù)千倍[2,3]。(b)人工神經(jīng)網(wǎng)絡將投射到傳感器上的無噪圖像自動編碼為現(xiàn)行代碼,然后現(xiàn)行代碼被轉(zhuǎn)換為二進制激活代碼,并最終由解碼器重構(gòu)為圖像[2,3]。訓練后,自動編碼器可以接受有噪聲的輸入并重建投射的圖像。圖片來源:TU Wien,經(jīng)許可。
Mennel表示,傳感器的速度僅受電路中電子速度的限制,并且從理論上講,該系統(tǒng)的運行速度可以比報告中的速度快幾個數(shù)量級。除了超快速處理,圖像傳感器在運行時不消耗任何電能,因為感測到的光子本身會提供必要的電流為傳感器供電。
維也納工業(yè)大學的圖像傳感器技術(shù)具有多種高速應用,包括在斷裂力學中的應用,即確定裂紋從哪個方向傳播,以及在顆粒檢測中的應用,即確定剛剛經(jīng)過的是哪種顆粒。Mennel表示,從理論上來說,該系統(tǒng)雖然可以處理諸如引導自動駕駛汽車之類的復雜任務,但它仍需要進一步擴大規(guī)模。“所以,很明顯,下一步就是要擴大規(guī)模,這應該是比較容易的,因為人們現(xiàn)在已經(jīng)能夠構(gòu)建具有數(shù)百萬個像素的傳感器了?!?/p>
基于這些結(jié)果,神經(jīng)形態(tài)計算可能會成為數(shù)字未來的一個重要組成部分?!爱斍皺C器學習方法的能耗非常大,通常是出奇的大,”Kreiman稱,“神經(jīng)形態(tài)計算可能會革新人們對于計算的認知方式,從而推動某些目前尚不可行的方法的實現(xiàn),并且只需要花費較少的成本?!?/p>