王 晨,杜天一,常 輝,李玉霞
(山東科技大學 電氣與自動化工程學院,山東 青島 266590)
突觸作為神經網絡的節(jié)點,是神經元連接的樞紐。電子突觸作為生物突觸物理實現模式,可以通過改變動作電位調節(jié)其連接強度,模擬生物突觸功能,為人工神經網絡的構建提供支撐。然而,傳統(tǒng)設計是基于互補金屬氧化物半導體(complementary metal oxide semiconductor, CMOS)器件的突觸電路,存在電路復雜度高、所占面積大和功耗高等不足,不利于突觸數量的大幅增加。與傳統(tǒng)突觸相比,憶阻突觸具有納米尺寸、結構簡單和低能耗等特點,可以降低電路的復雜度[1-2]。憶阻器可通過控制流過的電荷量或磁通量來改變其阻值,與突觸連接權值類似。因此,單個憶阻器即可模擬突觸的基本功能,促進電路設計的簡化。目前,很多學者已經設計出各種基于憶阻器的突觸電路來實現長短期可塑性[3]、尖峰速率依賴可塑性[4]、尖峰時序依賴可塑性[5]、學習算法[6]、聯想記憶[7]等等。突觸可塑性是神經元連接的重要機制,是神經系統(tǒng)實現各項功能的基礎。利用人工突觸實現神經網絡的學習和記憶對于實現神經計算和人工神經網絡具有重要意義。
神經記憶分為聯想記憶和非聯想記憶[8]。其中,巴普洛夫提出的聯想記憶被廣泛研究[9]。非聯想記憶作為生物學習和適應環(huán)境不可或缺的模式,主要包括習慣化和敏化[8]。習慣化是對外界刺激的儲存和提取的表達,是最簡單的學習方式。對非聯想記憶學習的研究大部分基于結構簡單的無脊椎生物,例如海兔鰓縮反射[10]、蠅和秀麗隱桿線蟲的學習和記憶以及無脊椎生物的防御性撤退反射[11]。對于復雜生物非聯想記憶的習慣化,科研人員較為關注的是眨眼反射習慣化[12-14]。眨眼反射屬于自發(fā)的、非習得的非條件反射,而眼睛對刺激無反應的過程又屬于條件的、習得的條件反射,眨眼反射的習慣化過程是一種學習記憶過程。因此,利用眨眼反射習慣化作為研究非聯想記憶的載體具有現實的可行性和合理性。文獻[12]研究正常被試者和精神分裂被試者的眨眼反射習慣化行為,發(fā)現了精神分裂者眨眼習慣化所需時間比正常被試者長,說明眨眼反射習慣化的過程屬于受大腦控制的學習過程;文獻[13]研究分析了眨眼反射習慣化過程中腦干信號逐漸變弱的原因;文獻[14]研究了短電刺激眼眶神經,誘發(fā)眨眼反射,進而形成習慣化直至眨眼反射消失的過程,并且對眨眼反射與大鼠全身驚嚇進行了比較。以上眨眼反射的研究主要基于臨床試驗,通過采集電信號進行動態(tài)分析。
憶阻器作為一種理想的結構模式,可以在神經網路中實現突觸權重,充當乘法器電路代替?zhèn)鹘y(tǒng)的模擬乘法器[15-16]。構造憶阻突觸電路可以實現非聯想記憶的仿真,為進一步揭示人類思維模式提供必要的支撐。如文獻[8,10]構造了單憶阻的突觸電路,模擬海兔鰓縮反射習慣化過程中的信號特征及信號的動態(tài)變化。然而,設計憶阻突觸電路對眨眼反射由非條件反射向條件反射的構建過程的研究仍鮮見報道。本研究設計了憶阻橋突觸電路,通過憶阻橋突觸電路的阻值和電路輸出電壓的變化模擬生物眨眼反射的相關特性。
憶阻器描述了電荷與磁通量之間的關系:
(1)
式中:M(q)表示憶阻器的阻值,φ(q)表示電荷和磁通量的關系[16],q表示流經憶阻器的電荷?;萜展局圃斓幕萜諔涀杵饔摄K電極之間夾兩層鈦氧化物薄膜組成,其結構如圖1所示。其中,一層為沒有氧空位的TiO2薄膜,表現出高阻抗特性,為非摻雜層;另一層具有氧空位的TiO2薄膜,稱為摻雜層(TiO2-x層)。憶阻兩端施加電壓時,摻雜層和非摻雜區(qū)層之間的邊界會發(fā)生移動,引起阻值變化[17]。
圖1 惠普憶阻器模型
惠普憶阻器的電阻為摻雜區(qū)和非摻雜區(qū)的電阻之和,即
Rmem(x)=Ronx+Roff(1-x),
(2)
(3)
式中:Rmem是惠普憶阻器的阻值;Ron、Roff分別是惠普憶阻器阻值導通和閉合時兩個極限值,通常Ron遠大于Roff;x是憶阻器內部狀態(tài),為摻雜層厚度w與總TiO2薄膜厚度D的比值,x對應的動態(tài)方程為:
(4)
特別地,對于給定的理想惠普憶阻器,μv、Ron以及D的值都是固定不變的(即比例因子k為常數),說明該模型中離子的運動呈線性變化,因此這種惠普憶阻器模型也可以稱為線性雜質漂移模型或理想憶阻器模型[18]。但對實際憶阻器施加微小電壓就能夠產生巨大的電場,導致能量勢壘快速減少,使惠普憶阻器內部離子的運動呈現明顯的非線性特征。特別地,這種非線性特征在惠普憶阻器的邊界尤為顯著,嚴重影響離子遷移速度,即摻雜區(qū)與非摻雜區(qū)之間的邊界移動速度逐漸降低至零,這個現象稱為非線性摻雜漂移[17]。為了解決這個現象,引入Joglekar窗函數[18-19],即在式(4)右側乘以一個非線性窗函數f(x),式(4)可簡化為:
(5)
式中:μv=10-14m2/(s·V);f(x)是用來模擬非線性漂移現象的窗函數,f(x)=1-(2x-1)2p;p用于描述非線性程度,p=0.7。在惠普憶阻器模型中引入窗函數,可以解決邊界效應,控制參數較少,使得基于惠普憶阻器設計的電路能夠較好地展示突觸特性。
在個人集成電路專用模擬程序(personal simulation program with intergrated circuit emphasis,PSPICE)中,用6個惠普憶阻器模型組成六憶阻橋結構、差分比例運算電路和反向放大器構建突觸模擬電路,如圖2所示。
圖2 突觸模擬電路
圖2中,V1和V2代表輸入電壓信號,憶阻橋阻值的增大或減少由差分比例運算電路的輸出電壓Vo1控制,Vo幅值大小表示突觸電路對刺激的反應程度。
(6)
式中:Ri表示圖2中電阻Ri的電阻值,i=1,2,3,4。令R1=R2,R3=R4,則式(6)可簡化為:
(7)
設憶阻橋總電阻Rm,則有
(8)
將式(7)代入式(8),且令R6=R7,可得:
(9)
由式(9)可得:
(10)
為了分析突觸電路的特性,設置參數為:R1=R2=R3=R4=R5=1 kΩ,R6=R7=1 Ω;采用運算放大器LM675,Ron=100 Ω,Roff=10 kΩ,D=10 nm,uv=10-14m2/(s·V),p=0.7,Rint=600 Ω;V1為脈沖電壓,V2為直流正電壓。
眨眼反射作為生物的一種自我保護,各種刺激均會觸發(fā)這種行為,是生物對潛在危險作出快速反應的自我保護機制[12,14,20]。眨眼反射并不是單純的條件或者非條件反射,不經意地眨眼屬于非條件反射,而隨意眨眼或者刻意不眨眼則屬于條件反射。眨眼反射的習慣化是眼睛適應無害刺激,對刺激反應逐漸減弱直至消失的過程(即學習過程)。當眨眼形成習慣化后,同種刺激將不會觸發(fā)眨眼反射;當停止刺激一段時間后,再次施加刺激,則仍會觸發(fā)眨眼反射,稱之為習慣化恢復。
習慣化是生物逐漸適應無害刺激的過程,習慣化地恢復為生物忘記部分已經具有的特定反應。例如,當對眼睛進行單次刺激時,會產生眨眼反射,當對眼睛進行連續(xù)的同種無害刺激,眼睛就會產生習慣化,該類刺激不再觸發(fā)眨眼反射,從而實現學習行為的鞏固與強化。用突觸電路模擬生物的學習過程在人工智能應用領域具有重要的現實意義。
當使用一個惠普憶阻器替換圖2中6個惠普憶阻器組成的憶阻橋結構時,該電路稱為單憶阻突觸,單憶阻突觸的總阻值表示為Rm1。分別對單憶阻突觸和憶阻橋突觸施加峰值為5 V、周期為2 ms的脈沖電壓刺激信號進行學習訓練,如圖3所示。
由圖3(b)、3(c)可見,單憶阻突觸與憶阻橋突觸的阻值均隨刺激信號的輸入而逐漸增大,表明突觸的連接不斷增強,同時對刺激信號的反應不斷減弱。其中,單憶阻突觸在每次受到刺激信號時,連接增強后會階段性出現強度變弱,這與生物突觸由于遺忘特性而出現連接強度變弱的過程類似,如圖3(b)所示。在施加持續(xù)刺激時,單憶阻突觸對刺激形成習慣化,其習慣化過程所需時間較長,約50 ms。憶阻橋突觸受到刺激時連接也會增強,同時在短暫刺激去除后繼續(xù)保持一段時間的記憶,表現為抗遺忘過程,如圖3(c)所示。在施加持續(xù)刺激時,憶阻橋突觸形成習慣化,其習慣化過程所需時間較短,約24 ms。
對比兩種突觸對相同刺激的反應可以看出,憶阻橋突觸存在較強的尖峰(圖3(c)中的34、50 ms等處),說明憶阻橋突觸在形成習慣化過程中的某時刻對刺激作出強烈反應,突觸的阻值瞬間大幅度變化并立即恢復,這個現象符合生物單個神經元的特性,表明憶阻橋突觸具有自我調節(jié)能力,能夠對后續(xù)刺激快速反應,促進記憶的形成與保持,具有抗遺忘性,這也與生物體的學習記憶和保存特征一致。
圖3 同種刺激信號下單憶阻突觸和憶阻橋突觸的連接強度隨時間的變化
對刺激信號學習的過程中,由于單憶阻突觸具有遺忘性,在后續(xù)刺激信號的學習中,會損耗一部分能量“復習”上一次的學習過程,導致周期內的損耗逐漸增加。憶阻橋突觸比單憶阻突觸的結構復雜,在開始的學習中,需要損耗較多的能量激活憶阻橋突觸,而由于憶阻橋突觸的抗遺忘特性,后續(xù)刺激信號的學習所損耗的能量逐漸降低,即周期內的損耗逐漸降低。兩種突觸的耗能分別如圖4(a)、4(b)所示。
計算給予突觸刺激信號一段時間內的損耗電能
(11)
W1=S1+S2+…+S30=6.63×10-3J,W2=S1+S2+…+S30=6.31×10-3J。
(12)
由式(12)結果可知,憶阻橋突觸在學習過程中消耗的總電能比單憶阻突觸消耗的電能低3.2×10-4J,兩種突觸的耗能變化曲線如圖4(c)所示。在11.3 ms之前,憶阻橋突觸的損耗比單憶阻突觸高5%;11.3~60 ms內,憶阻橋突觸的損耗比單憶阻突觸低7.3%。在突觸電路學習60 ms的過程中,憶阻橋突觸的總損耗比單憶阻突觸的總損耗低4.8%。
圖4 兩種憶阻突觸的耗能
對比以上結果可知,憶阻橋突觸具有兩個優(yōu)勢:一是憶阻橋突觸在學習達到飽和的過程中所需要的時間相對較少;二是憶阻橋突觸學習過程的損耗降低,且憶阻橋突觸在形成習慣化的過程中可以保持記憶,具有抗遺忘特性,能快速達到習慣化,有利于后續(xù)開展眨眼反射習慣化特性的仿真研究。憶阻橋突觸對刺激作出反應過程中出現的尖峰現象有利于加速形成習慣化,對遺忘有抵抗作用。
由于三角波電壓信號的值可以從零逐漸增加到最大值,之后再逐漸減少到零,可以模擬實驗所需要的一個由遠及近過程的外界刺激。故選擇三角波電壓信號輸入憶阻橋突觸,模擬眨眼反射所需的外界刺激,如圖5所示,共施加5次刺激信號。其中,三角波電壓信號最大值代表刺激信號最強,距離眼睛最近;最小值代表刺激最弱,距離眼睛最遠。
圖5 三角波電壓信號
如圖6所示,受到三角波電壓信號的刺激時,憶阻橋突觸的阻值增加,連接增強。在刺激消失后的一段時間內,憶阻橋突觸阻值基本保持不變,再次受到刺激時,突觸的阻值在原有基礎上繼續(xù)增強后保持不變。這個過程與生物的學習過程和眼睛適應外界刺激過程是一致的,表明憶阻橋突觸能夠記憶先前刺激所產生的反射信息,具有記憶性和抗遺忘性。
圖6 三角波電壓信號刺激下的憶阻橋突觸的阻值
為便于研究,規(guī)定低于50 V的電壓信號為弱刺激信號,高于50 V的電壓信號為強刺激信號。對憶阻橋突觸電路分別施加弱、強刺激信號,分析憶阻橋突觸的反應特性。
2.4.1 弱信號下憶阻橋突觸的反應特性
在憶阻橋突觸的R1左側輸入圖7所示的弱刺激信號時,憶阻橋突觸的阻值變化情況,如圖8所示。
圖7 連續(xù)弱刺激信號
圖8 憶阻橋突觸阻值的變化
由圖8可見,當施加弱刺激信號時,憶阻橋突觸的阻值產生明顯尖峰,即阻值瞬間增加后急劇減少,這與生物突觸的反應過程一致。受到初次刺激時突觸的阻值增大,連接增強。經過幾次同種信號刺激,突觸對刺激產生的波峰逐漸變弱,連接強度降低,逐漸形成習慣化。當刺激信號取消約3.2 ms后,突觸的阻值開始降低,對弱刺激信號習慣化開始遺忘。
2.4.2 強信號下憶阻橋突觸的反應特性
圖9為將電壓為50 V且與弱刺激信號相同波形的強刺激信號施加給憶阻橋突觸時的阻值變化情況。對比圖8發(fā)現,憶阻橋突觸的阻值增大,連接不斷增強且無明顯的波動。0~0.8 ms時,突觸的阻值增量為0.12 kΩ;0.8~1.6 ms時,阻值增量為0.11 kΩ;1.6~2.4 ms時,阻值增量為0.09 kΩ;2.4~3.2 ms時,阻值增量為0.07 kΩ。表明隨著刺激的輸入,阻值的增量逐漸減少,這個現象類似生物突觸連接穩(wěn)定的過程,即學習過程。當強刺激信號消失后,突觸的阻值下降緩慢,保持學習后的特性,即受到刺激作出的反應沒有消失而是記憶在系統(tǒng)中。整個過程表明,憶阻橋突觸對強信號刺激產生學習行為,并且具有記憶和抗遺忘性。
圖9 憶阻橋阻值變化
實驗表明:對憶阻橋突觸施加弱刺激信號時,突觸的阻值出現明顯的尖峰現象;施加強刺激信號時,突觸的阻值出現尖峰現象相對較少。當弱刺激信號消失后,突觸建立的連接會大幅度減弱,表示對弱刺激信號遺忘,類似眼睛對弱刺激的遺忘過程;當強刺激信號消失后,突觸電路在強刺激信號下建立的連接在一段時間內基本不變,表示對強刺激信號具有抗遺忘性。這個過程與眼睛對強、弱刺激的學習記憶過程相似,可以模擬眼睛對強、弱刺激的不同反應特性。
眨眼反射的短期習慣化是指眼睛在短期內受到刺激時,眼睛不發(fā)生眨眼動作,一段時間后再受到刺激時,眼睛仍會產生眨眼動作的過程。
2.5.1 憶阻橋突觸對無間隔刺激的反應特性
如圖10(a)所示,在憶阻橋突觸R1左側施加兩段間隔約10 ms、時長約2 ms的刺激信號,在R2端施加5.5 V的正電壓。輸入第一段連續(xù)刺激信號時,突觸的阻值連續(xù)增大;撤去該刺激信號后,突觸的阻值緩慢降低。輸入第二段連續(xù)刺激信號時,突觸的阻值在抗遺忘的基礎上繼續(xù)增加,表現出記憶保持和更新特性,如圖10(b)所示。
圖10(c)為憶阻橋突觸對無間隔刺激的電壓輸出變化情況。輸出電壓增大,表明突觸的抵抗眨眼能力增強。在0~2 ms時間段內,輸出電壓V0.2 ms=152.47 V,V0.6 ms=158.97 V,V1 ms=173.56 V,V1.4 ms=183.02 V(Va=b表示a時刻對應的電壓值為b),計算輸出電壓變化率為:
圖10 無間隔刺激下憶阻橋突觸的反應
(13)
式中:v(a,b)表示起始兩時刻a、b之間的變化率;ΔVa,b表示a、b兩點的電壓差。
在12~14 ms時間段內,輸出電壓V12.2 ms=153.9 V,V12.6 ms=167.17 V,V13 ms=183.59 V,V13.4 ms=190.89 V,計算輸出電壓幅值變化率為:
(14)
比較不同時段輸出電壓的變化率可知,第一次刺激對應的輸出電壓幅值增長率比第二次低,即受到第一次刺激后經過一段時間再受到相同刺激時,電壓幅值增大的速率明顯增加。表明憶阻器突觸對之前受到的刺激進行了學習和記憶,再次受到相同刺激時快速作出反應,也驗證了憶阻器突觸具有快速學習和記憶保持能力,能夠模擬眨眼反射的短期習慣化。
2.5.2 憶阻橋突觸對有間隔刺激的反應特性
對憶阻橋突觸R1左側施加4次三角波信號,每次間隔為0.2 ms,總時長為2.2 ms,如圖11(a)所示。同時在R2端施加5.5 V的正電壓,憶阻橋突觸的阻值變化情況如圖11(b)所示。結果表明,憶阻橋突觸阻值連續(xù)增大的過程中,即使存在0.2 ms的時間間隔,阻值仍有一段時間的記憶保持過程。
圖11 間隔刺激下憶阻橋突觸的反應
綜上可知,施加兩種刺激信號于憶阻橋突觸,均可實現短期習慣化,無論刺激過程中是否有時間間隔,憶阻橋突觸在短期習慣化過程中均表現出良好的抗遺忘性。
從生物角度講,長期習慣化是指生物經過長時間刺激學習后,生物突觸原先有效功能連接中斷歷時較長的過程,如眼睛受到多次無害刺激后,眨眼反射弱化或無眨眼行為,經過一段時間再次受到刺激眨眼反射仍然很弱或無眨眼行為。
在憶阻橋突觸R1左側施加多組刺激,每組持續(xù)2.2 ms(有時間間隔),如圖12(a)所示。同時在R2左側施加5.5 V的正電壓,憶阻橋突觸的阻值變化情況如圖12(b)所示。觀察發(fā)現,憶阻橋突觸的阻值逐漸增加并保持一段時間;在15 ms之前突觸的阻值變化明顯,15 ms之后阻值變化微弱,表明憶阻橋突觸的連接趨于穩(wěn)定。
圖12 長期習慣化的實現
實驗表明,當突觸對輸入電壓信號習慣化后,無論是內部無間隔刺激還是間隔性刺激,憶阻橋突觸的阻值下降時間均很緩慢,也說明憶阻橋突觸具有抗遺忘特性,經過多次信號刺激后,突觸部位原先有效功能連接無中斷,能保持原先記憶。該特性類似眼睛習慣外界刺激后,會對此產生的反應進行記憶,再次受到無害刺激后,由于先前的經驗會弱化眨眼反射,從而形成無眨眼行為的長期習慣化。
恢復習慣化是指習慣化經過長時間遺忘恢復到初始狀態(tài)或者施加新的刺激信號使其恢復至初始狀態(tài)的過程。在突觸電路形成習慣化的過程中,在5 ms內對憶阻橋突觸R1左側依次施加4次刺激,第6 ms時在R2左側額外施加電壓為200 V強刺激信號,憶阻橋突觸的阻值出現急速弱化,驟然恢復到初始狀態(tài),如圖13所示,表明對突觸電路施加新的強刺激時,可快速恢復習慣化。
觀察輸出信號電壓Vo可知,在6 ms時強刺激信號類似于一種負反饋信號,如圖13(d)所示,這是系統(tǒng)快速恢復至平衡狀態(tài)的原因。當恢復至初始態(tài)時(6 ms),繼續(xù)對突觸電路施加3次相同刺激,突觸電路對新的刺激信號能夠重新進行學習和記憶。這種變化與生物眨眼反射的習慣化恢復過程相似,即在多次同種刺激后,眼睛不再做出眨眼行為,但是當施加新的強刺激后,眼睛重新恢復眨眼反射的過程。
圖13 恢復習慣化的實現
本研究利用6個憶阻器構建了六憶阻橋突觸電路,分析了其在不同刺激信號下短期習慣化、長期習慣化和習慣化恢復的反應特性。研究發(fā)現,在同種信號刺激下憶阻橋突觸比單憶阻突觸習慣化形成的時間更短,具有記憶性和良好的抗遺忘性。在習慣化形成的過程中,阻值尖峰的出現有利于提高突觸的學習能力,增強突觸的抗遺忘性。仿真結果表明:憶阻橋突觸電路能夠模擬眨眼習慣化,具有快速學習、記憶和抗遺忘的特點,在施加刺激記憶的基礎上能夠快速形成和恢復習慣化,可以模擬生物學習、記憶和環(huán)境適應能力,為后續(xù)生物聯想記憶、快速記憶及抗遺忘研究提供理論參考。