胡敏銳,周海芳,賴云鋒
(福州大學物理與信息工程學院, 福建 福州 350108)
傳統(tǒng)計算機受到馮·諾依曼架構(gòu)瓶頸的限制,已難以滿足人們的要求. 像人腦一樣決策、 學習、 記憶和存儲是未來計算機發(fā)展的方向和目標,其中突觸仿生和突觸可塑性模擬被認為是實現(xiàn)高效類腦人工神經(jīng)網(wǎng)絡的第一步[1-2]. 為了實現(xiàn)這一目標,當前人們利用CMOS器件模擬生物行為,這不僅需要大量的器件還導致大量的能耗[3-4]. 新興的憶阻器件有獨特的類生物突觸非線性電學傳輸特性和電阻記憶行為,單個器件就能模擬生物突觸的部分行為[5-6]. 此外,憶阻器有著結(jié)構(gòu)簡單、 高開關速度、 高集成度并與CMOS工藝兼容等優(yōu)勢,因而備受青睞[7-8]. 近年來,學者們嘗試用新型材料進行突觸仿生研究,均取得了一定的成果. 如,文獻[9]使用基于金屬氧化物的憶阻器(Pd/Al2O3/TaOx/Ta)成功模擬了脈沖增強可塑性(paired-pulse facilitation,PPF)、 長程增強可塑性(long-term potentiation,LTP)和長程抑制可塑性(long-term depression,LTD); 文獻[10]使用基于有機材料的憶阻器(Ag/PEDOT: PSS/Ta)模擬了突觸放電時序依賴可塑性(spiking-timing-dependent plasticity,STDP); 文獻[11]使用基于二維材料的憶阻器(IZO/GO/ITO)模擬了突觸放電速率依賴可塑性(spiking-rate-dependent plasticity,SRDP). 但在使用何種材料的憶阻器作為電子突觸的問題上并未達成一致, 在性能和功能方面,現(xiàn)有的憶阻器件與生物突觸仍存在差距. 所以,在嘗試新材料和優(yōu)化現(xiàn)有憶阻器件的突觸性能方面仍有大量的工作需要開展.
氧化鉭是優(yōu)良的阻變材料,經(jīng)過研究發(fā)現(xiàn)氧化鉭基憶阻器有著優(yōu)異的耐擦寫性和較大的電導調(diào)節(jié)范圍[12-13],這有助于突觸功能的實現(xiàn),但其高低阻態(tài)突變切換行為和高運行功耗對突觸可塑性的模擬并不友好[1, 14]. 氧化鋅材料是一種有著良好的生物相容性、 成本低廉、 環(huán)境友好的阻變材料[15-17],目前使用ZnO/TaOx雙介質(zhì)層憶阻器來模擬生物突觸可塑性的研究較少,因而對其突觸性能研究有一定的意義. 本研究擬通過在氧化鉭基單介質(zhì)層憶阻器件(Ti/TaOx/ITO)中引入氧化鋅介質(zhì)層的方法來改進器件性能,并對學習飽和、 經(jīng)驗學習、 短時程記憶向長時程記憶轉(zhuǎn)換等突觸行為進行了模擬.
采用氧化銦錫(ITO)導電玻璃作為器件底電極和襯底,其ITO薄膜厚度為180 nm. 按照去離子水—丙酮—酒精—去離子水流程,依次對ITO玻璃超聲清洗15 min,然后用高純氬氣吹干,去除ITO玻璃表面的雜質(zhì). 使用JD-500Ⅱ型超高真空多靶磁控濺射鍍膜機來制備TaOx、 ZnO和Ti薄膜. 將玻璃基片放入鍍膜腔室并抽至高真空(10-3Pa以下),接著通入氬氣,氣壓調(diào)至0.6 Pa,使用40 W功率在ITO襯底上濺射30 nm厚的TaOx薄膜,最后依次使用光刻和直流磁控濺射技術在器件上制作直徑為50 μm、 厚度為100 nm的鈦電極,濺射氣壓和功率分別為0.5 Pa和40 W. 最終得到Ti/TaOx/ITO器件,標記為S1,結(jié)構(gòu)如圖1(a)所示. 在S1的基礎上,使用磁控濺射在氧化鉭薄膜上濺射15 nm厚的ZnO薄膜,濺射氣壓和濺射功率分別為0.5 Pa和70 W,光刻制作電極后得到Ti/ZnO/TaOx/ITO器件,標記為S2,結(jié)構(gòu)如圖1(b)所示. 本研究采用Keithley 4200-SCS半導體參數(shù)測試儀測試器件的電學性能.
圖1 器件的電流-電壓曲線及器件結(jié)構(gòu)示意Fig.1 The current-voltage curves and device structures
圖1(a)~(b)分別為器件S1(單阻變介質(zhì)層器件,以下簡稱單層器件)和器件S2(雙阻變介質(zhì)層器件,以下簡稱雙層器件)的器件結(jié)構(gòu)圖及典型的I-U曲線圖,其中圖1(b)為雙層器件S2循環(huán)100次的I-U曲線圖. 通過對比可知,盡管兩者的Set和Reset極性相反,但兩者都表現(xiàn)出雙極性阻變行為. 與S1單層器件相比,S2雙層器件的功耗有所下降(S1器件的Set和Reset功率大約為1和20 mW,而S2對應的Set和Reset功率只有100和10 nW左右),并且反復擦寫更加穩(wěn)定. S1單層器件在Set和Reset過程中,表現(xiàn)出突變的電阻切換,相比之下,S2雙層器件表現(xiàn)出更連續(xù)的電阻切換行為. 逐漸變化的電阻調(diào)制行為與生物突觸權(quán)重(神經(jīng)元間的連接強度)的變化行為比較接近[1]. 因此,S2器件更適合用來模擬生物突觸的可塑性.
具有電導線性調(diào)制能力的憶阻器可用于模式識別并有助于提高模式識別的精度[18-19]. 為此,分別對器件S1和S2的電導調(diào)制線性度進行測量. 在器件上電極施加20個相同的電壓訓練脈沖,脈沖的幅度/脈寬為+3 V/10 ms,脈沖之間間隔為100 ms,每個刺激脈沖后附帶一個幅度為+0.3 V的讀脈沖來讀取器件的電導值; 正向脈沖施加完畢后,立即在上電極上施加20個-3 V/10 ms的負向電壓脈沖,脈沖間隔為100 ms. 重復以上操作,在器件S1和器件S2上分別測得電導隨脈沖變化的三組數(shù)據(jù),如圖2(a)~(b)所示, 圖2(c)為電壓脈沖示意圖. 可以看出圖2(b)相對于圖2(a)的電導調(diào)制線性度有一定的提高,特別是施加正脈沖序列時(電導上升),隨著脈沖的不斷施加,S2器件的電導變化近似呈一條直線,而S1器件的電導會逐漸趨于飽和. 在基于氧化物的憶阻器中,氧空位和氧離子的遷移和積累引起介質(zhì)層的電阻變化是一種被廣泛接受的阻變機制. 在器件S1中,當在上電極上施加正偏壓時,器件內(nèi)會產(chǎn)生氧離子和氧空位. 氧空位會向底電極遷移,并在底電極發(fā)生積累,逐漸形成導電通道; 氧離子會向上電極(Ti)遷移,氧離子會逐漸與鈦電極發(fā)生反應,形成氧化鈦層. 而文獻[20]認為電極氧化層的形成會引起電導飽和效應的產(chǎn)生,其主要原因為當氧化層逐漸增厚,不僅會阻礙氧離子與鈦電極進一步反應,還會分走介質(zhì)層上的部分電壓,導致氧離子和氧空位的遷移速度逐漸變慢,最終使器件產(chǎn)生電導飽和效應. 而S2器件中引入了氧化鋅層,在制備過程中,由于ZnO和TaOx的吉布斯自由能不同(ΔGf, ZnO=-318.2 kJ·mol-1; ΔGf, TaOx=-1 904 kJ·mol-1),ZnO的吉布斯自由能更高,ZnO中的氧離子會進入TaOx介質(zhì)層中,所以ZnO層的氧空位濃度較高,當在正電極上施加正偏壓時,氧離子要先從TaOx層進入氧化鋅層,然后再遷移到鈦電極附近進行反應,氧化鋅層會捕獲一部分的氧離子,阻礙電極氧化層(TiOx)的形成,使氧空位和氧離子得以以較為均勻的速度進行遷移,從而緩解電導飽和效應,提升電導調(diào)制線性度. 所以,相較S1單介質(zhì)層器件,加入ZnO層的S2器件,在電導調(diào)制線性度方面有所改善.
圖2 電壓脈沖訓練下器件電導的變化Fig.2 Modulation of conductance by voltage pulse
綜上所述,S2器件有著更低的功耗、 更連續(xù)的電阻變化和更好的電導線性調(diào)制能力,這表明S2器件具備作為電子突觸應用的可能[2]. 因此,對S2器件的突觸性能進行了一系列的研究. 生物中的突觸的連接強度會隨著前后神經(jīng)元的活動而發(fā)生改變,與刺激信號的時序、 頻率以及強度等相關. 為了進一步分析電子突觸的學習行為,分別研究了電壓脈沖的幅值大小、 脈寬和間隔對器件電導調(diào)制的影響. 根據(jù)控制變量法,分別改變訓練脈沖的幅值(2、 4和5 V)、 脈寬(5、 50和100 ms)和脈沖間隔(60、 200 和400 ms),測得器件電導隨脈沖的變化趨勢圖,分別如圖3(a)~(c)所示(訓練脈沖示意圖如圖3(d)所示).
由圖3可知,當持續(xù)地施加訓練脈沖時,器件電導的增加速度會變慢,最終器件電導會達到一個上限,該上限隨著脈沖幅度或脈寬的增大而增大,隨脈沖間隔的增大而減小. 從突觸的角度看,學習效果在指數(shù)學習過程的早期最為明顯,隨著學習過程的繼續(xù),突觸權(quán)重(器件電導值)只會略微增強,最后達到飽和,這與生物突觸的學習飽和現(xiàn)象是一致的[21]. 這種飽和現(xiàn)象常見于生物突觸的長時程增強和長時程抑制當中,當突觸權(quán)重達到飽和時,即使繼續(xù)刺激也無法引起突觸的增強或抑制,以達到穩(wěn)定神經(jīng)回路的作用[9, 22]. 此處飽和效應的產(chǎn)生可以解釋為,在S2器件中,盡管加入的ZnO層能延緩電導飽和效應的產(chǎn)生,但隨著ZnO中的氧空位被逐漸消耗,ZnO層無法再捕獲氧離子,氧離子會直接穿過ZnO層與鈦電極進行反應,產(chǎn)生較厚的電極氧化層(TiOx),阻礙氧空位和氧離子的繼續(xù)遷移,最終會導致器件發(fā)生電導飽和行為.
圖4為模擬生物突觸的學習遺忘再學習特性. 首次對器件進行電壓脈沖訓練,用了20個相同的電壓脈沖使器件電導從0.4增加到0.8 nS,訓練脈沖的幅值為+3 V,脈寬為60 ms(如圖4(a)所示),脈沖間隔為100 ms; 撤去訓練脈沖后,電導迅速下降,20 s左右電導基本回到初始狀態(tài),這個過程與突觸的學習-遺忘過程類似(圖4(b)); 120 s后再次用相同的脈沖去刺激器件時,僅用了9個脈沖就使器件電導值達到了0.8 nS,再次學習會比第一次學習的效率高,這類似經(jīng)驗學習的過程(詳見圖4(c)). 可以看到,通過電壓脈沖的訓練,器件很好地模擬了突觸學習-遺忘-再學習行為[23].
圖4 經(jīng)驗學習Fig.4 Experiential learning
人腦的短時程記憶 (short time memory, STM) 持續(xù)時間很短, 只能通過刺激被短暫的維持, 而長時程記憶 (long time memory, LTM) 持續(xù)較長, 其不需要用隨后的刺激來維持, 因為已經(jīng)在突觸的結(jié)構(gòu)上產(chǎn)生了一些變化,而經(jīng)過訓練后,短時程記憶是可以向長時程記憶轉(zhuǎn)變的[1]. 在器件內(nèi)模擬了類似于短時程記憶向長時程記憶轉(zhuǎn)變的過程. 圖5為短時程記憶向長時程記憶轉(zhuǎn)變的模擬過程. 在實驗時,器件均會被施加六個連續(xù)的電壓脈沖,每個電壓脈沖的施加有一定的時間間隔,在這個時間間隔內(nèi)對器件電導進行持續(xù)地測量. 如圖5(a)所示,器件經(jīng)過單個脈沖的訓練之后,雖然電導值會發(fā)生變化,但是也會迅速遺忘,經(jīng)過6個脈沖訓練之后,最終電導值與初始電導值相比未發(fā)生明顯變化,這類似于突觸的短時程記憶,突觸在受到刺激后迅速恢復原來的狀態(tài). 根據(jù)圖3的結(jié)果,可以得到,訓練脈沖的間隔、 幅度和脈寬均會對器件的電導變化產(chǎn)生影響. 所以,將訓練脈沖的脈沖間隔縮短到0.5 s,器件電導隨時間的變化關系如圖5(b)所示. 可以看到,經(jīng)過脈沖訓練后最終電導值與初始值發(fā)生了較為明顯的改變(從0.2變到3 nS). 類似地,將訓練脈沖的幅值提升至5 V(圖5(c)). 在訓練脈沖撤去后再次對器件的電導進行了測量,測量時間持續(xù)160 s,如圖5(d)所示; 或?qū)⒚}寬提升至0.1 s圖5(e)). 圖5(f)為撤去訓練脈沖后的器件電導隨時間變化圖. 可以觀察到,訓練完畢后器件電導相對于初始電導皆有較大的提升,圖5(c)中電導從0.2變到1.0 nS; 圖5(e)中電導從0.2變到2.0 nS. 同時,圖5(c)中初始電導約為0.2 nS,穩(wěn)定電導約為0.5 nS; 圖5(e)中初始電導為0.2 nS,穩(wěn)定電導約為0.6 nS,電導值雖有所下降,但終會趨于穩(wěn)定,且穩(wěn)定值相對于初始值有明顯的變化,這表明器件已經(jīng)完成了短時記憶向長時記憶的轉(zhuǎn)變. 值得注意的是,此器件有著較低的電導,在電壓訓練脈沖下,這意味著更低的功耗[24]. 綜上所述,該器件可以通過控制訓練脈沖的參數(shù)來較好地模擬突觸的短時記憶向長時記憶轉(zhuǎn)變的行為.
圖5 短時程記憶向長時程記憶轉(zhuǎn)變過程模擬Fig.5 Simulation of the transition process from short-term memory to long-term memory
本研究通過微電子加工工藝在Ti/TaOx/ITO中引入了氧化鋅介質(zhì)層,分析發(fā)現(xiàn)改進后器件(Ti/ZnO/TaOx/ITO雙層介質(zhì)憶阻器)的功耗降低,且有著電阻漸變的行為,這有利于生物突觸功能的實現(xiàn). 通過使用電壓脈沖對Ti/ZnO/TaOx/ITO雙介質(zhì)層憶阻器進行訓練,很好地模擬了學習飽和、 經(jīng)驗學習以及短時程向長時程記憶轉(zhuǎn)變等生物突觸行為. 此外,該器件有著較好的電導調(diào)制線性度,這將有利于其在模式識別中的應用.