亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于RRAM雙交叉陣列結(jié)構(gòu)的三值存內(nèi)邏輯電路設(shè)計(jì)

2022-04-12 06:47:32劉維祎孫亞男何衛(wèi)鋒

電子科技 2022年4期

劉維祎，孫亞男，何衛(wèi)鋒

(上海交通大學(xué) 電子信息與電氣工程學(xué)院，上海 200240)

隨著計(jì)算數(shù)據(jù)爆發(fā)式增長(zhǎng)，傳統(tǒng)的馮諾依曼架構(gòu)開(kāi)始面臨存儲(chǔ)墻的問(wèn)題，即存儲(chǔ)器與處理器之間大量數(shù)據(jù)搬運(yùn)消耗了系統(tǒng)中大部分功耗并增加了系統(tǒng)延時(shí)[1-10]。傳統(tǒng)的數(shù)字處理系統(tǒng)是二值的，邏輯值通過(guò)兩個(gè)離散的電壓表示。在處理大量數(shù)據(jù)時(shí)，二值系統(tǒng)的速度更加緩慢。此外，隨著半導(dǎo)體器件特征尺寸的縮小，傳統(tǒng)基于CMOS硅工藝的半導(dǎo)體器件亞閾值漏電流急劇增加[11-14]，基于CMOS的邏輯電路開(kāi)始遇到物理瓶頸。因此，急需一種在解決存儲(chǔ)墻問(wèn)題的同時(shí)可以更高效地執(zhí)行邏輯和算術(shù)運(yùn)算的高性能計(jì)算范式，以應(yīng)對(duì)未來(lái)數(shù)據(jù)密集型任務(wù)。

新型非易失存儲(chǔ)器，例如阻變存儲(chǔ)器(Resistive Random-Access Memory，RRAM)具有數(shù)據(jù)多值存儲(chǔ)的能力[3]，同時(shí)也可用于邏輯計(jì)算[4-10]。如圖1(a)所示，RRAM是一種由金屬層、氧化物層和金屬層組成的三明治結(jié)構(gòu)器件。通過(guò)導(dǎo)電細(xì)絲的生長(zhǎng)與破壞，RRAM可實(shí)現(xiàn)電阻大小的變化。如圖1(b)所示，RRAM的阻值變化通過(guò)復(fù)位和置位過(guò)程實(shí)現(xiàn)。對(duì)于傳統(tǒng)的單值RRAM而言，只存在高阻和低阻兩種狀態(tài)，而多值RRAM具有兩個(gè)以上的阻值狀態(tài)。在RRAM兩端施加復(fù)位電壓(負(fù)極電平高于正極)，導(dǎo)電細(xì)絲被破壞，RRAM阻值由低阻變?yōu)楦咦琛Ｔ赗RAM兩端施加置位電壓(正極電平高于負(fù)極)，導(dǎo)電細(xì)絲生長(zhǎng)，RRAM阻值由高阻變?yōu)榈妥琛?/p>

圖1 RRAM器件原理(a)RRAM的三明治結(jié)構(gòu)圖 (b)單值RRAM與多值RRAM示意圖Figure 1. The device principle of RRAM(a)The sandwich structure of RRAM(b)Single level cell RRAM and multi-level cell RRAM

邏輯計(jì)算可以在高密度集成的RRAM交叉陣列中實(shí)現(xiàn)，即存內(nèi)邏輯電路。存內(nèi)邏輯電路可以消除傳統(tǒng)馮諾依曼架構(gòu)中因數(shù)據(jù)搬運(yùn)導(dǎo)致的功耗和延時(shí)開(kāi)銷。目前基于RRAM存內(nèi)邏輯電路的設(shè)計(jì)，例如IMPLY(Material Implication)[4-7]和MAGIC(Memristor Aided Logic)[8-10]，只實(shí)現(xiàn)了二值邏輯操作，邏輯電路的輸入和輸出均通過(guò)交叉陣列中單值RRAM阻值表示。IMPLY和MAGIC僅支持一種基本二值邏輯操作，同時(shí)為了確保邏輯操作的正確性，無(wú)法提供多個(gè)扇入或扇出。另外，在RRAM交叉陣列中實(shí)現(xiàn)IMPLY和MAGIC邏輯電路時(shí)，邏輯電路的輸入與輸出需要在同一個(gè)交叉陣列的同一行或同一列上。在將任意二值邏輯函數(shù)映射到交叉陣列中時(shí)，基于IMPLY和MAGIC的映射方法[4-10]需要更多的拷貝操作來(lái)完成邏輯操作輸入與輸出的對(duì)齊。因此在傳統(tǒng)的IMPLY和MAGIC二值存內(nèi)邏輯電路中實(shí)現(xiàn)一個(gè)復(fù)雜的邏輯函數(shù)往往需要較多的操作步數(shù)以及較大的延時(shí)。

相比于二值邏輯系統(tǒng)，三值邏輯系統(tǒng)可以減少算術(shù)運(yùn)算所需要的位數(shù)，從而減少邏輯操作數(shù)目并降低計(jì)算復(fù)雜度。新型的納米技術(shù)如碳納米晶體管(Carbon Nanotube MOSFET，CN-MOSFET)具有較低的漏電流以及可變的器件大小[11-14]。通過(guò)調(diào)節(jié)平帶電壓實(shí)現(xiàn)的多閾值CN-MOSFET可以用來(lái)實(shí)現(xiàn)三值邏輯電路[14]。然而，以往的三值邏輯電路設(shè)計(jì)多基于傳統(tǒng)的馮諾依曼系統(tǒng)。三值存內(nèi)邏輯電路的實(shí)現(xiàn)仍是一個(gè)很大的挑戰(zhàn)。

本文提出了一種新型的基于RRAM雙交叉陣列結(jié)構(gòu)的三值存內(nèi)邏輯電路設(shè)計(jì)。在該設(shè)計(jì)中，邏輯電路的輸入和輸出均通過(guò)多值RRAM的阻值表示。CN-MOSFET與RRAM可以通過(guò)三維的方式進(jìn)行異質(zhì)集成[11]。為了構(gòu)建高密度集成且低能耗的三值存內(nèi)邏輯電路系統(tǒng)，外圍電路由CN-MOSFET實(shí)現(xiàn)。本文提出的電路結(jié)構(gòu)支持兩種可具有多個(gè)扇入和扇出的三值邏輯門(mén)以及一種Material Implication邏輯門(mén)。基于以上的兩種三值邏輯門(mén)和一種Material Implication邏輯門(mén)，任意三值邏輯函數(shù)可以快速地映射到交叉陣列結(jié)構(gòu)中。本文將基于不同存內(nèi)邏輯電路設(shè)計(jì)的多位行波進(jìn)位加法器進(jìn)行了實(shí)現(xiàn)。實(shí)驗(yàn)結(jié)果表明，相比于傳統(tǒng)二值存內(nèi)邏輯電路設(shè)計(jì)，三值存內(nèi)邏輯電路加法器可以減少68.84%的操作步數(shù)。相比于傳統(tǒng)IMPLY電路設(shè)計(jì)，三值存內(nèi)邏輯電路加法器可以降低33.05%的能耗。

1 基于RRAM雙交叉陣列結(jié)構(gòu)的三值存內(nèi)邏輯電路設(shè)計(jì)

圖2為RRAM雙交叉陣列結(jié)構(gòu)。在三值存內(nèi)邏輯電路中，RRAM的高阻狀態(tài)表示邏輯“0”；中間阻值狀態(tài)表示邏輯“1”；低阻狀態(tài)表示邏輯“2”。圖2所示的電路結(jié)構(gòu)支持兩種三值邏輯門(mén)(MAX以及NMAX)，以上兩種邏輯門(mén)可支持多個(gè)扇入和扇出。此外，該電路結(jié)構(gòu)還支持NIMP邏輯門(mén)[7]。

1.1 三值邏輯門(mén)MAX與NMAX的電路設(shè)計(jì)

根據(jù)多值邏輯代數(shù)學(xué)，三值邏輯門(mén)MAX、NMAX以及一些一元運(yùn)算符可以組成三值邏輯函數(shù)的全集[15]。一元運(yùn)算符根據(jù)文獻(xiàn)[13]通過(guò)外圍CN-MOSFET邏輯電路實(shí)現(xiàn)，三值邏輯門(mén)MAX與NMAX則通過(guò)RRAM雙交叉陣列結(jié)構(gòu)實(shí)現(xiàn)。MAX與NMAX的真值表如圖3所示。MAX與NMAX邏輯門(mén)電路如圖4所示。MAX與NMAX邏輯門(mén)可以直接映射到圖2所示的RRAM雙交叉陣列結(jié)構(gòu)中。在將MAX與NMAX邏輯門(mén)映射到雙交叉陣列結(jié)構(gòu)中時(shí)，邏輯門(mén)的輸入在一個(gè)交叉陣列的同一列，邏輯門(mén)的輸出在另一個(gè)交叉陣列中。

圖2 RRAM雙交叉陣列結(jié)構(gòu)Figure 2. The proposed RRAM dual-crossbar structure

圖3 MAX與NMAX邏輯門(mén)真值表Figure 3. The truth table of MAX and NMAX gates

下面以MAX邏輯門(mén)為例說(shuō)明三值存內(nèi)邏輯電路的工作原理。三值邏輯門(mén)的輸入值以阻值的形式存儲(chǔ)在輸入RRAM(A和B)中，輸出RRAM在操作前先初始化為高阻狀態(tài)。通過(guò)施加外圍電壓Vcond和VWR，電路開(kāi)始進(jìn)行邏輯計(jì)算。輸入RRAM和參考電阻(RT)形成分壓結(jié)構(gòu)并驅(qū)動(dòng)后一級(jí)的標(biāo)準(zhǔn)反相器(Standard Ternary Inverter，STI)電路。考慮到CN-MOSFET的高驅(qū)動(dòng)強(qiáng)度以及較小的面積，STI電路通過(guò)CN-MOSFET實(shí)現(xiàn)，以便最大限度保留RRAM交叉陣列結(jié)構(gòu)的高速翻轉(zhuǎn)和高密度集成特性。

STI電路如圖5所示。通過(guò)調(diào)整CN-MOSFET的平帶電壓(Vfb)，STI電路可輸出3種離散的電壓值(Vso)。如圖4所示，Vso驅(qū)動(dòng)1T1R結(jié)構(gòu)中P型CN-MOSFET的柵極。不同的Vso電壓值可以調(diào)節(jié)流過(guò)1T1R結(jié)構(gòu)的限制電流。根據(jù)不同的輸入情況，輸出RRAM或者維持在高阻狀態(tài)，或者翻轉(zhuǎn)到的中間阻值狀態(tài)或低阻狀態(tài)。

圖4 MAX與NMAX邏輯門(mén)電路圖(a)MAX邏輯門(mén)電路圖 (b)NMAX邏輯門(mén)電路圖Figure 4. The circuit schematic of MAX and NMAX(a)The circuit schematic of MAX gate (b)The circuit schematic of NMAX gate

圖5 STI電路圖Figure 5. The circuit schematic of STI

MAX邏輯門(mén)的仿真波形如圖6所示。HSPICE的仿真基于Verilog-A RRAM模型[16]和16nm Stanford University Virtual Source GAA-CN-MOSFET模型[17-18]。CN-MOSFET電路供電電壓為0.7 V。RRAM的高阻狀態(tài)的阻值為1 MΩ，低阻狀態(tài)阻值為5 kΩ[16]。Vcond電壓為0.7 V，1T1R結(jié)構(gòu)中的VWR電壓為1.3 V。在存在工藝偏差時(shí)，為了保證在不同輸入情況下輸出RRAM仍可以正確地翻轉(zhuǎn)到希望阻值狀態(tài)，參考電阻RT選取阻值為35 kΩ，RRAM中間阻值狀態(tài)選取阻值為60 kΩ。當(dāng)兩個(gè)輸入RRAM均處于高阻狀態(tài)(邏輯“0”)時(shí)，輸出RRAM維持在高阻狀態(tài)(邏輯“0”)，如圖6(a)所示。當(dāng)輸入RRAM有一個(gè)為低阻狀態(tài)(邏輯“2”)時(shí)，輸出RRAM翻轉(zhuǎn)到低阻狀態(tài)(邏輯“2”)，如圖6(b)所示。其余情況下，輸出RRAM翻轉(zhuǎn)到中間阻值狀態(tài)(邏輯“1”)，如圖6(c)所示。

圖6 MAX邏輯門(mén)仿真波形(a)輸入RRAM均為高阻狀態(tài)時(shí)的仿真波形(b)輸入RRAM有一個(gè)為低阻狀態(tài)時(shí)的仿真波形(c)輸入RRAM分別為高阻狀態(tài)和中間阻值狀態(tài)時(shí)的仿真波形Figure 6. The simulation waveform of MAX gate(a)The simulation waveform when the inputs are in high resistance state (b)The simulation waveform when one of the inputs is in low resistance state (c)The simulation waveform when the inputs are in high resistance state and medium resistance， respectively

在三值存內(nèi)邏輯電路設(shè)計(jì)中，當(dāng)多個(gè)MAX或NMAX邏輯門(mén)的輸入位于一個(gè)交叉陣列的不同列且對(duì)齊時(shí)，多個(gè)MAX或NMAX邏輯門(mén)可以并行執(zhí)行，多個(gè)邏輯門(mén)的輸出位于另一個(gè)交叉陣列的同一列中。另外，通過(guò)將MAX與NMAX邏輯門(mén)的輸入RRAM和輸出RRAM分離在不同的交叉陣列中，本文提出的MAX與NMAX邏輯門(mén)可支持多個(gè)扇入和扇出。通過(guò)調(diào)整Vcond電壓值的大小可以實(shí)現(xiàn)多個(gè)扇入，通過(guò)調(diào)節(jié)VWR電壓值的大小可以實(shí)現(xiàn)多個(gè)扇出。因此，三值存內(nèi)邏輯電路設(shè)計(jì)避免了以往二值存內(nèi)邏輯電路設(shè)計(jì)中由于拷貝操作過(guò)多造成的延時(shí)開(kāi)銷。在將任意一個(gè)邏輯函數(shù)映射到交叉陣列結(jié)構(gòu)時(shí)，基于三值存內(nèi)邏輯電路結(jié)構(gòu)的實(shí)現(xiàn)方式具有更快的計(jì)算速度。

1.2 NIMP門(mén)的電路設(shè)計(jì)

除了章節(jié)1.1中討論的三值MAX和NMAX邏輯門(mén)外，本文提出的電路結(jié)構(gòu)支持一種Material Implication邏輯門(mén)，稱為NIMP[7]。NIMP門(mén)的輸入RRAM與輸出RRAM均位于同一個(gè)交叉陣列中。NIMP門(mén)的真值表如圖7(a)所示。NIMP門(mén)可以在雙交叉陣列結(jié)構(gòu)的任一交叉陣列中實(shí)現(xiàn)。NIMP門(mén)包含兩個(gè)RRAM器件(p和q)以及一個(gè)參考電阻RB。原始輸入以阻值的形式存儲(chǔ)在RRAM器件p和q中。施加Vcond+和Vcond-后電路開(kāi)始工作，邏輯門(mén)輸出值以阻值的形式存儲(chǔ)到RRAM器件q中。

圖7 NIMP門(mén)的實(shí)現(xiàn) (a)NIMP門(mén)真值表 (b)輸入位于同一列的NIMP門(mén)電路 (c)輸入位于同一行的NIMP門(mén)電路Figure 7. NIMP gate implementation (a)The truth table of NIMP gate (b)The circuit of NIMP gate when the inputs are in the same column of crossbar (c)The circuit of NIMP gate when the inputs are in the same row of crossbar

2 與其他二值存內(nèi)邏輯電路設(shè)計(jì)的對(duì)比

本文將基于不同存內(nèi)邏輯電路設(shè)計(jì)的多位行波進(jìn)位加法器進(jìn)行了實(shí)現(xiàn)。基于文獻(xiàn)[10]中的compact mapping方法與文獻(xiàn)[6]中的semi-parallel方法分別實(shí)現(xiàn)了64位二值行波進(jìn)位加法器。為了公平地比較，三值行波進(jìn)位加法器的位數(shù)進(jìn)行了相應(yīng)的調(diào)整以保證和二值行波進(jìn)位加法器的和的范圍相近。由于41位三值行波進(jìn)位加法器與64位二值行波進(jìn)位加法器的和的范圍相近，因此其被選作比較對(duì)象。

表1中對(duì)不同加法器設(shè)計(jì)的操作步數(shù)以及能耗進(jìn)行了比較。二值行波進(jìn)位加法器的位數(shù)表示為Nb。在基于MAGIC的Compact Mapping方法中[10]， MAGIC邏輯電路設(shè)計(jì)只支持NOR2門(mén)以及NOT門(mén)。所有的原始輸入被映射到交叉陣列的同一列中，之后將NOT門(mén)與NOR2門(mén)映射到交叉陣列中。為了將邏輯門(mén)的輸入對(duì)齊在交叉陣列的同一行或同一列中，Compact Mapping法需要很多的拷貝操作。對(duì)于Nb位的二值行波進(jìn)位加法器，Compact Mapping方法共需要(13Nb+4)步操作。

表1 存內(nèi)邏輯電路實(shí)現(xiàn)加法器的對(duì)比Table 1. Comparison of logic-in-memory adders

在基于IMPLY的semi-parallel加法器設(shè)計(jì)中，不同全加器之間的操作需要串行執(zhí)行，每一個(gè)全加器可以在交叉陣列的兩行中并行執(zhí)行[6]。由于在基于Semi-parallel的加法器設(shè)計(jì)中，大部分操作仍然是串行執(zhí)行的，因此其相比于MAGIC設(shè)計(jì)具有更多的操作步數(shù)。對(duì)于Nb位的二值行波進(jìn)位加法器，Semi-parallel方法共需要17Nb步操作。

三值存內(nèi)邏輯電路加法器設(shè)計(jì)如下所示：首先構(gòu)建三值全加器，A、B和Cin是三值全加器的輸入。S和Cout是三值全加器的輸出。A、B和S的取值范圍為{0, 1, 2}。Cin和Cout的取值范圍為{0, 2}。計(jì)算S和Cout所需的一元運(yùn)算符的真值表如表2所示。

表2 一元運(yùn)算符真值表Table 2. The truth table of unary operators

(1)

(2)

根據(jù)式(1)及式(2)以及本文電路結(jié)構(gòu)所支持的MAX、NMAX和NIMP邏輯門(mén)可以構(gòu)建三值全加器多層邏輯網(wǎng)絡(luò)圖，如圖8所示，實(shí)現(xiàn)Nt位加法器的步數(shù)已在圖上標(biāo)出。三值行波進(jìn)位加法器的位數(shù)表示為Nt。在將Nt位三值行波進(jìn)位加法器映射到RRAM雙交叉陣列結(jié)構(gòu)中時(shí)，首先將由CN-MOSFET外圍電路[13]產(chǎn)生的一元運(yùn)算符邏輯值寫(xiě)入到Plane-1和Plane-2相應(yīng)的RRAM中。兩個(gè)交叉陣列中的一元運(yùn)算符需要對(duì)齊以最大化NIMP操作的并行度。生成所有Nt位的NIMP邏輯門(mén)結(jié)果一共需要7步。NIMP邏輯門(mén)的結(jié)果需要在同一列中以便進(jìn)行MAX操作，產(chǎn)生所有Nt位的G1～G5結(jié)果一共需要2Nt步。通過(guò)G1～G4與Cin做NIMP操作得到每一個(gè)三值全加器的H1～H5；通過(guò)G5與H5做MAX操作得到每一個(gè)三值全加器的Cout。產(chǎn)生Nt位加法器最后進(jìn)位結(jié)果需要(5Nt+2)步。產(chǎn)生最后的和的結(jié)果需要(Nt+2)步。因此完成Nt位加法器的映射一共需要(8Nt+11)步。

圖8 三值全加器多層邏輯網(wǎng)絡(luò)圖Figure 8. The multi-level logic network for implementing a ternary full adder

如表1所示，相比于64位MAGIC二值存內(nèi)邏輯電路加法器，41位三值存內(nèi)邏輯電路加法器可以減少59.45%操作步數(shù)。相比于64位IMPLY二值存內(nèi)邏輯電路加法器，41位三值存內(nèi)邏輯電路加法器可以減少68.84%操作步數(shù)。相比于二值邏輯，三值邏輯具有更少的位數(shù)以及更少的邏輯操作數(shù)目，因此三值存內(nèi)邏輯電路加法器具有最快的計(jì)算速度。

三值存內(nèi)邏輯電路加法器速度提升的代價(jià)為其能耗相比于MAGIC二值存內(nèi)邏輯電路設(shè)計(jì)多出了27.41%。相比于IMPLY二值存內(nèi)邏輯電路設(shè)計(jì)，三值存內(nèi)邏輯電路加法器能耗降低了33.05%。

3 結(jié)束語(yǔ)

本文提出了一種新型的基于RRAM雙交叉陣列結(jié)構(gòu)的三值存內(nèi)邏輯電路設(shè)計(jì)。在三值存內(nèi)邏輯電路設(shè)計(jì)中，邏輯函數(shù)的輸入與輸出值均通過(guò)多值RRAM的阻值狀態(tài)表示。該電路結(jié)構(gòu)支持兩種可具有多個(gè)扇入和扇出的三值邏輯門(mén)以及一種Material Implication邏輯門(mén)。本文將基于不同存內(nèi)邏輯電路設(shè)計(jì)的多位行波進(jìn)位加法器進(jìn)行了實(shí)現(xiàn)。實(shí)驗(yàn)結(jié)果顯示，相比于傳統(tǒng)二值存內(nèi)邏輯電路設(shè)計(jì)，三值存內(nèi)邏輯電路加法器可以提升高達(dá)68.84%的計(jì)算速度。相比于傳統(tǒng)IMPLY邏輯電路設(shè)計(jì)，三值存內(nèi)邏輯電路加法器可以降低33.05%能耗。