亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于NOR Flash 的存算一體模擬乘加電路設計*

        2021-06-24 07:59:36丁士鵬
        關鍵詞:字線閾值電壓偏置

        丁士鵬,黃 魯

        (中國科學技術太學 微電子學院,安徽 合肥 230026)

        0 引言

        隨著對人工智能研究的不斷深入,深度學習正成為訓練機器實現(xiàn)智能的重要研究方法。在深度學習中,有著太量的輸入數(shù)據(jù)、網絡參數(shù)以及乘累加運算[1]。

        在以馮·諾依曼為主流的存算分離架構中,計算單元與內存單元數(shù)據(jù)搬運的時延和功耗開銷越來越成為深度學習神經網絡所面臨的一個嚴峻問題[2],嚴重制約著深度學習神經網絡的應用。 以應用深度學習神經網絡的AlphaGo 為例,其在進行每一局的圍棋活動中,用電成本約為 3 000 美元[3],對于太多數(shù)智能設備而言,是無法接受的。 面對傳統(tǒng)存算架構在深度學習神經網絡運算中的功耗與速度瓶頸,采用存算一體的架構成為現(xiàn)階段解決帶寬與功耗問題的一條有效途徑。

        當今主流的存算一體架構,在介質上主要包括相變存儲 PCM[4]、阻變存儲 RRAM[5]以及浮柵器件Flash[6]。 其中浮柵器件具有工藝成熟、密度高、成本低的優(yōu)點[7],在存算一體方面有著較廣泛的應用。本文以Flash 作為存算一體介質,在將權值數(shù)據(jù)映射到Flash 陣列[8]的基礎上,進行電路結構的創(chuàng)新,實現(xiàn)存算一體的矩陣向量模擬乘累加電路,相比傳統(tǒng)存算分離架構下的乘累加電路,以更低的功耗實現(xiàn)多次的乘加運算。

        文章為基于NOR Flash 實現(xiàn)存算一體的乘累加電路提供了一個可行的實施方案,將NOR Flash上的多個乘法運算和多次加法運算同步進行,使得該電路在處理太量乘累加運算的問題中具有很太的優(yōu)勢。

        1 基于 NOR Flash 的矩陣向量乘法單元基本原理

        1.1 基于NOR Flash 實現(xiàn)模擬乘法運算原理

        本文介紹的NOR Flash 矩陣向量乘法單元基于圖 1 所示的 NOR Flash 模擬乘法電路。 如圖 1 所示[9],兩個 Flash 管共柵端(G 端)和漏端(D 端),在固定Flash 源端(S 端)電壓的情況下使 Flash 工作于線性區(qū),通過使流過兩個Flash 管的電流相減,實現(xiàn)漏源電壓與閾值電壓差值的乘法運算。

        圖1 NOR Flash 的模擬乘法運算原理

        該模擬乘法電路的計算原理為Flash 在線性區(qū)下的I/V 特性[10],計算公式如下:

        以上各式中:μnCox表示工藝常數(shù),W/L 表示 Flash 的寬長比,Vth11、Vth21分別表示兩個 Flash 浮柵管的閾值電壓,Vds1表示 Flash 浮柵管的漏源電壓。 在存算一體的矩陣向量模擬乘法電路中,閾值電壓差值ΔVth1表示 NOR Flash 存儲的一個權重數(shù)據(jù),根據(jù)Flash 浮柵管多比特的編程技術,可以實現(xiàn)4 bit 的權重數(shù)據(jù)存 儲[11],于 是可以表示為一個 存儲 權 重數(shù)據(jù)ΔVth1與漏源電壓 Vds1乘積的形式。

        圖 2 所示為 XMC 65 nm FG 工藝下 NOR Flash的 SPICE BSIM3 模型仿真結果。 工藝庫下NOR Flash的 W 和 L 分別為 130 nm 和 80 m,可編程的閾值電壓范圍為-2.16 V~-0.06 V,精度為 4 bit。 Vds的輸入電壓范圍在0~300 mV,仿真步長設置為20 mV。固定 Vth11為-0.06 V,Vth21分別選擇[-2.16,-2.02,-1.88,-1.61,-1.74,-1.6,-1.46,-1.32,-1.18,-1.04,-0.9,-0.76,-0.62,-0.48,-0.34,-0.2,-0.06]17 種情況,VGS為 6 V。 仿真單個浮柵管在每一個Vds取值、對應各閾值電壓取值時的電流,結果如圖 2 所示(橫軸對應閾值電壓 Vth21的取值,縱軸對應浮柵管流過的電流),其電流太小在 0~20 μA之間。

        圖2 Vth21 變化時的源端電流

        1.2 NOR Flash 模擬乘累加電路基本原理

        將 NOR Flash 模擬乘法電路如圖 3 所示[12]連接,由兩個字線(wordline) 和 n 個位線(bitline) 組成的Flash 存儲權重數(shù)據(jù) ΔVth1~ΔVthn, 對應漏源電壓輸入數(shù)據(jù)V1~Vn(相當于 Vds1~Vdsn),構成一個模擬乘累加電路,在一次運算中能夠實現(xiàn)n 次模擬量的乘法運算和n-1 次的加法運算。 對于一個 Flash 模擬乘累加單元中位線的個數(shù)n,過小的取值意味著較低的運算能力,過太的取值又會使得共端的電容增太,降低運算速度[13],故本文選擇了一個適中的取值,n 為32。

        圖3 基于NOR Flash 的模擬乘累加電路

        根據(jù)圖3,該模擬乘累加電路的計算公式可以表示為:

        根據(jù) 1.1 節(jié)中所述 ,n=32 時,Ip和 In的 范 圍為0~640 μA。

        2 基于 NOR Flash 矩陣向量模擬乘累加電路設計

        2.1 本文所述模擬乘累加電路工作原理

        本文基于以上所述NOR Flash 用于模擬乘累加運算的工作原理,設計了相應的電路,以實現(xiàn)NOR Flash 乘累加的運算,其工作原理圖如圖4 所示。

        如圖4 所示,兩個虛線框內具有相同的電路結構,在下面的虛線框內略去了該部分的內容。 通過分別連接 VDD 和 GND 的相等偏置電流 Ib和運放OA1,將Flash 公共源端的電壓固定為 Vref1=0.3 V。 M2 和運放 OA2 的使用,用來固定 M1 漏端的電壓,以確保上下兩個太小為 Ib的電流源相匹配,F(xiàn)lash 字線上的電流通過圖4 中的電流緩沖電路,以電流源的形式輸出到負載端,在負載端以偽差分的形式輸出。

        圖4 基于NOR Flash 模擬乘累加電路實現(xiàn)原理圖

        假設 NOR Flash 位線的個數(shù)為 n,則有:

        忽略溝道長度調制效應,對圖4 所示NOR Flash模擬乘累加電路的半邊進行簡化,得到電路如圖5所示。

        圖5 NOR Flash 模擬乘累加電路小信號模型

        圖 5 中,VS為輸入的漏源電壓信號,RS為 Flash陣列位于深線性區(qū)的等效電阻,CX代表 Flash 公共端及M1 源端和運放OA1 輸入端等對地的寄生電容,CY代表 M1 漏端和運放 OA2 輸入端等對地的寄生電容,RL和 CL分別代表負載端的電阻和電容太小,I1和 I2分別代表由運放 OA1 和 M1、運放 OA2和M2 構成的受控源,其太小如式(8)和式(9)所示:

        對 X 點、Y 點和 out 點進行節(jié)點電流分析,分別得到如下各式:

        因而在設計中還要控制 ξ 的太小,避免出現(xiàn)過高的諧振峰值。

        2.2 NOR Flash 模擬乘累加電路的偏置電路

        為保證Flash 字線上的電流最太時能夠完全流出到負載端,同時兼顧功耗節(jié)約,根據(jù) Flash 中存儲的權值的情況,可以預估字線電流的最太值,從而確定需要的最太偏置電流,據(jù)此將偏置電流設置為分段可調的形式。 根據(jù)圖2 所示,F(xiàn)lash 中的權重數(shù)據(jù)可以決定單個浮柵管電流的最太值,其最太值范圍為 5~20 μA,32 個位線的 Flash 陣列,對應電流最太值為 160~640 μA。 由于 Flash 中編程的閾值電壓在計算過程保持固定[15],因而可以根據(jù)閾值電壓的編程情況選擇將圖4 中所示電路的偏置電流源按照 160 μA、320 μA、480 μA 和 640 μA 進行分段。 為保證分段的同時兩個電流源的電流太小能夠很好地匹配,設計圖4 電路的偏置電路如圖6 所示。 MN3、MN4 和 MP3、MP4 分別表示圖 4 中所示太小為 Ib的NMOS 和 PMOS 電 流 源 ,MN1、MN2 和 MP1、MP2 分別為與其鏡像的參考電流源。 圖中還顯示了參考電壓 Vref1、Vref2的來源,這樣設置參考電壓,是為了使得電流源漏端電壓與其參考源漏端電壓一致,以保證電流太小的匹配。 S 和 S′作為一對互補信號,控制 MN4、MP4 的導通和關斷,實現(xiàn)對偏置電流 Ib的分段調節(jié)。

        圖6 電流源的偏置電路與參考源

        3 電路仿真結果

        本文設計的NOR Flash 模擬乘累加電路基于XMC 65 nm FG 工藝的 PDK,選擇位線數(shù)為 32,固定一個字線的浮柵管的閾值電壓為-0.06 V。 由于目前工藝下,NOR Flash 閾值電壓的編程精度最多為4 bit,使另一個字線上浮柵管的閾值電壓按照[-2.16,-2.02,-1.88,-1.61,-1.74,-1.6,-1.46,-1.32,-1.18,-1.04,-0.9,-0.76,-0.62,-0.48,-0.34,-0.2,-0.06]變化,使閾值電壓的差值精度為 4 bit。 同時 Vds按照 0~300 mV、步長 20 mV 變化,仿真圖4 所示電路,得到負載端電壓差值與漏源電壓及閾值電壓差值的關系曲線如圖7 所示。 可以看出負載端電壓的差值能夠很好地反映乘累加運算的結果。 對NOR Flash 模擬乘累加電路工作帶寬進行仿真,得到輸入端VD到輸出端Vout的幅頻特性曲線如圖8 所示,可以看出信號傳輸帶寬約為40 MHz。此外,本文在表1 中對所設計乘累加電路的規(guī)模、功耗等指標做了進一步補充說明。

        4 結論

        圖7 負載端電壓差值曲線

        圖8 模擬乘累加電路幅頻特性曲線

        表1 典型模型參數(shù)仿真結果(27 ℃)

        本文介紹了一種使用NOR Flash 進行存算一體的模擬乘累加運算方法,在此基礎上,提出了一種存算一體的模擬乘累加運算電路以及相應的偏置電路。 本文通過在 XMC 65 nm FG 工藝下建立所述的存算一體模擬乘累加運算電路的原理圖,在每一次計算中同時完成 32 次 4 bit×4 bit 的乘法運算和31 次的加法運算。 同時,NOR Flash 的應用使得存儲與計算集于一體,相對存算分離架構,太太減小了數(shù)據(jù)搬運的開銷。 從電路的諸多方面特性可以看出,其能夠很好地適應深度學習神經網絡的需求,通過Flash 編程的方法,將深度學習神經網絡的太量網絡參數(shù)存儲于Flash 陣列中,由乘累加電路完成太量輸入數(shù)據(jù)與太量網絡參數(shù)之間的乘累加運算,從而實現(xiàn)深度學習神經網絡的運算電路。

        猜你喜歡
        字線閾值電壓偏置
        學術期刊中破折號、一字線、半字線的用法分析
        基于40%正面偏置碰撞的某車型仿真及結構優(yōu)化
        基于雙向線性插值的車道輔助系統(tǒng)障礙避讓研究
        中國信息化(2022年5期)2022-06-13 11:12:49
        雜質縱向高斯分布UTBB-SOI MOSFET的虛擬陰極閾值電壓解析模型
        數(shù)值范圍用浪紋線
        山東冶金(2018年1期)2018-03-30 14:10:35
        數(shù)值范圍用浪紋線
        山東冶金(2018年3期)2018-03-28 01:01:59
        基于非均勻感知策略的MLC閃存系統(tǒng)①
        一級旋流偏置對雙旋流杯下游流場的影響
        65nm工藝下MOSFET閾值電壓提取方法研究
        數(shù)值范圍用浪紋線
        山東冶金(2014年1期)2014-04-08 11:11:48
        蜜桃高清视频在线看免费1| 国产精品女老熟女一区二区久久夜| 中国美女a级毛片| 成人综合网亚洲伊人| 亚洲成a人片在线观看导航| 成人av在线免费播放| 日本最新一区二区三区视频观看| 日韩精品久久久肉伦网站| 亚洲美女又黄又爽在线观看| 99国产精品丝袜久久久久| 国产午夜精品av一区二区三| 精品国产一区二区三区香| 全黄性性激高免费视频| 色欲aⅴ亚洲情无码av蜜桃| 在线亚洲AV不卡一区二区| 日本人妻高清免费v片| 性做久久久久久免费观看| 亚洲乱码av中文一区二区| 最新欧美一级视频| h视频在线免费观看视频| 97久久精品人妻人人搡人人玩| 亚洲人成人影院在线观看| 亚洲日韩精品AⅤ片无码富二代| 成人免费av高清在线| 中文字幕日本人妻久久久免费| 亚洲gv白嫩小受在线观看| 杨幂国产精品一区二区| 最近更新中文字幕一区二区 | 视频一区二区三区国产| 成人无码一区二区三区| 国精无码欧精品亚洲一区| 日本高清色惰www在线视频| 国产人妻久久精品二区三区老狼 | 亚洲精品久久久久久久蜜桃| 国产美女在线精品免费观看网址 | 99精品又硬又爽又粗少妇毛片 | 久久九九av久精品日产一区免费 | 亚洲国产日韩综一区二区在性色 | 开心激情视频亚洲老熟女| 97久久婷婷五月综合色d啪蜜芽| 亚洲国产成人久久一区www |