張 勁, 應 櫻, 宋 鵬, 陳子琪, 王紹安, 高明煜, 董哲康,
(1.國網(wǎng)浙江省電力有限公司電力科學研究院, 浙江 杭州 310014; 2.浙江大學 電氣工程學院, 浙江 杭州310027; 3.杭州電子科技大學 電子信息學院, 浙江 杭州 310018; 4.浙江省裝備電子研究重點實驗室, 浙江杭州 310018)
工業(yè)自動化的發(fā)展助推了世界各國對能源的需求。 在化石能源逐漸枯竭以及人類環(huán)保意識逐漸增強的背景下,如何高效利用可再生能源成為學者們研究的主要方向[1]。 太陽能作為一種可再生能源,具有易獲取、可持續(xù)和低污染的優(yōu)點,因此,受到人們的廣泛關注。 光伏發(fā)電是一種太陽能利用技術,學者們對光伏發(fā)電系統(tǒng)進行了大量研究。
目前, 光伏發(fā)電系統(tǒng)主要存在2 個問題:一是,大氣中懸浮的塵埃顆粒會造成光伏面板表面玻璃積灰,進而影響光伏面板對太陽輻射能的接收,降低了其光電轉(zhuǎn)換效率;二是,植物殘留物和動物排泄物可能遮蓋局部光伏面板,導致光伏面板表面接收到的太陽輻照強度不均勻,容易出現(xiàn)“熱島效應”,進而燒壞光伏面板。 因此,定期清掃光伏面板表面, 可以有效提高其光電轉(zhuǎn)換效率、延長其使用壽命[2],[3]。清掃光伏面板的方法包括人工清掃、工程車清掃和機器人清掃[4]。 其中,人工清掃的效果難以保證且效率低下;工程車清掃對路面環(huán)境等要求嚴苛; 機器人清掃具有高效,便捷和節(jié)省人力、物力的優(yōu)點。 因此,機器人清掃成為光伏面板日常運維的最佳選擇。
PID 控制方法因其原理簡單、 魯棒性較強和對模型依賴性低等優(yōu)點, 成為光伏面板清掃機器人控制系統(tǒng)中使用最廣泛的方法。 現(xiàn)有光伏面板清掃機器人的控制系統(tǒng), 主要通過對各模塊進行PID 參數(shù)的整定和優(yōu)化來實現(xiàn)。 然而,光伏面板清掃機器人控制系統(tǒng)具有復雜性、多變量、強耦合非線性的特點。 現(xiàn)有PID 控制方法在控制精度和動態(tài)性能上仍然存在一定的局限性[5],[6],尤其,現(xiàn)有PID 控制器因其物理結構和組成元件限制, 存在體積大、功耗高和控制效率低的問題,且PID 控制器在控制過程中, 存在主要參數(shù)無法自適應改變等問題。 2008 年,惠普實驗室科研人員發(fā)現(xiàn)的新型納米級電路元器件—憶阻器, 為構建光伏面板清掃機器人中參數(shù)自適應的微型智能PID 控制器提供了全新的思路[7],[8]。本文設計了一種新型的憶阻神經(jīng)網(wǎng)絡, 并將其應用于光伏面板清掃機器人的控制系統(tǒng)中, 構建了新一代微型智能PID 控制器。本文方案為減少光伏組件損壞、提高光伏組件效率和增加系統(tǒng)發(fā)電量提供了堅實的理論基礎和技術支持。
基于現(xiàn)代控制理論,光伏面板清掃機器人中的控制系統(tǒng)依賴于傳統(tǒng)PID 控制器,傳統(tǒng)PID 控制器基本結構框圖如圖1 所示[9]。 圖1 中:y(t),r(t)分別為控制對象的實際輸出值和既定目標值;e(t)為誤差信號,即為y(t)與r(t)的差值;u(t)為獲得的新的控制信號,當其作用于控制對象時,能夠使控制對象的輸出達到或者始終保持在設定的目 標 值;KP,KI,KD分 別 為 傳 統(tǒng)PID 控 制 器 的 比例、積分和微分系數(shù),KP,KI,KD均為常數(shù)。
圖1 傳統(tǒng)PID 控制器基本結構框圖Fig.1 System block diagram of traditional PID controller
離散型PID 控制器的輸出形式為
式中:u(k)為第k 次(k∈N)采樣時傳統(tǒng)PID 控制器的輸出值;e(k),e(k-1)分別為第k 次和第k-1次采樣時的誤差信號。
基于式(1),得到傳統(tǒng)PID 控制器增量式的輸出形式為
式中:Δu(k)為第k 次采樣時傳統(tǒng)PID 控制器輸出值相較第k-1 次的增量;e(k-2)為第k-2 次采樣時的誤差信號。
人工神經(jīng)網(wǎng)絡 (Artificial Neural Network,ANN) 是由眾多神經(jīng)元通過突觸連接而形成的智能信息處理系統(tǒng)[9]。 在神經(jīng)網(wǎng)絡PID 控制器中,人工神經(jīng)網(wǎng)絡起到?jīng)Q定PID 控制器超參數(shù)(KP,KI,KD)的作用。
圖2 神經(jīng)網(wǎng)絡PID 控制器框圖Fig.2 Block diagram of neural network based PID controller
神經(jīng)網(wǎng)絡PID 控制器框圖如圖2 所示。 圖2中,BPNN 為經(jīng)典的反向傳播神經(jīng)網(wǎng)絡(Back-Propagation Neural Network,BPNN), 網(wǎng)絡參數(shù)迭代更新的學習算法主要由2 個步驟組成, 即輸入信號的正向傳播和誤差信號的反向傳播。
神經(jīng)網(wǎng)絡PID 控制器主要是利用神經(jīng)網(wǎng)絡良好的學習能力和非線性處理能力,通過對樣本/數(shù)據(jù)集進行訓練,改變傳統(tǒng)PID 控制器中KP,KI,KD這3 個主要參數(shù), 實現(xiàn)對復雜系統(tǒng)的有效控制。
圖3 為BP 神經(jīng)網(wǎng)絡的基本網(wǎng)絡結構圖。
圖3 BP 神經(jīng)網(wǎng)絡的基本網(wǎng)絡結構圖Fig.3 Basic construction of BP neural network
由圖3 可知,BP 神經(jīng)網(wǎng)絡為3 層結構。 j,i,l分別為網(wǎng)絡結構中的輸入層、隱含層和輸出層;記Oj為神經(jīng)網(wǎng)絡的輸入樣本集,則Oj=[x1,x2,x3,…,xn],其中,輸入變量的個數(shù)n 由被控對象的復雜程度決定,xi為神經(jīng)網(wǎng)絡的輸入信號, 其中i∈[1,n]。
基于輸入樣本集Oj可得, 隱含層的輸入信號neti(k)和輸出信號Oi(k)的計算式分別為
式中:wij,θj分別為輸入層和隱含層神經(jīng)元之間的權值和偏置;h(x)為輸入層和隱含層之間的激活函數(shù)[8];Q 由隱含層神經(jīng)元的個數(shù)決定。
輸出層的輸入信號netl(k)和輸出信號Ol(k)的計算式分別為
式中:wli,θi分別為隱含層與輸出層神經(jīng)元之間的權值和偏置;g(x)為隱含層與輸出層之間的激活函數(shù)[10]。
基于文獻[8]可得,BP 神經(jīng)網(wǎng)絡的輸出層和隱含層的權值更新公式分別為
式中:η,α 分別為BP 神經(jīng)網(wǎng)絡的學習速率和動量項;δl,δi均為輔助變量[7];Δwli(k)為第k 次采樣時隱含層和輸出層神經(jīng)元之間的權值相較第k-1次采樣時的增量;Δwij(k)為第k 次采樣時輸入層和隱含層神經(jīng)元之間的權值相較第k-1 次采樣時的增量;Δwli(k-1)為第k-1 次采樣時隱含層和輸出層神經(jīng)元之間的權值相較第k-2 次采樣時的增量;Δwij(k-1)為第k-1 次采樣時輸入層和隱含層神經(jīng)元之間的權值相較第k-2 次采樣時的增量。
綜上可知,神經(jīng)網(wǎng)絡PID 控制器中各層權值的更替較為復雜。同時,現(xiàn)有的權值更新過程完全基于軟件實現(xiàn), 不能較好地應用于光伏面板清掃機器人的節(jié)點控制中。因此,本文將憶阻器引入到神經(jīng)網(wǎng)絡PID 控制器中,將憶阻器作為神經(jīng)網(wǎng)絡中的電子突觸, 這樣不僅能有效地簡化權值的更新過程,又有利于實現(xiàn)神經(jīng)網(wǎng)絡的硬件化,為優(yōu)化控制光伏面板清掃機器人的節(jié)點提供了良好的理論基礎和實驗支持。
憶阻器的物理模型是由2 層二氧化鈦(TiO2)薄膜和2 個獨立的鉑(Pt)片電極構成。 2 層TiO2薄膜夾在2 個Pt 片電極之間[7],其中,一層TiO2薄膜中未摻雜氧空位(Oxygen Vacancy),表現(xiàn)出高阻抗特性,稱為非摻雜層;另一層TiO2薄膜中缺失了部分氧原子,表現(xiàn)出半導體特性,稱為摻雜層(TiO2-x層)。 憶阻器的總阻值為2 層TiO2薄膜阻值之和。存在外加偏壓時,摻雜層中的氧空位會在電場的作用下發(fā)生離子遷移的現(xiàn)象, 引起摻雜層和非摻雜層之間的邊界移動, 從而改變憶阻器的有效阻值[8]。
憶阻器的物理模型如圖4 所示。 圖中,D 為2層二氧化鈦薄膜的總厚度 (約為10 nm);w 為摻雜層的厚度。
圖4 憶阻器的物理模型Fig.4 The HP memristor physical model
基于文獻[8],憶阻器的阻值M(t)的計算式為
式中:x(t)為憶阻器內(nèi)部的狀態(tài)變量;RL,RH分別為憶阻器的極小憶阻值和極大憶阻值。
x(t)的計算式為
x(t)對應的動態(tài)方程計算式為
式中:k 為常數(shù);ζ 為憶阻器的極性參數(shù),ζ=±1;ν(t),i(t)分別為加載在憶阻器兩端的電壓和流經(jīng)憶阻器的電流;νth為憶阻器的電壓閾值。
憶阻器獨特的納米級尺寸、 非易失性和低功耗特性比較適合構建新一代電子突觸, 進而實現(xiàn)基于憶阻器的神經(jīng)網(wǎng)絡。 憶阻器與神經(jīng)網(wǎng)絡PID控制器結合可以模擬BP 神經(jīng)網(wǎng)絡中的突觸電路。 基于此, 本文提出了一種新型的憶阻突觸電路,憶阻突觸電路結構圖如圖5 所示。
圖5 憶阻突觸電路結構圖Fig.5 The proposed memristor-based synaptic circuit
由圖5 可知, 憶阻突觸電路由2 個支路組成,分別用虛線框(右邊)和實線框(左邊)標記。虛線框中的電路是一個經(jīng)典的差分放大器, 主要用于電壓和電流的轉(zhuǎn)換。 其中:V+為正向電壓;V-為負向電壓;Vb為偏執(zhí)電壓;Vss為源集電壓。實線框中的電路由2 個CMOS 晶體管 (橢圓虛線框標記)和2 個憶阻器(反向串聯(lián))混合而成,主要用于實現(xiàn)權值處理和權值規(guī)劃操作。 其中:T1~T4為晶體管;g 為控制電壓;m1,m2為憶阻器;Vin為輸入電壓;Vout為輸出電壓;Gnd 為接地信號。
憶阻突觸電路中, 突觸權值常用憶阻器的阻值或阻值關系表示,并且存儲在憶阻器內(nèi)部[10]。突觸權值處理操作是將突觸權值和憶阻突觸電路中憶阻器的阻值形成一一對應(線性)關系的操作。本文設定2 個相同的憶阻器, 二者的阻值分別為M1,M2。控制電壓g 用于控制4 個相互連通的晶體管T1~T4(T1,T2為PMOS 晶體管;T3,T4為NMOS晶體管)的工作狀態(tài)。當憶阻突觸電路中的4 個晶體管同時工作時,起到“開關”的作用。當憶阻突觸電路的輸入電壓為Vin時,對應的輸出電壓Vout定義為節(jié)點A 處電壓VA和節(jié)點B 處電壓VB的差,即Vout=VA-VB。 Vout的工作狀態(tài)須要根據(jù)控制電壓g 的工作狀態(tài)進行分類討論。
①當控制電壓g 處于高電平(即g>Vth)時,晶體管T2和T3處于導通狀態(tài),晶體管T1和T4處于截止狀態(tài)。 此時,電流從節(jié)點B 流向節(jié)點A,Vout的計算式為
②當控制電壓g 處于低電平(即g=0)時,晶體管T2和T3處于截止狀態(tài),晶體管T1和T4處于導通狀態(tài)。 此時, 電流從節(jié)點A 流向節(jié)點B,Vout的計算式為
基于式(12),(13)得到憶阻突觸電路的輸入電壓Vin和輸出電壓Vout之間的關系為
式中:ψ 為突觸權值。
基于式(12),(13),(14)得到ψ 的計算式為
需要注意的是,式(14),(15)共同定義了憶阻突觸電路的權值處理操作。同時,為了保證突觸權值處理操作的準確性, 需要保持2 個憶阻器的阻值不變。 此時,利用憶阻器的閾值特性,即將輸入電壓Vin控制在[0,νth]范圍內(nèi)。 由于加載在憶阻器兩端的電壓始終小于其閾值電壓νth,因此,2 個憶阻器的阻值不會發(fā)生改變。
不同于突觸權值處理操作, 權值規(guī)劃操作中須要改變憶阻突觸電路中憶阻器的阻值。因此,設定權值規(guī)劃操作中,外部激勵電壓為Vpro且Vpro>2νth。 基于串聯(lián)電路的基本特性,當外部激勵電壓Vpro作用于憶阻突觸電路時, 其等效憶阻器的阻值M 為2 個憶阻器的阻值之和,即M=M1+M2。 并且2 個反向串聯(lián)的憶阻器的阻值將朝著相反的方向變化, 即M1增加、M2減少或者M1減少、M2增加。 M1,M2變化的定量分析如下。
基于式(9)~(11),得到計算憶阻器阻值M 的變式為
式中:M0為憶阻器的初始值;q(t)為流經(jīng)憶阻器的電荷量;ΔR 為憶阻器的極大憶阻值和極小憶阻值的差值,即ΔR=RH-RL為常數(shù)。
基于式(16),得到2 個憶阻器的阻值表達式為
或者
式 中:M10,M20分 別 為 憶 阻 器m1和m2的 初 始 阻值;q1(t),q2(t)分別為流經(jīng)m1,m2的電荷量。 特別地, 由于反向串聯(lián)電路中流經(jīng)m1,m2的電荷量相同,即q1(t)=q2(t),則憶阻突觸電路的等效憶阻值M 的計算式為
由式(19)可知,2 個憶阻器的反向串聯(lián)電路在外部激勵作用下滿足總阻值不變, 且等于2 個憶阻器的初始阻值之和。因此,當輸入激勵為固定幅值的電壓時,基于歐姆定律,整個電路的電流I保持不變。
針對提出的憶阻突觸電路, 在權值規(guī)劃階段輸入一個固定幅值的恒定電壓Vpro(Vpro>2νth),則等效電流I=Vpro/(M10+M20) 為固定值且滿足q=It。根據(jù)控制電壓g 的狀態(tài)進行分類討論。
①當控制電壓g 處于高電平時,晶體管T2和晶體管T3處于導通狀態(tài), 晶體管T1和晶體管T4則處于截止狀態(tài)。此時電流從節(jié)點B 流向節(jié)點A,基于式(14),得到Ψ(t)的計算式為
式中:α1,β1為輔助變量,且均為固定不變的常數(shù)。α1,β1的計算式分別為
②當控制電壓g 處于低電平時,晶體管T2和晶體管T3處于截止狀態(tài), 晶體管T1和晶體管T4則處于導通狀態(tài),電流從節(jié)點A 流向節(jié)點B。 此時,Ψ(t)的計算式為
式中:α2,β2為輔助變量,且均為固定不變的常數(shù)。
α2,β2的計算式分別為
由式(20)和(23)可知,無論控制電壓g 處于高電平或者低電平狀態(tài), 權值ψ 與時間t 之間均呈現(xiàn)良好的線性關系,即權值隨時間t 線性改變。綜上所述, 憶阻突觸電路的權值規(guī)劃操作具有良好的線性特性。
本文基于傳統(tǒng)神經(jīng)網(wǎng)絡PID 控制器方案,設計了一種全新的憶阻神經(jīng)網(wǎng)絡PID 控制器。 該控制器以憶阻神經(jīng)網(wǎng)絡替代傳統(tǒng)神經(jīng)網(wǎng)絡PID 控制器中的BP 神經(jīng)網(wǎng)絡,其中,憶阻神經(jīng)網(wǎng)絡最基本組成單元為憶阻神經(jīng)元電路, 憶阻神經(jīng)元電路結構圖如圖6 所示。圖中:W1,W2為支路上的突觸權值;C1為神經(jīng)元電路的輸出;Rload為有源負載;Vin1,Vin2為電壓信號;Vdd為電源端電壓。
由圖6 可知, 來自其他神經(jīng)元的輸入信息須要轉(zhuǎn)變?yōu)橄鄳碾妷盒盘朧in1和Vin2,通過一系列的加權操作可以得到相應的輸出信號。 須要說明的是,2 個支路共享一個有源負載Rload。 根據(jù)經(jīng)典的基爾霍夫電流定律可得到, 各支路電流的總和經(jīng)過電流反射鏡的輸出。
圖6 憶阻神經(jīng)元電路結構圖Fig.6 Electric circuit of memristive neuron
本文采用計算機軟件仿真的方式, 測試光伏面板清掃機器人中憶阻神經(jīng)網(wǎng)絡PID 控制器的性能。 本文中所有實驗基于工作站(戴爾T3620)來完成,其主要設備參數(shù)如下:酷睿i77700 處理器、3.4 GHz CPU 頻 率、16 GB DDR4 內(nèi) 存 和Windows 10 操作系統(tǒng)。 同時,本文通過PSpice 軟件構建憶阻神經(jīng)網(wǎng)絡電路(包括憶阻器模型、憶阻突觸電路、神經(jīng)元電路和神經(jīng)網(wǎng)絡電路),該電路主要負責實現(xiàn)神經(jīng)網(wǎng)絡的前向計算。 神經(jīng)網(wǎng)絡訓練過程中的權值更新是通過工作站中的計算模塊來完成。實驗過程中涉及到的所有參數(shù)設置如下:憶阻器的極小憶阻值RL=0.1 kΩ,憶阻器的極大憶阻值RH=16 kΩ, 二氧化鈦薄膜總厚度D=10 nm,憶阻器初始阻值[M10,M20]=[110,15 900],閾值電壓νth=2 V,高電平控制電壓g=5 V,學習率α=0.1,終止誤差Error=10-5。
實驗仿真結果分為3 個部分, 即憶阻器基本電路特性的仿真結果、 憶阻突觸電路的仿真結果和憶阻神經(jīng)網(wǎng)絡PID 控制器的仿真結果。
憶阻器的基本電路特性仿真結果如圖7 所示。
由圖7 可知, 當外部激勵電壓V=1.5sin(2 πt)時,外部激勵電壓與流經(jīng)憶阻器的電流之間呈現(xiàn)出典型的“斜8”磁滯回線,這表明憶阻器是一種非線性電路元器件。 憶阻器兩端的電壓大于0時,憶阻器的狀態(tài)變量x 呈現(xiàn)增大的趨勢;反之,當電壓小于0 時, 憶阻器的狀態(tài)變量x 呈現(xiàn)減小的趨勢。在電壓的作用下,憶阻器阻值可以在高阻值與低阻值之間進行切換(極限阻值范圍內(nèi))。
圖7 憶阻器的基本電路特性仿真結果Fig.7 The circuit characteristics of memristor
憶阻突觸電路進行權值處理和權值規(guī)劃操作的仿真結果如圖8 所示。 圖8 中的空白區(qū)域為憶阻突觸電路進行權值處理操作, 陰影區(qū)域為憶阻突觸電路進行權值規(guī)劃操作。
圖8 憶阻突觸電路進行權值處理和權值規(guī)劃操作的仿真結果Fig.8 The simulation results of the memristor-based synaptic circuit
由圖8(a)可知,當憶阻突觸電路在進行權值規(guī)劃操作時,輸入電壓Vin滿足Vin=Vpro>2 νth。由圖8 (b)可知,憶阻突觸電路在權值處理階段,輸入電壓Vin小于憶阻器的閾值電壓νth,2 個憶阻器的阻值以及憶阻突觸電路的等效阻值固定不變;當憶阻突觸電路在權值規(guī)劃階段, 外部輸入激勵電壓大于憶阻器的閾值電壓νth,2 個憶阻器的阻值將以相反的方向發(fā)生改變, 并且憶阻器m1增加(減少)的阻值等于憶阻器m2減少(增加)的阻值,即憶阻突觸電路的等效阻值固定不變。 由圖8(c)可知, 由于各階段憶阻突觸電路的外部激勵電壓幅值固定,且憶阻突觸電路的等效阻值不變,基于歐姆定律得到各階段憶阻突觸的電流保持不變。當控制電壓g 為高電平時, 憶阻突觸電路的電流為方向從節(jié)點B 到節(jié)點A 的負電流;當控制電壓g 為低電平時, 憶阻突觸電路的電流為方向從節(jié)點A 到節(jié)點B 的正電流。 由圖8(d)可知,當憶阻突觸電路在權值處理階段, 憶阻突觸電路能夠?qū)崿F(xiàn)“負”、“零”和“正”的突觸權值;當憶阻突觸電路在權值規(guī)劃階段, 突觸權值隨著時間t 呈線性變化, 并且可計算出對應的斜率Slope=kΔRI/(M10+M20)=1.840 2×104。
當輸入信號r(t)為階躍信號時,為了更好地體現(xiàn)憶阻神經(jīng)網(wǎng)絡PID 控制算法的性能優(yōu)勢,本文引入傳統(tǒng)神經(jīng)網(wǎng)絡PID 控制器(方法1)以及傳統(tǒng)PID 控制器(方法2)進行對比分析[11],[12]。 憶阻神經(jīng)網(wǎng)絡PID 控制器仿真結果如圖9 所示。
圖9 憶阻神經(jīng)網(wǎng)絡PID 控制器仿真結果Fig.9 The simulation results of the memristive neural network PID controller
憶阻神經(jīng)網(wǎng)絡PID 控制器中3 個主要參數(shù)KP、KI,KD的訓練樣本數(shù)據(jù)集源于文獻[9]。 同時,憶阻神經(jīng)網(wǎng)絡PID 控制器可表示為
式中:y(t),y(t-1)分別為憶阻神經(jīng)網(wǎng)絡PID 控制器在t 時刻和t-1 時刻的輸出;u(t-1)為t-1 時刻控制對象的輸入信號;a(t)為關于時間t 的時變系數(shù)。
a(t)的計算式為
由圖9 可知,基于本文方案得到的輸出結果在t=0.5 s 時趨于穩(wěn)定,從而取得了較為理想的調(diào)控效果, 同時也驗證了將該方案應用在光伏面板清掃機器人中的可行性。
光伏面板清掃機器人內(nèi)部的PID 控制器會受到物理結構和組成元件的限制, 導致清掃機器人存在的體積大、功耗高、控制效率低,以及在控制過程中主要參數(shù)無法自適應改變等問題, 本文提出了一種智能的自適應PID 控制器,模擬結果如下。
①本文基于憶阻器設計了一種新型的突觸電路。 該突觸電路可以實現(xiàn)正、 零和負的突觸權值, 且在權值處理和權值規(guī)劃2 個階段具備良好的線性特征。
②本文基于憶阻突觸電路, 設計對應的神經(jīng)元以及神經(jīng)網(wǎng)絡電路, 這樣有利于神經(jīng)網(wǎng)絡的硬件化實現(xiàn)。
③將憶阻神經(jīng)網(wǎng)絡應用于光伏面板清掃機器人內(nèi)部的PID 控制器中,不僅有利于提高其控制效率, 同時能夠?qū)崿F(xiàn)KP,KI,KD系數(shù)的自適應改變。