李 鵬,李 丹,李喜旺,高 宇
1(中國科學院大學,北京 100049)
2(中國科學院 沈陽計算技術研究所,沈陽 110168)
3(國家電網(wǎng)東北分部,沈陽 110180)
4(美國加州州立大學富勒頓分校,加利福尼亞州 92834)
隨著信息化的不斷發(fā)展,很多行業(yè)都從信息技術中受益.電力行業(yè)調(diào)度系統(tǒng)也從傳統(tǒng)的人工監(jiān)測、人工控制慢慢轉變?yōu)槿谧詣踊O(jiān)測與自動化控制為一體的自動化系統(tǒng).電力調(diào)度自動化系統(tǒng)主要擔負著對所屬各電廠數(shù)據(jù)采集、存儲以及電廠的啟停調(diào)度.其安全性與穩(wěn)定性直接影響著電力調(diào)度網(wǎng)的運行質量.傳統(tǒng)的電力調(diào)度系統(tǒng)的安全性與穩(wěn)定性監(jiān)測主要依靠技術工程師對設備進行定期檢修和事后維修[1,2].定期檢修的時機完全依靠經(jīng)驗進行分析,而電力調(diào)度自動化系統(tǒng)功能與結構都比較復雜,存在諸多不確定因素,很難依靠主觀經(jīng)驗確定合適的檢修時機,較大的檢修周期會增加系統(tǒng)出故障的可能性,較小的檢修周期又會增加檢修成本.當系統(tǒng)出現(xiàn)故障后再進行維修的事后維修策略則更加無法保證系統(tǒng)的安全穩(wěn)定運行.因此在系統(tǒng)出現(xiàn)故障之前通過對設備各運行指標進行監(jiān)測,然后建立設備狀態(tài)評估模型進行有效的評估顯得格外重要.
許麗佳等[3,4]將隱馬爾可夫模型應用于電子設備的狀態(tài)監(jiān)測和健康評估,但是受隱馬爾可夫模型假設的限制,導致模型評估結果的準確性不高.神經(jīng)網(wǎng)絡具有自學習、自適應以及強大的非線性化逼近能力,張璇[5]利用BP神經(jīng)網(wǎng)絡模型進行電力通信網(wǎng)絡設備的狀態(tài)評估,但是傳統(tǒng)的BP神經(jīng)網(wǎng)絡為”黑盒模型”,可解釋能力較弱.倪麗等[6]利用模糊綜合評判理論進行電力變壓器的狀態(tài)評估,但是因為模糊評判理論沒有學習能力,并且建立模糊關系矩陣比較困難,因此評估結果的準確率不高.文獻[7]將模糊理論與支持向量機結合進行設備狀態(tài)的評估,但是支持向量機學習算法對于所用模糊參數(shù)的調(diào)整能力較弱,無法充分發(fā)揮模糊理論的作用.
電力調(diào)度自動化設備狀態(tài)受諸多評價指標的影響,同時各評價指標之間也存在著復雜的聯(lián)系,針對此類非線性評估問題,神經(jīng)網(wǎng)絡模型強大的非線性擬合能力能夠很好的予以解決,然而評價指標與設備狀態(tài)之間的關系并不是確定的,而是模糊的,難以精確表達的,考慮到模糊模型在模糊表達知識上的優(yōu)越性,本文將模糊理論與神經(jīng)網(wǎng)絡進行結合應用到設備狀態(tài)評估當中,模型的非線性擬合能力以及模糊表達能力的都得到較大提升,提高了評估模型的準確率.
模糊神經(jīng)網(wǎng)絡將模糊理論與神經(jīng)網(wǎng)絡進行結合[8,9],將模糊概念和模糊推理引入神經(jīng)網(wǎng)絡,一方面提高了神經(jīng)網(wǎng)絡的可解釋性和靈活性,另一方面利用神經(jīng)網(wǎng)絡的學習算法設計和調(diào)整模糊系統(tǒng)的相關參數(shù)[10],實現(xiàn)了模糊系統(tǒng)的自適應功能.
如圖1所示,傳統(tǒng)模糊神經(jīng)網(wǎng)絡一般分為五層[11].第一層為輸入層,節(jié)點個數(shù)為輸入變量的個數(shù);第二層為模糊化層,將輸入變量進行模糊化;第三層為模糊規(guī)則層,節(jié)點個數(shù)為模糊規(guī)則數(shù);第四層為反模糊化層,用于將模糊量進行去模糊化;第五層為輸出層.
圖1 傳統(tǒng)模糊神經(jīng)網(wǎng)絡結構
本文在對設備進行狀態(tài)評估時,將第四層直接作為輸出,輸出層共四個神經(jīng)元節(jié)點,每個神經(jīng)元節(jié)點代表設備的一種狀態(tài),神經(jīng)元節(jié)點的數(shù)值代表設備對這種狀態(tài)的隸屬度.這樣具有四個輸出層節(jié)點的四層模糊神經(jīng)網(wǎng)絡如圖2所示,詳細介紹如下:
第一層為輸入層,xi,i=1,2,,n,代表n個輸入變量,本文中指影響設備運行狀態(tài)的性能指標,如CPU溫度、內(nèi)存占用率、網(wǎng)絡丟包率等,第一層的作用是直接將輸入傳遞到第二層.
第二層為模糊化層: 用于計算輸入變量對不同模糊集的隸屬度.該層神經(jīng)元的作用是將第一層的輸入變量xi劃分為mi個模糊度,因此共m個 神經(jīng)元,m=m1+m2+ +mn.該層神經(jīng)元與第一層神經(jīng)元之間的連接權值都為1,隸屬函數(shù)作為每個神經(jīng)元的激活函數(shù).考慮到高斯型隸屬函數(shù)在處理非二值輸入和空間映射方面具有較大優(yōu)勢[12],因此選擇式(1)所示的高斯型隸屬函數(shù)作為模型的隸屬度函數(shù):
圖2 四層模糊神經(jīng)網(wǎng)絡結構
其中,μij表示第i個輸入變量隸屬與第j個模糊集的隸屬度 函數(shù);cij為隸屬函數(shù)μij的中心值;σij為隸屬函數(shù)μij的寬度值.
第三層為模糊規(guī)則層,也稱為“與”層,該層神經(jīng)元的個數(shù)表示模糊規(guī)則數(shù).每個神經(jīng)元與上一層的mi個神經(jīng)元中的一個節(jié)點相連,因此共R=m1+m2+ +mn個神經(jīng)元,每個連接的權值為1.每個神經(jīng)元內(nèi)部進行“與”操作,即“AND”操作,也就是求每個輸入變量的隸屬度的最小值,通過式(2)進行計算:
第四層為反模糊化層,也稱為“或”層,該層神經(jīng)元的個數(shù)表示模糊集合的個數(shù),本文中表示設備可能的狀態(tài).該層神經(jīng)元與上一層神經(jīng)元之間為全連接,權值ωjk為需要調(diào)整的參數(shù),神經(jīng)元的輸出值表示設備對這個狀態(tài)的隸屬度.
采用均方誤差函數(shù)作為該模糊神經(jīng)網(wǎng)絡的損失函數(shù):
由式(5)-(7)可以發(fā)現(xiàn)模型需要進行調(diào)整的參數(shù)有三種:cij,σij和ωjk,這三種參數(shù)可以通過如下方法進行迭代更新:
其中,η表示學習率,t表示迭代的次數(shù).
針對電力自動化設備健康評估,設備不同狀態(tài)下不一定會出現(xiàn)某些顯而易見的現(xiàn)象,實際情況更多的是設備的某些參數(shù)偏高或者偏低,而在設備健康評估時,一般依靠經(jīng)驗來處理這些“偏高”或者“偏低”的模糊概念.為解決此類具有模糊性以及參數(shù)難以定量描述的問題,本文引入模糊理論進行處理.模糊神經(jīng)網(wǎng)絡能夠將輸入進行模糊化處理然后進行模糊推理,由于設備健康評估的影響因素如溫度、占用率等具有很強的模糊性難以定量描述,采用模糊神經(jīng)網(wǎng)絡將輸入通過隸屬函數(shù)進行處理,從而可以進行定量描述,很好的適應了設備健康評估問題.
在復雜系統(tǒng)中,每個對象對于集合的隸屬關系并不是明確的,而是相對模糊的[14].電力調(diào)度自動化系統(tǒng)就是一個相對復雜的系統(tǒng),在這個系統(tǒng)中有數(shù)量龐大的IT設備,設備的評價指標有很多,如溫度、網(wǎng)口狀態(tài)、網(wǎng)絡流量、內(nèi)存使用率、硬盤使用率、CPU負荷率等[15],這些指標量更適合用模糊理論進行分析,用模糊集合描述評價指標,用數(shù)據(jù)指標的隸屬度描述當前運行情況.神經(jīng)網(wǎng)絡具有較強的自學習功能,可根據(jù)歷史數(shù)據(jù)學習結果來調(diào)整系統(tǒng)運行參數(shù),針對個體設備提供更準確的、更具個性化的健康評價.本文采用的將模糊概念和神經(jīng)網(wǎng)絡結合的模糊神經(jīng)網(wǎng)絡模型可以極大提升電力調(diào)度自動化設備健康評估的效果.
將模糊神經(jīng)網(wǎng)絡模型應用到電力調(diào)度自動化設備健康評估的具體流程如圖3所示,具體步驟如下:
(1)整理存儲的設備6個月內(nèi)的運行信息,包括:CPU溫度、硬盤溫度、板卡溫度、網(wǎng)口狀態(tài)、網(wǎng)絡流量、網(wǎng)絡延遲、內(nèi)存使用率、硬盤使用率、CPU使用率、網(wǎng)絡丟包率、設備運行時間11個指標.
(2)對設備的運行狀態(tài)進行劃分等級.根據(jù)專業(yè)人員的分析和歷史經(jīng)驗的總結,將設備運行狀態(tài)分為四個等級,如表1所示.
(3)通過計算設備各運行指標之間的皮爾遜相關系數(shù),刪除部分冗余特征.皮爾遜相關系數(shù)是衡量兩個隨機變量之間線性相關程度的指標,描述的是一種非確定性相關系數(shù)[16],計算公式如式(8)所示:
其中,Cov(X,Y)表示隨機變量X與Y的協(xié)方差矩陣,μX,μY分別表示隨機變量X與Y的期望,σX,σY分別表示隨機變量X與Y的方差.相關系數(shù)r的取值范圍為[-1,1],絕對值越大說明兩個隨機變量的相關程度越高,r大于0表示正相關,r小于0表示負相關,r等于0表示不相關.通過利用皮爾遜相關系數(shù)篩選最終用于訓練模型的特征包括: CPU溫度、硬盤溫度、板卡溫度、內(nèi)存使用率、CPU使用率、網(wǎng)絡丟包率、設備運行時間7個指標.
圖3 電力調(diào)度自動化設備健康評估流程
表1 設備狀態(tài)分級
(4)因為各指標的值域不同,因此需要對各指標進行歸一化處理,歸一化計算公式如式(9)所示:
其中,Xmax表 示屬性X的最大值,Xmin表示屬性X的最小值.各特征經(jīng)過歸一化處理后,數(shù)值范圍都變換到[0,1]之間,這不僅可以消除量綱的差異還可以加速模型的收斂速度[17].
(5)初始化需要訓練的模型參數(shù),主要包括三類參數(shù):cij,σij和ωjk.其中cij表 示隸屬函數(shù)的中心值,σij為隸屬函數(shù)的寬度值,ωjk為模糊規(guī)則層與反模糊層之間的連接權重.
(6)更新模型參數(shù)直到滿足模型訓練的結束條件.傳統(tǒng)的模型終止條件有兩種,一種是當模型的輸出值與真實值的誤差小于設置的閾值時終止模型訓練,另一種是當?shù)螖?shù)到達設置的次數(shù)時終止訓練.本文在此基礎上增加模型訓練的早停技巧,即當模型在測試集上的誤差增大時,提前停止訓練模型,這樣可以有效的避免模型的過擬合問題.
(7)保存模型.當模型訓練完成之后需要將模型保存到文件中,以便之后的模型使用.采用python語言的pickle模塊將模型序列化存儲到本地文件中,當使用模型時,對序列化后的文件進行反序列化處理,即可恢復原始模型進行使用.
為了體現(xiàn)本文所用方法在電力自動化機房設備健康評估方面的有效性,對傳統(tǒng)神經(jīng)網(wǎng)絡的模型效果和本文所用模型效果進行了對比,通過實驗結果顯示,本文所采用模型的效果優(yōu)于傳統(tǒng)神經(jīng)網(wǎng)絡模型的效果.
利用6個月內(nèi)共計17 280個設備運行數(shù)據(jù)進行模型的搭建,將17 280個數(shù)據(jù)劃分為訓練集、驗證集和測試集,如表2所示.每一條數(shù)據(jù)包含4個設備運行信息和3個設備硬件信息,如表3所示.
表2 數(shù)據(jù)集劃分
利用上述處理好的實驗數(shù)據(jù)進行模型訓練,模型的訓練集均方根誤差和測試集均方根誤差如圖4所示,縱坐標表示均方根誤差RMSE,橫坐標表示迭代次數(shù),可以看出模型的訓練誤差隨著迭代次數(shù)的增加整體趨勢是不斷減小的,但是測試誤差先是不斷減小然后又有上升趨勢,其原因就是模型發(fā)生了過擬合,因此需要提前終止模型訓練,根據(jù)結果分析,選取迭代75輪時的模型作為最終的模型.
表3 設備監(jiān)測特征
圖4 訓練誤差與測試誤差
傳統(tǒng)的三層BP神經(jīng)網(wǎng)絡,激活函數(shù)為Sigmoid函數(shù),此類BP神經(jīng)網(wǎng)絡模型無法有效處理模糊輸入信息同時無法利用已有的專家知識.本文所采用的模糊神經(jīng)網(wǎng)絡模型將神經(jīng)網(wǎng)絡與模糊理論有機的結合起來,不僅可以處理模糊信息同時具有較強的學習能力與自適應能力,通過圖5的結果對比可以看出本文所用的模糊神經(jīng)網(wǎng)絡模型效果要優(yōu)于傳統(tǒng)的三層BP神經(jīng)網(wǎng)絡模型,說明模糊神經(jīng)網(wǎng)絡更加適用于電力自動化機房設備的健康評估.
本文首先介紹了模糊理論與神經(jīng)網(wǎng)絡的相關概念,接著分析了將二者進行結合的模糊神經(jīng)網(wǎng)絡的原理,然后將模糊神經(jīng)網(wǎng)絡應用到電力調(diào)度自動化系統(tǒng)設備健康評估中.具體操作包括: 數(shù)據(jù)的收集、特征的選取以及模型的搭建,并且比較了本文所建立的四層模糊神經(jīng)網(wǎng)絡模型和傳統(tǒng)三層BP神經(jīng)網(wǎng)絡模型的效果,實驗結果表明,本文所建立的模型極大的提升了設備健康評估的效果,針對IT設備可以給出更加精確的評估,對于電力自動化機房的正常運行具有重要意義.雖然本文所建立的模型效果優(yōu)于傳統(tǒng)的三層BP神經(jīng)網(wǎng)絡模型,但是還有較大的提升空間,比如選取更加有效的反映設備狀態(tài)的特征,選取更加合適的算法學習率和模型的初始參數(shù),這些問題都可以進一步提升模型對設備狀態(tài)的評估效果,這將是下一步需要進行完善的.
圖5 傳統(tǒng)神經(jīng)網(wǎng)絡與模糊神經(jīng)網(wǎng)絡結果對比