裴少通,劉云鵬,陳同凡,武建華,梁利輝
(1.華北電力大學電氣與電子工程學院,河北保定071003;2.國家電網(wǎng)河北省電力有限公司檢修分公司,石家莊050000)
線路絕緣子作為高壓輸電線系統(tǒng)中至關(guān)重要的組成部分,承擔著連接導體和電氣絕緣的功能,絕緣子大多分布在野外,受到外界環(huán)境變化的一系列影響,有可能發(fā)生閃絡(luò)、掉串等故障,為了保障電力系統(tǒng)安全可靠運行,需要安排人員定期進行絕緣子巡檢工作,我國目前主流的巡檢方法是通過駕駛直升機或遙控無人機,沿輸電線路巡檢,利用紅外熱像儀遠距離進行電力設(shè)備的故障檢測,采集海量視頻和圖像,對所獲取的絕緣子紅外圖譜進行分類評估,可以大大提高電力巡檢效率。
為了快速準確的診斷出劣化絕緣子,不少文獻提出了將數(shù)據(jù)挖掘的方法應用到故障診斷的領(lǐng)域:BP神經(jīng)網(wǎng)絡(luò)[1],灰色預測[2],模糊計算,遺傳算法[3],Petri網(wǎng)絡(luò)及決策樹[4],支持向量機作為一種傳統(tǒng)的機器學習分類方法,已在人臉識別、故障診斷、圖像識別等領(lǐng)域呈現(xiàn)良好的應用前景,越來越多引起人們的關(guān)注。
支持向量機在電力系統(tǒng)的故障診斷領(lǐng)域同樣應用廣泛,針對支持向量機的參數(shù)優(yōu)化問題,文獻[5-6]采取基于交叉驗證的網(wǎng)格搜索法來確定支持向量機的最優(yōu)參數(shù),文獻[7]采取布谷鳥搜索算法來確定支持向量機的最優(yōu)參數(shù),文獻[8]采取免疫優(yōu)化算法針對支持向量機的參數(shù)進行了有效的優(yōu)化,文獻[9]采取粒子群算法優(yōu)化支持向量機的參數(shù),文獻[10]利用遺傳算法對SVM的參數(shù)進行尋優(yōu)。而貝葉斯優(yōu)化算法在電氣設(shè)備故障診斷這一領(lǐng)域應用較少,文獻[11]以故障樹與鍵合圖為基礎(chǔ)搭建貝葉斯網(wǎng)絡(luò)模型,實現(xiàn)了異常行為元件的準確定位,文獻[12]基于貝葉斯網(wǎng)絡(luò)實現(xiàn)了分布式輸電網(wǎng)的有效故障診斷及報警,但目前針對絕緣子故障診斷中的貝葉斯優(yōu)化算法與支持向量機結(jié)合的應用尚屬空白。
本文將支持向量機算法與劣化絕緣子紅外圖譜的分類識別相結(jié)合,實現(xiàn)劣化絕緣子紅外圖譜的算法評估診斷。具體通過提取絕緣子紅外圖譜中的方向梯度直方圖(Histogram of Oriented Gradient, HOG)特征,利用主成分分析法(Principal Component Analysis,PCA)對所得特征進行降維處理,訓練得到支持向量機分類器,利用貝葉斯優(yōu)化算法(Bayesian Optimization Algorithm,BOA)對支持向量機的超參數(shù)進行優(yōu)化,實驗結(jié)果表明:與傳統(tǒng)的優(yōu)化算法隨機搜索算法(randomsearch)和網(wǎng)格搜索算法(grid-search)相比,本文所提出的方法在樣本集中具有較高的診斷準確率和診斷效率。
絕緣子的紅外檢測是在其工作狀態(tài)下通過紅外測溫儀檢測絕緣子獲取絕緣子的溫度狀態(tài)。根據(jù)絕緣子絕緣強度大小和絕緣子表面污穢度大小,絕緣子其主要導致發(fā)熱原因的類型主要包括了三個方面:絕緣子沿面流過的泄漏電流致使發(fā)熱;絕緣子其內(nèi)部介質(zhì)損耗會致使發(fā)熱;劣化絕緣子內(nèi)部產(chǎn)生貫穿性泄漏電流致使發(fā)熱[13]。
通過紅外成像儀得到的熱分布圖像可以一定程度上反映被測物體溫度大小,紅外圖像的亮暗同時也表示著被測物體溫度的高低,依根據(jù)不同的熱特性[14],可以實現(xiàn)對絕緣子故障的紅外檢測,從而判斷絕緣子是否存在缺陷問題[15-16]。
為了獲得瓷質(zhì)絕緣子的紅外圖譜,本文進行了如下的實驗:選用三傘瓷質(zhì)絕緣子XWP4-160為試驗樣品,本文選用的紅外成像儀型號為Fluke Ti55TF,具有測量精度靈敏,感知溫度差能力強的優(yōu)勢。以110 kV電壓等級下實驗接線為例,本文所用的實驗器材、實驗接線及實驗平臺搭建簡圖如圖1所示。通過對實驗對象施加一定時間的加壓,待被測對象發(fā)熱穩(wěn)定后,利用紅外熱像儀對其進行多角度紅外成像拍照、存儲。
圖1 劣化絕緣子中紅外故障檢測示意圖Fig.1 Schematic diagram of infrared fault detection in deteriorated insulators
在紅外檢測階段,獲得了718張絕緣子串紅外圖像。經(jīng)過紅外圖片截取后,得到474張劣化單片絕緣子圖片(負樣本)和1 236個正常單片絕緣子圖片(正樣本)作為待處理圖像。由于正負樣本不均衡(比例3:1),容易對比例大的樣本造成過擬合,預測偏向樣本數(shù)較多的分類,大大降低模型的泛化能力,這里通過隨機旋轉(zhuǎn)負樣本圖像一定角度產(chǎn)生新的樣本,使得正負樣本的比例在1:1左右,從而解決數(shù)據(jù)不平衡問題,旋轉(zhuǎn)產(chǎn)生的新樣本如圖2所示。
圖2 數(shù)據(jù)增強產(chǎn)生的新樣本Fig.2 New sample generated by data enhancement
在2 679張正負樣本圖像中,一般將訓練集和測試集劃為7:3左右,隨機選取1 874幅圖像作為訓練集,選取805張圖像作為測試集。訓練集、測試集具體劃分如表1所示。
表1 數(shù)據(jù)集分配表Tab.1 Allocation table of data set
如圖3所示為貝葉斯優(yōu)化支持向量機模型的結(jié)構(gòu)框圖,首先對紅外樣本圖譜數(shù)據(jù)庫中的全部樣本圖像進行預處理,使圖像縮放到同一尺寸,以一定比例隨機選取訓練集與測試集,對訓練集提取方向梯度直方圖特征并進行PCA降維,送入支持向量機模型并進行貝葉斯尋優(yōu),得到優(yōu)化后的支持向量機模型,依據(jù)測試集降維后的方向梯度直方圖特征進行故障診斷。
圖3 貝葉斯優(yōu)化支持向量機模型結(jié)構(gòu)框圖Fig.3 Bayesian optimization support vector machine model
支持向量機(Support Vector Machine,SVM)方法的提出,最早由Corinna Cortes與Vapnik等在1995年提出,其主要思想主要為從原空間Rn通過變換Φ轉(zhuǎn)換到高維的特征空間H,最終實現(xiàn)在高維空間H中尋找最優(yōu)超平面進行分類,原理如圖4所示。
針對數(shù)據(jù)集xi∈Rn,yi∈{-1,1},i=1 , …,l,以及核函數(shù)K(xi,xj)。K與高維特征空間Z的內(nèi)積相對應, 即(φ(xi),φ(xj))=K(xi,xj), 變換φ(x)=Z將樣本從輸入空間x映射至高維特征空間Z,類似于邏輯回歸,該模型基于線性函數(shù)ωTx+b,即在Z中尋找最優(yōu)超平面(ω,φ(x))-b=0,其中ω為超平面法向量,決定了超平面的方向,b為位移項,決定了超平面和原點間的距離,顯然劃分超平面可以被法向量ω和位移b確定,樣本集線性可分時,使分類間隔最大的問題即轉(zhuǎn)化為求解支持向量機的基本型問題,式(1)為求解過程。
圖4 最優(yōu)分類超平面Fig.4 Hyperplane of optimal classification
其中約束條件yi((ω,(xi))-b) ≥1,i=1,2, …對于線性不可分的樣本集,如公式(2)求解。
約束條件yi((ω,φ(xi))-b) ≥ 1-ξi,ξi≥ 0,i=1,2,…,其中,ξi是松馳變量,C為正則化參數(shù)。
通過對以上問題的求解,可以得到SVM回歸表達式和二分類器如公式(3)所示。
其中aj為拉格朗日乘積因子。
主成分分析(Principal Component Analysis,PCA),是一種統(tǒng)計方法,其思路是通過正交變換將一組可能存在相關(guān)性的變量轉(zhuǎn)換為一組線性不相關(guān)的變量,轉(zhuǎn)換后的該組變量稱為主成分。主成分分析法作為一種線性降維方法,能夠?qū)D像中存在的冗余特征信息進行清除,精簡并保留圖像特征中有效特征信息,降低計算復雜度,從而提升圖像識別效率,降維效果的評估可以通過對比降維前后學習分類器的綜合性能,如果其綜合性能得到提高則認為降維起到了作用,通過可視化技術(shù)可以直觀的判定降維效果,前提是降低維數(shù)為至二維或三維。PCA算法描述如圖5所示。
圖5 PCA算法流程Fig.5 Flow chart of PCA algorithm
貝葉斯優(yōu)化算法(BOA),于2000年左右由UIUC的Pelikan等提出。貝葉斯優(yōu)化算法的思路主要是根據(jù)先驗知識對每一次新的采樣點來測試并更新先驗分布,最終找出全局最優(yōu)值。貝葉斯優(yōu)化算法的優(yōu)化流程如圖6所示。
圖6 貝葉斯優(yōu)化算法流程Fig.6 Bayesian optimization algorithm
本文主要研究貝葉斯優(yōu)化算法、隨機搜索算法(random-search)和網(wǎng)格搜索算法(grid-search)這三種超參數(shù)尋優(yōu)算法的尋優(yōu)性能,將優(yōu)化后得到的二進制支持向量機用于紅外樣本圖譜數(shù)據(jù)庫的分類。根據(jù)支持向量機訓練分類結(jié)果,從尋優(yōu)時間、尋參效率、訓練準確率三個層面分析了三種算法在優(yōu)化支持向量機參數(shù)的優(yōu)缺點如表2所示,貝葉斯優(yōu)化算法在略微犧牲尋優(yōu)時間和尋參效率的情況下,可以實現(xiàn)94.041%的較高檢測準確率。
表2 參數(shù)尋優(yōu)方法對比Tab.2 Comparison of parameter optimization methods
對比三種優(yōu)化算法可知,網(wǎng)格搜索速度最慢且訓練成本較高,但在搜索整個搜索空間方面效果很好,而針對隨機搜索來說,由于不能利用先驗知識來選擇下一組超參數(shù),可能會錯過搜索空間中的重要點,這一缺點在訓練成本較高的模型中尤為突出。在測試一組新的支持向量機超參數(shù)時,網(wǎng)格搜索和隨機搜索不會對先驗分布加以利用,而是選擇忽略前一組支持向量機超參數(shù)的信息。而貝葉斯優(yōu)化算法可以根據(jù)先驗知識,設(shè)立一個搜索函數(shù),每當給出一組新的支持向量機超參數(shù)時,用于更新目標函數(shù)的先驗分布,算法測試由后驗分布給出的最小估計目標點。因此貝葉斯優(yōu)化相比于隨機搜索算法和網(wǎng)格搜索算法能夠利用先驗知識高效地調(diào)節(jié)支持向量機超參數(shù),找到使結(jié)果向全局最大值提升的參數(shù)。圖7為貝葉斯尋優(yōu)算法參數(shù)尋優(yōu)過程可視化過程。
圖7 貝葉斯尋優(yōu)算法參數(shù)尋優(yōu)過程Fig.7 Optimizing process of Bayesian optimization algorithm
本文采取了隨機搜索、網(wǎng)絡(luò)搜索、貝葉斯優(yōu)化這三種優(yōu)化算法針對支持向量機的懲罰參數(shù)和高斯核函數(shù)的參數(shù)進行優(yōu)化。優(yōu)化算法的相關(guān)尋優(yōu)過程對比效果如圖8所示。
圖8 支持向量機參數(shù)尋優(yōu)圖Fig.8 Optimizing figure of SVM parameter
在圖 8(a)~圖 8(c)分別代表 GS、RS、貝葉斯算法的尋優(yōu)過程,貝葉斯算法的擬合度比GS、RS算法的擬合度要好,并且貝葉斯算法收斂速度相當快,相對于GS、RS有明顯優(yōu)勢。
本文基于二進制支持向量機建立了絕緣子紅外圖譜故障診斷模型,引進了貝葉斯優(yōu)化算法對支持向量機算法參數(shù)進行尋優(yōu)。與傳統(tǒng)的網(wǎng)格搜索法、隨機搜索法相比,貝葉斯優(yōu)化算法可利用先驗知識更快的收斂到全局最優(yōu)值,針對支持向量機的懲罰參數(shù)和高斯核函數(shù)的參數(shù)優(yōu)化更有效。
實例表明,貝葉斯優(yōu)化算法在收斂速度和準確度具有明顯的優(yōu)勢。通過使用紅外成像儀Fluke Ti55TF對被測絕緣子進行拍照,并采用本文提出的算法模型對絕緣子進行評估診斷,可以更好的檢測絕緣子的運行狀態(tài)。通過進行紅外檢測試驗現(xiàn)場采集劣化絕緣子與正常絕緣子的紅外圖譜,再提取絕緣子紅外圖譜中的方向梯度直方圖特征,利用主成分分析法對所得特征進行降維處理,訓練得到支持向量機分類器,利用貝葉斯優(yōu)化算法對支持向量機的超參數(shù)進行優(yōu)化,所得到的模型可實現(xiàn)有效地對劣化絕緣子進行故障診斷,具有工程實際意義。