張 健,張 朋,宮銘辰,王 悅,陳世玉
(國網(wǎng)黑龍江省電力有限公司電力科學研究院,黑龍江 哈爾濱 150030)
高壓斷路器是電力系統(tǒng)中最重要的控制和保護設備,其穩(wěn)定動作能夠在一定程度上限制事故的擴散[1]。隨著技術的進步,對于高壓斷路器的檢修方式由最初的事故檢修、定期維護到如今的狀態(tài)檢修,在不增加故障發(fā)生概率的基礎上,又節(jié)約了大量人力物力。狀態(tài)檢修對于高壓斷路器的異常信號判斷有非常高的要求,需要能夠及時發(fā)現(xiàn)異常信號,并依據(jù)信號對可能發(fā)生的故障類型進行準確判斷,方便運維人員進行檢修[2-3]。
目前,對于故障診斷的參數(shù)選擇主要集中在線圈電流、振動信號和觸頭位移上[4]。從國際大電網(wǎng)組織發(fā)布的高壓斷路器故障類型分析中可知,機械故障是發(fā)生數(shù)量最多的故障[5]。線圈電流能夠反映線圈狀態(tài),KN圖什工業(yè)大學的Razi-Kazemi使用線圈電流成功對鐵芯卡澀和接觸不良故障做出判斷,但對機械故障的診斷效果較差[6]。振動信號波形在一定程度上也能夠反映機械故障,但由于其波形無明顯規(guī)律,信號分析和處理較復雜,故障診斷正確率相對較低[7]。觸頭位移信號是最能夠反映機械故障的信號,且信號提取分析方便,利于后續(xù)故障診斷。三峽大學劉道兵采用隨機優(yōu)化算法實現(xiàn)了斷路器的故障診斷[8]。伊朗的Forootani使用拉格朗日法建立了動態(tài)模型,揭示了位移曲線的變化與故障原因間的關系[9]。
然而,由于斷路器故障樣本少、非線性等特點,以上傳統(tǒng)故障診斷方法的效率和準確性由于方法本身的限制很難進一步提高,不利于對故障快速、準確識別。因此開展適用于斷路器的故障診斷方法研究,對高壓斷路器狀態(tài)檢修的發(fā)展具有重要意義。
本文首先對高壓斷路器位移曲線進行分析,對需要提取的特征參數(shù)進行說明。結合支持向量機(support vector machine,SVM)和Spark技術,提出了基于機器學習算法的高壓斷路器故障診斷方法。對方法中涉及到的參數(shù)進行選取,并采用實際數(shù)據(jù)進行準確率分析。最后使用此方法與傳統(tǒng)方法分別對典型故障進行診斷,分析比較診斷結果。研究成果為高壓斷路器故障診斷提供參考。
高壓斷路器位移曲線是反映斷路器觸頭位移特性的信號,通過對曲線分析,能夠得到整個開斷過程中分合閘操作的時間、動觸頭行程、動觸頭的平均速度、動觸頭的瞬時速度等[10]。
以典型合閘位移曲線為例進行分析,如圖1所示。觸頭在合閘簧所產(chǎn)生力的作用下從零點開始加速運動,經(jīng)過前期的加速,后期基本保持勻速在t1時刻走完額定開距S1。此時觸頭剛剛接觸,為了保證觸頭連接緊密,機構一般會繼續(xù)運動一段距離,于t2時刻到達S2位置。此時觸頭緊密連接,但由于機構仍有較高速度,因此會出現(xiàn)往復振蕩,最大可到達S3位置。當動能轉化的機械力完全釋放后,鐵芯最終在t3時刻保持在S2的位置,整個開斷過程結束。由以上參數(shù)還可以計算出動作過程中的速度值。
圖1 高壓斷路器典型位移曲線
vmax=max{dS/dt}
(1)
(2)
機器學習的思路為通過不同算法模型對現(xiàn)有數(shù)據(jù)進行訓練,如果訓練性能滿足要求,則使用該模型對新數(shù)據(jù)進行測試;如果未能滿足要求,則調整算法以重建模型并再次訓練[9]。得到能夠應用于此類數(shù)據(jù)的對應算法,最終使用其預測相關的特征屬性,機器學習過程如圖2所示。
圖2 機器學習流程
目前,機器學習技術和方法已經(jīng)在很多領域得到成功應用,如語言識別、機器翻譯和智能控制等。但由于技術和單機存儲容量的限制,傳統(tǒng)的機器學習算法只能用于少量數(shù)據(jù),且對于數(shù)據(jù)采樣的要求非常高。但在實際過程中,樣本往往很難做到隨機,導致學習模型準確性不高,影響測試結果的準確性。Spark平臺本身擁有數(shù)據(jù)存儲、數(shù)據(jù)查詢與處理、機器學習等功能,同時還可以調用第三方框架,能夠對完整數(shù)據(jù)進行機器學習,解決了統(tǒng)計隨機性的問題[11]。應用Spark平臺進行機器學習,需要處理各種數(shù)據(jù)并進行大量迭代計算,Spark提供了一個基于海量數(shù)據(jù)的機器學習庫,由一些通用的學習算法和工具組成,包括分類、回歸和聚類等一系列算法,以及底層的優(yōu)化語言和高級API。因此,研究人員只需要有Spark基礎,了解機器學習算法的原理及方法相關參數(shù)的意義,就可以方便地調用相應的API來實現(xiàn)基于各種數(shù)據(jù)的機器學習過程[12]。
2.2.1 SVM原理
SVM是基于統(tǒng)計學習的分類方法,其原理是找到1個最優(yōu)分類線,并以此邊界為條件進行分類,如圖3所示[13]。
圖3 最優(yōu)分類面
圖3中圓形和矩形點分別表示2種不同的數(shù)據(jù),能夠清晰將上述2種數(shù)據(jù)分開的線為L,穿過離L最近的2種數(shù)據(jù),且平行于L的直線分別為L1和L2,其距離為分類間隔。
L即為最優(yōu)分類線,L1和L2上的數(shù)據(jù)點叫做支持向量。這樣在完全分開2種樣本的基礎上還保證分類間隔最大,分類線方程為
ω·x+b=0
(3)
可以對它進行歸一化,使得線性可分的樣本集(x1,y1),i=1,2,3,…,n,x∈Rd,y∈{+1,-1}滿足
yi[(ω·xi)+b]≥1,i=1,2,3,…,n
(4)
此時分類間隔為2/‖ω‖,要令此數(shù)值最大,為了方便,數(shù)學表示轉換為令‖ω‖2最小。
當二維空間中不能找到最優(yōu)分類線時,可以利用核函數(shù)把樣本直接映射到高維特征空間,并在此空間中構造最優(yōu)線性分類超平面。核心思想是通過核函數(shù)將低維空間中的非線性問題變?yōu)楦呔S空間中的線性問題,分類核函數(shù)的選取是決定分類效果的關鍵之處。
常用核函數(shù)有以下幾種。
a.線性核函數(shù)(liner)
K(xi,xj)=xi·xj
(5)
K(xi,xj)=[(xi·xj)+1]q
(6)
c.徑向基核函數(shù)(rbf)
(7)
d.Sigmoid核函數(shù)
K(xi,xj)=tan[v(xi·xj)+c]
(8)
經(jīng)過核函數(shù)轉換,此時目標函數(shù)為
(9)
相應的分類函數(shù)也變?yōu)槭?10)。
圍繞如何做好“三農”工作,習近平總書記作出了一系列重要論述,提出了一系列新理念新思想新戰(zhàn)略。在黨的十九大報告中,習近平總書記首次明確提出了“實施鄉(xiāng)村振興戰(zhàn)略”并寫入黨章,將它列為決勝全面建成小康社會需要堅定實施的七大戰(zhàn)略之一;同年的中央農村工作會議中首次提出走中國特色社會主義鄉(xiāng)村振興道路,明確了實施鄉(xiāng)村振興戰(zhàn)略的目標任務;2018年中央又下發(fā)了題為《中共中央國務院關于實施鄉(xiāng)村振興戰(zhàn)略的意見》的一號文件,闡述了新時代實施鄉(xiāng)村振興戰(zhàn)略的重大意義、總體要求,是新時代鄉(xiāng)村振興戰(zhàn)略的綱領性指導文件。
(10)
以上就是SVM的原理,其結構如圖4所示。
圖4 SVM結構圖
2.2.2 故障診斷方法
由于高壓斷路器內部結構的復雜性和信號輸入與故障輸出之間的復雜性。診斷難點在于輸入與輸出之間不存在一一對應關系。因此,高壓斷路器故障診斷是一個反復試驗的過程,如圖5所示。
圖5 故障診斷流程
本文利用Spark平臺中的機器學習模塊對數(shù)據(jù)進行分析,并用Python語言實現(xiàn)。首先構建Spark聚類系統(tǒng),在平臺中使用Spark機器學習導入Python類庫和數(shù)據(jù),通過機器學習包配置所有參數(shù)模塊,進一步處理信號特征數(shù)據(jù),構建改進的SVM分類模型。數(shù)據(jù)采用泰開某型號彈簧高壓斷路器分合閘測試數(shù)據(jù),在模型訓練期間,將80%的樣本數(shù)據(jù)分離為訓練數(shù)據(jù)集,將20%的樣本數(shù)據(jù)分離為測試數(shù)據(jù)集,如表1所示。
表1 輸入特征數(shù)據(jù)(部分)
為了有效分析數(shù)據(jù),選擇72組斷路器的測量樣本。由于SVM輸入的4個特征信號在算法模型中具有不同的數(shù)量級,為了使每個輸入數(shù)據(jù)占據(jù)相應的比例,對72組樣本數(shù)據(jù)進行歸一化,并將輸入數(shù)據(jù)輸入模型。
分割完數(shù)據(jù)后,無法確定哪種算法對應模型的準確度更高,因此采用10折交叉驗證法進行算法評估,參與評估的算法有線性回歸(LR)、樸素貝葉斯(MNB)和SVM。在不調參的前提下,比較模型準確度平均值和方差進行算法評估,結果如圖6所示。
圖6 算法評估結果圖
由圖6可知,3種算法中SVM算法的準確度更高,分布更密集,說明對相同的數(shù)據(jù)處理結果更好。以上為模型采用默認參數(shù)進行運算結果,調整參數(shù)后可能會使模型在準確度和過擬合能力上保持一定的和諧性。SVM重要的2個參數(shù)是懲罰系數(shù)C和核函數(shù)kernel,依據(jù)對這2個參數(shù)進行組合,在C=(0.1,0.3,0.5,0.7,0.9,1.0,1.3,1.5,1.7,2.0)和kernel=(linear, poly, rbf, sigmoid)的情況下,對這2個參數(shù)進行調優(yōu),使最終算法模型對數(shù)據(jù)處理的結果準確度更高,算法調優(yōu)的對比結果如表2所示。
由表2可知,SVM模型準確度最高的是C=1.3,kernel=rbf,此時準確率達93%。采用以上參數(shù),對測試數(shù)據(jù)進行故障診斷,模型輸出的故障診斷的分類結果如表3所示。
表2 算法調參結果
表3 故障診斷分類結果
由表3可知,SVM模型對上述3種故障均有較高的識別準確率,其中觸頭彈簧準確率最高,可達96%;2種分閘簧故障準確率稍低,但也超過90%,能夠滿足故障診斷高精度的需求。因此,利用機器學習中SVM搭建的算法模型具有可行性。在訓練樣本與測試樣本相同的情況下,采用傳統(tǒng)LR和MNB分類模型進行分析,將運行時間和準確率進行比較,結果如圖7所示。
圖7 算法對比柱狀圖
由圖7可知,與另外2種方法相比,SVM模型在高壓斷路器故障診斷中具有更快的運行速率和更高的診斷準確率。運行時間比耗時最長的MNB模型少1.45 s,準確率比最低的LR模型提高12%。
本文將Spark平臺SVM模型應用于高壓斷路器故障診斷,得到了關鍵參數(shù)配置情況,通過試驗數(shù)據(jù)驗證了模型的準確性,研究結論如下。
a.對于判斷彈簧有關故障,當模型中參數(shù)C=1.3,kernel=rbf時,SVM模型準確度最高,能夠達到93%。
b.與MNB、LR模型相比,SVM模型在準確率與耗時方面均有較大優(yōu)勢。其中準確率最多提高12%,運行耗時減少1.45 s。