摘要:故障電弧是由于電氣線路或設備中絕緣老化破損、電氣連接松動、空氣潮濕、電壓電流急劇升高等原因引起空氣擊穿所導致的氣體游離放電現(xiàn)象。故障電弧極易引起火災,不易發(fā)現(xiàn),為了減小線路中故障電弧所引起的危害,基于實驗證實的故障電弧的特性,利用支持向量機(SVM)方法構建分類模型,用于故障電弧波形的識別。通過對數(shù)據(jù)集的交叉測試,故障電弧波形的分類精度、敏感性和特異性分別為93.4%、98.1%和85.3%。通過實驗為機器學習方法在故障電弧識別中的研究奠定了基礎。
關鍵詞:故障電弧;支持向量機;分類模型;機器學習
2017年一季度全國共發(fā)生電氣火災2.4萬起,占全部火災總數(shù)的29.8%,其中在2起重大火災,全部為電氣火災。通過對電氣火災的研究發(fā)現(xiàn),大多數(shù)電氣火災與故障電弧相關,因此對于故障電弧的檢測成為了關鍵。2011年美國國家標準學會ANSI發(fā)布了故障電弧探測器標準UL 1699-2011,2014年我們國家發(fā)布了故障電弧探測器的國家標準GB 14287.4-2014,標準中對故障電弧的定義和試驗方法給出了解釋。
電弧是不同電極間通過原本絕緣的介質而持續(xù)放電的現(xiàn)象,電弧通常以空氣為介質,形成時空氣兩邊的電極導通、揮發(fā)并產生一系列的電磁反應過程。電弧發(fā)生時,會產生很高的溫度,中心最高溫度可達1.2×105攝氏度以上。電弧所產生的高熱、高壓氣體,極易引發(fā)火災。在工業(yè)生產和生活中,會有可控的電弧產生,這種電弧持續(xù)時間短,并不會影響電路中其他電器的工作和使用。而由于線路老化和施工問題所引起的局部短路、絕緣層老化、接線處松動等原因而引起的非預期的線路電弧,則為故障電弧。
目前,故障電弧的識別主要有兩種方法,波形分析法和機器學習法。波形分析法通過觀察大量的故障電弧電流、電壓波形,對比電弧波形與正常波形的區(qū)別,總結歸納出一系列電弧的特征,根據(jù)這些特征識別電弧。機器學習法通過已知的故障電弧數(shù)據(jù)構建分類模型,由分類模型對電流波形數(shù)據(jù)進行識別,從而判斷待識別樣本是否為故障電弧?,F(xiàn)階段,故障電弧探測器多數(shù)應用的是波形分析法,因為這種方法速度快、成本低,如果對波形特征分析徹底,可以達到較高的識別率;然而波形分析法可以識別特征明顯的故障電弧波形,在一些與電弧波形相近的非故障電弧波形上識別效果不佳。機器學習法可以克服人工識別的不足,但這種方法由于在識別故障電弧的過程中要計算大量的特征參數(shù),對芯片的計算、存儲能力有著較高的要求;并且目前沒有提出一種有效的模型能夠以很高的分類精度應用與故障電弧的識別。本文提出一種基于支持向量機(Support Vector Machine,SVM)的故障電弧識別方法,該方法直接應用電流波形數(shù)據(jù)構建分類模型,在故障電弧的識別上通過交叉驗證取得了93.4%的分類精度,因為直接應用電流波形數(shù)據(jù),該方法分類速度快、精度高,可以為故障電弧的識別提供一定的參考價值。
一、支持向量機分類模型
(一)支持向量機分類模型
SVM分類方法是機器學習中使用率較高的一種分類方法,它能夠很好的解決二分類問題。分類樣本被看做是空間中一個個點,SVM通過求解分隔兩類樣本的分割面,這個分割面不僅能夠將兩類樣本有效的分割并能夠使兩類樣本的分類間隔最大化。然而,僅僅通過在原空間下尋找分割面很難達到好的分類效果,這就需要通過核函數(shù)把原來的空間映射到高維,在更高維度的空間下,求解最優(yōu)分割面。
對于一個給定的電流波形數(shù)據(jù)集Yn, Yi∈Yn (i=1, 2,…, N),每個波形的類標簽設為ri (-1 或者+1),其中-1代表非故障電弧波形,+1代表故障電弧波形。電流波形的分類標準是依據(jù)判別方程:
本文應用RBF核函數(shù)和最大區(qū)間法構造最優(yōu)分類超平面。
(二)自適應參數(shù)選擇
SVM有兩個關鍵的自適應參數(shù),懲罰系數(shù)C和核函數(shù)參數(shù)(,這兩個參數(shù)對分類結果的影響很大。懲罰系數(shù)C的大小反應的是模型的數(shù)據(jù)擬合程度,C值得大小與擬合程度正相關。C值過小,會產生數(shù)據(jù)欠擬合,C值過大,會產生數(shù)據(jù)過擬合,使模型的復雜程度超出模型所能承受的最大范圍。此外,C值也影響模型中異常值的處理。如果C的值合適,則可以提高模型的抗干擾性,從而提高模型的穩(wěn)定性。
本文使用遺傳算法求解懲罰系數(shù)C和核函數(shù)參數(shù)(。對于遺傳算法中的關鍵參數(shù),設置如下:群體規(guī)模為5,最大進化代數(shù)為300,交叉概率為0.85,變異概率為0.04,C的取值為從1到1×105,(的取值為從0.01到50,在程序運行中,將懲罰系數(shù)C和核函數(shù)參數(shù)(用二進制表示,需要0、1二進制串編碼27位,其中前13位對應十進制數(shù)為核函數(shù)參數(shù)(值的,后13位對應十進制數(shù)為懲罰系數(shù)C值。
二、實驗與結果
(一)實驗數(shù)據(jù)集
本文依據(jù)國家標準GB 14287.4-2014,以試驗過程中實際產生的串聯(lián)碳化路徑電弧、并聯(lián)碳化路徑電弧、并聯(lián)金屬性接觸電弧、負載抑制性電弧為試樣的正樣本數(shù)據(jù)來源,共得到2500個正樣本數(shù)據(jù);以電容啟動式電動機、吸塵器、電磁爐和變頻空調等電器在啟動和運行時電流波形為負樣本數(shù)據(jù)來源,共得到1600個負樣本數(shù)據(jù)。以一個半周波的電流波形數(shù)據(jù)為樣本,0.2×10-5s為步進,得到一個5000維的樣本數(shù)據(jù)。
在模型的評估上,本文采用敏感性(Se)、特異性(Sp)和分類精度(Acc)三個指標對結果進行評價。通常,預測結果包括以下四種類型:TP表示正確預測的陽性樣本數(shù)目,TN表示陰性樣本數(shù)目,F(xiàn)P表示假陽性樣本數(shù)目,F(xiàn)N表示假陰性樣本數(shù)目。基于這些數(shù)值,可以分別計算出模型的敏感性、特異性和分類精度,具體計算公式如下:
實驗中,本文選擇了2500個故障電弧波形數(shù)據(jù),1600個近似故障電弧的非故障電弧波形數(shù)據(jù),每個波形數(shù)據(jù)提取5000個特征,應用PCA把這個5000維的向量空間降到2420維,其中不同維度下樣本的分類精度、敏感性和特異性如圖1所示,當樣本維度降為2420維時,交叉驗證所得到的分類精度、敏感性和特異性與降維前的數(shù)據(jù)無差異,可見這樣的分類既能夠達到理想的精度又能夠節(jié)省建模與分類的時間,并減小存儲所需的內存空間。
(三)實驗結果
實驗中,本文應用改進的PCA特征選擇方法對原始數(shù)據(jù)集進行了屬性子集選擇,共選擇2420個屬性作為最終參與分類的屬性。應用5-fold交叉驗證方法,把數(shù)據(jù)集按照樣本類標簽比例隨機分成5份,每次以其中的4份作為訓練集,另外1份作為測試集,5次訓練與測試之后,每個樣本都被測試一次,得到整體的分類精度。通過敏感性(TP Rate)、特異性(FP Rate)、精確度(Precision)、召回率(Recall)、F測度(F-Measure)和ROC曲線面積(ROC Area)等多個指標對實驗結果進行評測。最終,得到一個具有93.4146%分類精度的故障電弧分類模型。
三、結語
隨著社會的進步和人民生活水平的提高,用電安全問題應進一步引起全社會的關注,故障電弧這種隱蔽性強、危害性大的問題更應該受到重視。本文主要針對故障電弧數(shù)據(jù)進行了研究,探討如何運用SVM方法解決故障電弧波形分類中遇到的問題,并在實際的故障電弧識別中取得了較好的效果,為故障電弧探測器的設計提供了新的視角和方法。當然,本文的研究還有待進一步完善,在現(xiàn)實生活中,故障電弧波形通常連續(xù)出現(xiàn),并且判斷電路中是否存在故障電弧隱患時也往往不是通過單個電弧做出判斷,因此如何設計一種好的算法,可以結合電弧周圍波形數(shù)據(jù)進行電弧數(shù)據(jù)分類;提取更多的故障電弧波形數(shù)據(jù)和近似非故障電弧波形數(shù)據(jù)而提高分類精度;制定更適合所研究問題的分類方法和特征選擇方法從而構建更加優(yōu)秀的分類器是本文今后的研究重點。相信通過努力,基于機器學習方法對故障電弧識別領域的研究會得到更多的應用和發(fā)展。
參考文獻:
公安部消防局.全國火災情況分析統(tǒng)計[G].2017.
陳雪剛.基于統(tǒng)計數(shù)據(jù)的我國電氣火災特點分析[J].消防技術與產品信息,2012:(05):47-49.
《電氣火災監(jiān)控系統(tǒng) 第4部分:故障電弧探測器》國家標準發(fā)布[J].消防技術與產品信息,2014,(09):37.
王其平.電器中的電弧理論[M].北京:機械工業(yè)出版社,1991.
孫超,孟軍,欒雨時.基于支持向量機分類算法的番茄miRNA預測[J].計算機工程與應用,2012,(14):203-207.