楊濤
摘要:整理現(xiàn)有8 a(2009—2016年)電子版數(shù)據(jù),對所收集的2 628條有效數(shù)據(jù)進行必要的預(yù)處理,根據(jù)工作習(xí)慣和故障因素特征具體分成六類。采用現(xiàn)今流行的數(shù)據(jù)挖掘技術(shù),即數(shù)據(jù)的聚類分析和關(guān)聯(lián)分析,探索各類故障因素的相關(guān)聯(lián)系,進行排序,尋找工作重點和優(yōu)先方向,為確保電網(wǎng)堅強進行有益探索,并借助MATLAB平臺使數(shù)據(jù)分析模型得以實現(xiàn)。
關(guān)鍵詞:累年故障數(shù)據(jù);聚類分析;關(guān)聯(lián)分析;東遼縣
中圖分類號:TM715 文獻標(biāo)識碼:A 文章編號:1674-1161(2017)06-0018-04
東遼縣位于長白山余脈與松花江平原結(jié)合部,地勢以山地為主,多山丘溝壑和草原林地,雷雨、大風(fēng)等惡劣天氣多。國網(wǎng)吉林東遼縣供電有限公司配網(wǎng)線路分布其間,設(shè)備布點多、線路覆蓋面積廣,延伸路徑復(fù)雜,有多處線路位于采煤沉降區(qū),公司電網(wǎng)極易受到自然環(huán)境等外界因素的影響。近幾年,東遼公司的配網(wǎng)設(shè)備經(jīng)歷了嚴(yán)峻考驗,除了受到自然災(zāi)害的影響外,設(shè)備老化嚴(yán)重,結(jié)構(gòu)缺員,致使配網(wǎng)設(shè)備故障頻發(fā),改造治理和管理提升需求迫切。隨著地方經(jīng)濟不斷發(fā)展,產(chǎn)業(yè)結(jié)構(gòu)逐步優(yōu)化升級,電力需求和供電質(zhì)量要求同時不斷上升。面向農(nóng)村地區(qū)的配網(wǎng)線路不僅結(jié)構(gòu)復(fù)雜,而且覆蓋地域較廣,因此,對配網(wǎng)線路故障進行全面分析和有益探索,采取積極有效的應(yīng)對措施,對于提高線路供電可靠性意義重大。
1 數(shù)據(jù)收集整理情況
故障數(shù)據(jù)分析治理項目小組接到任務(wù)后,聯(lián)系公司調(diào)度室,整理現(xiàn)有8 a(2009—2016年)電子版數(shù)據(jù),對所收集到2 628條有效數(shù)據(jù)進行必要的預(yù)處理,根據(jù)工作習(xí)慣和故障因素特征具體分成六類(如表1、圖1和圖2所示)。采用現(xiàn)今流行的數(shù)據(jù)挖掘技術(shù),即數(shù)據(jù)的聚類分析和關(guān)聯(lián)分析,探索各類故障因素的相關(guān)聯(lián)系,進行排序,尋找工作重點和優(yōu)先方向,為確保電網(wǎng)堅強進行有益探索,并借助MATLAB平臺使數(shù)據(jù)分析模型得以實現(xiàn)。
2 數(shù)據(jù)處理與分析
2.1 數(shù)據(jù)審核
從不同渠道獲得的原始數(shù)據(jù),在審核的內(nèi)容和方法上是不同的。對原始數(shù)據(jù)應(yīng)主要從數(shù)據(jù)完整性和數(shù)據(jù)準(zhǔn)確性兩個方面著手觀察。數(shù)據(jù)完整性審核主要是檢查應(yīng)調(diào)查的數(shù)據(jù)樣本個體是否有遺漏,所有的調(diào)查數(shù)據(jù)特征或指標(biāo)是否填寫齊全。數(shù)據(jù)準(zhǔn)確性審核主要包括兩個方面:一是檢查數(shù)據(jù)資料是否符合客觀實際情況;二是檢查數(shù)據(jù)是否有原發(fā)性錯誤,數(shù)值記錄等是否正確等。
2.2 數(shù)據(jù)篩選
原始數(shù)據(jù)的篩選主要包括兩方面:一是將某些不符合特征的數(shù)據(jù)或有明顯錯誤的數(shù)據(jù)剔除;二是將符合某種特定條件的數(shù)據(jù)篩選出來,對不符合特征的數(shù)據(jù)予以剔除。
2.3 數(shù)據(jù)排序
原始數(shù)據(jù)的排序是按照某種要求的順序?qū)?shù)據(jù)排列,便于使用者通過瀏覽數(shù)據(jù)排序情況發(fā)現(xiàn)一些明顯的特征或趨勢。除此之外,數(shù)據(jù)排序還有助于對原始數(shù)據(jù)檢查糾錯,為數(shù)據(jù)的重新歸類或排序分組等提供充分的依據(jù)。
2.4 處理方法
數(shù)據(jù)處理方法主要有4種:數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換和數(shù)據(jù)歸約。本研究主要采用數(shù)據(jù)歸約。數(shù)據(jù)挖掘時往往需要操作的數(shù)據(jù)量非常大,即便是在少量數(shù)據(jù)上進行挖掘分析,也需要耗時較長。數(shù)據(jù)歸約技術(shù)可以用來得到數(shù)據(jù)集的歸約表示,它量級小得多,但卻保留了原有的數(shù)據(jù)特性,并使歸約后結(jié)果與歸約前結(jié)果相同或近乎相同。
數(shù)據(jù)預(yù)處理技術(shù)是數(shù)據(jù)挖掘的一個熱門的研究方向,也是數(shù)據(jù)挖掘的必經(jīng)環(huán)節(jié),對所收集到2 628條有效數(shù)據(jù)進行必要的預(yù)處理,將經(jīng)過處理的數(shù)據(jù)整理成10 kV配網(wǎng)線路故障分類統(tǒng)計表。
2.5 數(shù)據(jù)聚類分析
數(shù)據(jù)聚類分析是將待處理的數(shù)據(jù)分到不同的類或簇中的過程,所以同一個類或者簇中的數(shù)據(jù)對象有著極大的相似性(同質(zhì)性),而不同類或簇間的數(shù)據(jù)對象又有很大的相斥性(相異性)。
按照數(shù)學(xué)觀點來說,數(shù)據(jù)聚類分析是通過用數(shù)據(jù)建模來簡化數(shù)據(jù)計算的一種分析方法。數(shù)據(jù)聚類分析是在一種無監(jiān)督規(guī)則下的探索性分析,在分類的過程中不必事先給出一個分類的標(biāo)準(zhǔn),數(shù)據(jù)聚類分析能夠從樣本數(shù)據(jù)實際情況和客觀要素出發(fā),自動進行分類。聚類分析因所使用數(shù)學(xué)模型算法的不同,常常會得到不同的結(jié)論;不同使用者對同一組待處理數(shù)據(jù)進行數(shù)據(jù)聚類分析,所得到的結(jié)論也未必完全一致。
從數(shù)據(jù)分析實際應(yīng)用的角度看,數(shù)據(jù)聚類分析也是數(shù)據(jù)深度挖掘的主要任務(wù)之一。數(shù)據(jù)聚類分析能夠作為一個較為實用的數(shù)學(xué)工具獲得數(shù)據(jù)的分布狀況,觀察每一類或簇數(shù)據(jù)的特征,集中對特定的聚簇集合做進一步分析。聚類分析還可以作為其他算法(如分類和定性歸納算法)的預(yù)處理步驟。
利用聚類分析四次劃分得到分類順序,即極端天氣、配電設(shè)備故障、線路樹障、外力破壞、管理不到位和用戶設(shè)備故障(如圖3所示)。
2.6 數(shù)據(jù)灰色關(guān)聯(lián)分析
灰色關(guān)聯(lián)分析方法是灰色系統(tǒng)理論的一個重要分支,應(yīng)用灰色關(guān)聯(lián)分析方法對受多種因素影響的事物和現(xiàn)象從事物整體角度出發(fā)進行綜合評價,是一個被廣為接受的方法。
灰色關(guān)聯(lián)分析法是將研究對象及影響因素的因子值視為一條直線上分布的各個點,是假定的理想標(biāo)準(zhǔn)參考值,與待識別對象及影響因素的因子值所繪制的曲線點進行比較,將其之間的擬合程度通過繪圖函數(shù)分別量化顯示,計算出研究對象與待識別對象各影響因素之間的擬合程度的關(guān)聯(lián)度,通過比較各關(guān)聯(lián)度的大小來判斷待識別對象對研究對象的影響程度?;疑P(guān)聯(lián)度分析法是一種實用的數(shù)學(xué)分析技術(shù),能夠發(fā)現(xiàn)存在于大量數(shù)據(jù)集中的關(guān)聯(lián)性或相關(guān)性,從而發(fā)現(xiàn)描述一個事物中某些屬性同時出現(xiàn)的規(guī)律和模式。
灰色關(guān)聯(lián)分析從大量數(shù)據(jù)中發(fā)現(xiàn)項集之間有趣的相關(guān)聯(lián)系并進行綜合評價(注意對表格轉(zhuǎn)置),如圖4和圖5所示。
由灰色關(guān)聯(lián)度排序可以看出,極端天氣>線路樹障>配電設(shè)備故障>外力破壞>管理不到位>用戶設(shè)備故障。即極端天氣因素與虛擬最具破壞力故障因素的關(guān)聯(lián)度最大,可斷定極端天氣因素為最具破壞力故障因素;按照排列次序關(guān)聯(lián)度降低,其他故障因素對公司電網(wǎng)的破壞與影響逐漸減小。endprint
2.7 數(shù)學(xué)模型及不同分析方法的評價
對比兩種方法的計算過程可以發(fā)現(xiàn):層次分析法概念直觀、計算方便、容易理解,但該方法最大的缺點是主觀性強、客觀性較差。由于樣本的重要性本身就是個模糊的概念,所以對于樣本的重要性比較,不同的人可能給出不同的結(jié)論,而且根據(jù)個人的素質(zhì)、學(xué)識、能力與價值觀等,難免會對某些樣本產(chǎn)生過于偏愛的傾向。另外,該方法在實際操作中需要請相關(guān)方面的專家、有經(jīng)驗的人員等進行判斷,同時還要考慮到專家的結(jié)構(gòu)和素質(zhì)。所以該方法雖然計算方便,但其實際操作過程卻比較復(fù)雜。而灰色關(guān)聯(lián)分析法的最大優(yōu)點是客觀性強,避免了人的主觀判斷帶來的影響。該方法利用樣本數(shù)據(jù)經(jīng)過一系列的數(shù)學(xué)計算,得到權(quán)重,實際上結(jié)論完全是由數(shù)字信息得來的。相對于層次分析法來說,該方法的操作比較簡單,應(yīng)用者一旦掌握,可以自己對數(shù)據(jù)進行處理,得到結(jié)論。但該方法的計算相對較為復(fù)雜,如果不熟悉,建議采用層次分析法。綜上所述,層次分析法簡單直觀,計算過程可調(diào)用函數(shù),容易理解,但主觀性強,客觀性較差,且計算結(jié)果精確度不高;灰色關(guān)聯(lián)分析法結(jié)論客觀性較強,計算結(jié)果精確度較高,但計算過程比較繁瑣,需要編寫大量代碼。
3 措施及建議
1) 根據(jù)以上分析,對6個不同方面的故障因素,采取積極的應(yīng)對措施,有的放矢,有針對性地解決問題。除極端天氣需要做好風(fēng)險轉(zhuǎn)移報案理賠外,其他因素均需要業(yè)務(wù)部門進行前瞻性解決。
2) 通過數(shù)據(jù)分析可知,線路樹障和外力破壞是影響配網(wǎng)穩(wěn)定的不可忽略故障因素,除采取積極的技術(shù)措施外,還應(yīng)尋求地方政府和司法幫助。電力法和電力設(shè)備保護條例在現(xiàn)實環(huán)境中是保護電力設(shè)備權(quán)益的重要武器,但常常遭遇挑戰(zhàn),建議公司尋求地方立法和司法幫助是非常必要的。
3) 通過數(shù)據(jù)審核發(fā)現(xiàn),配電設(shè)備故障易發(fā)時間多為早晚時段,特別是農(nóng)村用戶負荷集中,此時也是電壓低、電壓不穩(wěn)等問題的多發(fā)時段。建議各基層供電所提醒農(nóng)村廣大用戶“錯峰”用電,避免用電擁堵帶來的不便。
4) 通過數(shù)據(jù)分析發(fā)現(xiàn),管理不到位因素雖然排在倒數(shù)第二位,但經(jīng)仔細分析,除極端天氣外,其他的故障因素都可以劃分在管理范疇,這說明打造堅強電網(wǎng)不僅需要對電力設(shè)備進行改造治理,還需要大幅提升管理水平,轉(zhuǎn)變管理方式。
參考文獻
[1] 張斌,張薇薇.機械設(shè)備故障診斷技術(shù)概述[J].建筑機械化,2005,8(15):14-15.
[2] 朱大奇,于盛林.基于知識的故障診斷方法綜述[J].安徽工業(yè)大學(xué)學(xué)報,2002,19(3):197-204.
[3] 王海彬.農(nóng)村配電變壓器防雷措施的應(yīng)用[J].沿海企業(yè)與科技,2008(12):149-150,148.
[4] 王益明,王永德,薛慶國,等.大學(xué)新生學(xué)科選擇結(jié)果與人格特征關(guān)系的研究[J].心理科學(xué),2000,40(5):586-589,639.
[5] 張文穎,施久玉.基于聚類分析的當(dāng)代大學(xué)生學(xué)習(xí)心理研究[J].黑龍江高教研究,2009(4):113-115.
[6] 徐鳳銀,朱興珊,顏其彬,等.儲層含油氣性定量評價中指標(biāo)權(quán)重的確定方法[J].西南石油學(xué)院學(xué)報,1994(4):11-17.
[7] 蘭海,史家鈞.灰色關(guān)聯(lián)分析與變權(quán)綜合法在橋梁評估中的應(yīng)用[J].同濟大學(xué)學(xué)報:自然科學(xué)版,2001,29(1):50-54.
[8] 穆瑞,張家泰.基于灰色關(guān)聯(lián)分析的層次綜合評價[J].系統(tǒng)工程理論與實踐,2008,28(10):125-130.
[9] 申卯興,薛西鋒,張小水.灰色關(guān)聯(lián)分析中分辨系數(shù)的選取[J].空軍工程大學(xué)學(xué)報:自然科學(xué)版,2003,4(1):68-70.endprint