王小紅
(陜西省委黨校 陜西 西安 710061)
基于RS并行約簡算法的配電網(wǎng)故障診斷方法
王小紅
(陜西省委黨校 陜西 西安710061)
隨著電力系統(tǒng)對系統(tǒng)故障診斷智能化的要求越來越高,為了解決傳統(tǒng)專家系統(tǒng)對不完整知識處理的局限性以及減少誤判、漏判的情況,本文提出一種基于RS并行約簡算法,將約簡算法中計算相對正域的過程和計算核值的過程實現(xiàn)了并行化處理。實驗結(jié)果顯示,本方法提高了粗糙集中決策表屬性約簡的準確性,同時降低了屬性約簡的時間。本方法對配電網(wǎng)故障診斷的決策規(guī)則的自動化生成、實時故障信息進行分類判斷和識別具有重要意義。
配電網(wǎng);故障診斷;并行計算;粗糙集
配電網(wǎng)故障診斷主要是對各級各類保護裝置產(chǎn)生的報警信息,斷路器的狀態(tài)變化信息以及電壓、電流等電氣量測量的特征進行分析,根據(jù)保護動作的邏輯和運行人員的經(jīng)驗來推斷可能的故障位置和故障類型。為了應對電力系統(tǒng)快速增長的各種海量信息,研究人員引入了許多方法和技術(shù),并且取得了一定的成功,例如,基于貝葉斯網(wǎng)絡[7]、遺傳算法[8]、進化技術(shù)、Petri網(wǎng)絡等的智能故障定位診斷。
以上這些方法雖然都取得了較為滿意的結(jié)果,但都存在診斷所依據(jù)的實時信息不完備或信息受畸變時產(chǎn)生錯誤的診斷 結(jié)論的情況。而粗糙集理論作為一種處理不精確、不一致、不完整等各種不完備的信息有效的工具,其較強的容錯能力使得它在電力系統(tǒng)中的應用發(fā)展[1,2]很快?;诖植诩膽醚芯縖3-6]主要集中在屬性約簡、規(guī)則獲取、基于粗糙集的計算智能算法研究等方面。由于屬性約簡是一個NP難問題,許多學者都進行了系統(tǒng)的研究。王國胤等人[6]從信息論的觀點出發(fā)對粗糙集理論的基本概念和運算進行分析,并基于此給出了基于條件信息熵對決策表進行屬性約簡的兩個算法——CEBARKNC和CEBARKCC,前者以所有條件屬性集為起點,自頂向下逐步去掉不必要的屬性,后者則是以決策表核屬性集為起點,自底向上逐步增加屬性。由于約簡算法普遍低效,特別是對于大規(guī)模數(shù)據(jù)集,因而開始有學者試圖運用粒計算的劃分模型[9]來進行屬性約簡算法的研究。
然而,傳統(tǒng)的粗糙集約簡方法都是基于單機進行的??紤]到屬性約簡具有很高得計算復雜度,傳統(tǒng)的基于單機的屬性約簡方法已經(jīng)不能滿足大規(guī)模數(shù)據(jù)的屬性約簡的需要[10]。幸運的是,當前基于MapReduce的并行計算平臺為大規(guī)模數(shù)據(jù)的智能化處理提供了一種可行的解決方案。Hadoop作為MapReduce的一個實現(xiàn)框架,基于分布式文件系統(tǒng)(HDFS),通過利用map和reduce函數(shù)可以將現(xiàn)有的集中式處理任務并行化地部署在多臺計算機節(jié)點上進行處理,可以大大提高計算效率。文中將基于Hadoop平臺,提出了一種并行屬性約簡算法和并行值約簡算法方法。通過一個具體算例,根據(jù)收集的故障信息所建立的決策表進行約簡,得到診斷決策規(guī)則,并將其作為實時故障診斷的依據(jù),從而實現(xiàn)配電網(wǎng)的故障診斷和定位。
由于粗糙集理論可以很好地處理因保護裝置和斷路器誤動作、信號傳輸誤碼而造成的錯誤或不完整的故障信號,形成魯棒性較強的電網(wǎng)故障診斷專家知識庫,所以將粗糙集應用于配電網(wǎng)故障診斷。通過決策表約簡提取出決策規(guī)則,依據(jù)決策規(guī)則能夠快速地根據(jù)故障區(qū)域判斷產(chǎn)生故障的元件,調(diào)度員及時做出決策消除故障,便于檢修和事故后的快速恢復,確保電力系統(tǒng)安全穩(wěn)定運行。本文設計的并行約簡的故障診斷(Parallel Reduction for Fault Diagnosis,簡稱為PRFD)。該診斷過程可分為 3個模塊,故障信息決策表(Fault Decision Table,簡稱FDT)的建立模塊,F(xiàn)DT約簡模塊,抽取診斷規(guī)則(Diagnosis Rules,簡稱DR)模塊以及故障診斷模塊[11]。
故障信息決策表(FDT)建立模塊主要用于建立初始故障信息表。從故障信息庫中提取故障記錄,判斷每條故障信息記錄中是否含有狀態(tài)缺失信息,若不含缺失信息,則將其加入故障信息庫,否則加入不完備知識庫。從故障信息庫讀取故障記錄時,只將各個元件狀態(tài)和故障發(fā)生位置屬性加入初始故障信息表,其他的相關(guān)信息在該系統(tǒng)中不考慮。
診斷規(guī)則(DR)提取模塊的主要功能是完成對初始故障信息表的約簡以及故障規(guī)則的提取,其中約簡部分又包括屬性約簡和值約簡,利用屬性約簡可以去掉故障信息表中冗余的屬性,而值約簡則用于刪除每條故障記錄中的冗余屬性值。診斷規(guī)則是從最終故障決策表中提取出來的,用于診斷實時故障。約簡后的最終故障決策表中每行記錄即為一條診斷規(guī)則,且每條診斷規(guī)則都不含冗余信息。
圖1 基于PRFD方法的診斷過程Fig.1 Diagnosis procedure based on PRFD
故障診斷模塊完成對實時故障進行故障定位和診斷。診斷規(guī)則庫建立后,從實際配電網(wǎng)使用過程中出現(xiàn)的故障可以根據(jù)診斷規(guī)則判斷哪些元件導致故障的發(fā)生。如若根據(jù)規(guī)則庫中的診斷規(guī)則無法進行判斷,此時將記錄下該故障發(fā)生時各個元件的狀態(tài)信息,并將該故障記錄轉(zhuǎn)入FDT建立模塊進行處理。該條記錄中若無缺失信息,則將其加入歷史故障數(shù)據(jù)庫,否則加入缺失信息庫。對于缺失信息庫中的記錄,如果可以根據(jù)診斷規(guī)則進行判斷,則將其刪除。
文中屬性約簡基于文獻[4]的思想,將并行計算融入粗糙集[12-13]的決策表約簡,具體并行屬性約簡的算法流程如圖2和圖3所示,其中假設參與計算的處理器的個數(shù)為K,并令第一個處理器P1為主處理器,故障屬性約簡集合記為R,待處理的屬性集記為Attr_left=CR。該約簡主要分為屬性擴張和屬性收縮兩個部分。
在屬性擴張階段,首先在主進程中計算屬性核CORED (C),令R的初始值為屬性核。然后將剩余的屬性Attr_left分為K組(S1,S2,…,SK)分配給K個進程同時處理,其中每組中的屬性個數(shù)相差不大于1,接下來在每個處理進程中,根據(jù)相對正域中元素的個數(shù)選擇出每個分組Si中必要的屬性Cselect_i,并將Cselect_i和POS{R∪Cselect_i}(D)發(fā)送給主進程,主進程再根據(jù)相對正域中元素的個數(shù)在各分進程提交的屬性中選擇出必要屬性Cselect,并更新R=R∪Cselect同時更新Attr_left,重復上述操作直至POSR(D)=POSC(D),然后進入屬性收縮階段。屬性擴張如圖2所示。
圖2 屬性擴張流程Fig.2 Procedure of attribute expansion
在屬性收縮階段中,主要對加入到R中的非核屬性進行處理,判斷它們相對于故障位置屬性是否是多余的。首先將R/CORED(C)中的各個屬性分別分配到K個進程中進行處理,分配完成后若還存在剩余的屬性,則等待下一批處理。在各個進程中判斷其分配到的屬性是否相對于故障位置屬性是多余的,若是,則將其發(fā)送給主進程,否則記為-1后發(fā)送給主進程;主進程將收到的多余屬性進行篩選,選出第一個多余屬性Cdelete,若Cdelete≠箒1,則更新R=R/Cdelete,再次判斷剩余的非核屬性中是否存在多余屬性;若Cdelete=箒1且所有非核屬性均已判斷,則R即為約簡后的屬性集;若Cdelete=箒1但尚存在未判斷的屬性,則將這些屬性分配到K個進程中按上述步驟進行處理。屬性收縮如圖3所示。
圖3 屬性收縮流程Fig.3 Procedure of attribute contraction
經(jīng)過以上并行屬性約簡和并行值約簡后得到的最終故障決策表中,所有屬性值均為該表的值核,所有記錄均為該故障信息表對應的診斷規(guī)則。本階段只需將每條記錄存儲于診斷規(guī)則庫中,作為對實時故障的診斷和定位的依據(jù)。此外,也要對診斷規(guī)則庫進行定期的更新,保證該系統(tǒng)的正確診斷率。
為驗證本文設計的PRFD系統(tǒng)的可用性和有效性,在該系統(tǒng)上運行UCI數(shù)據(jù)集進行測試,并與基于粗糙集傳統(tǒng)約簡算法的專家系統(tǒng)(RSES)進行比較。本文測試所用的標準測試數(shù)據(jù)集UCI是來自于加州大學歐文分校機器學習數(shù)據(jù)收集庫(http://archive.ics.uci.edu/ml/),本文選擇了其中的6個數(shù)據(jù)集作為實驗數(shù)據(jù),且測試的數(shù)據(jù)集的大小變化不等,以此測試系統(tǒng)在大數(shù)據(jù)集下的運行效率。某些數(shù)據(jù)集中可能含有缺失值,以此來測試該系統(tǒng)對不完整記錄的處理情況,這些數(shù)據(jù)集的具體特征如表1所示。
表1 數(shù)據(jù)集及其特征Tab.1 Data sets and their characteristics
文中設計的系統(tǒng)PRFD與傳統(tǒng)RSES系統(tǒng)的比較結(jié)果如下圖4和圖5所示。由圖4可知,當數(shù)據(jù)集的記錄個數(shù)小于1024時,得到最小約簡時兩個系統(tǒng)的運行時間相當,這是因為本文設計的PRFD系統(tǒng)中所使用的約簡算法的通信時間只與條件屬性個數(shù)有關(guān),當數(shù)據(jù)量較小時,其通信時間在整個約簡時間中所占的比例較大,然后當數(shù)據(jù)集中記錄個數(shù)足夠大時,該系統(tǒng)的優(yōu)勢越來越明顯,運行時間相比傳統(tǒng)的方法大大縮減,說明PRFD系統(tǒng)對大數(shù)據(jù)集仍具有一定的高效性。由圖5可以看出,當數(shù)據(jù)集不大時,兩個系統(tǒng)的準確率相當;且隨著記錄數(shù)目越來越大,系統(tǒng)的準確率都會有所下降,但相比RSES,PRFD系統(tǒng)的準確率較高,并且準確率下降的速度較緩,主要原因是在獲取決策規(guī)則的過程中,PRFD系統(tǒng)是根據(jù)當前的約簡結(jié)果來計算屬性重要性,屬于一種動態(tài)的貪心策略,能夠得到最優(yōu)或次優(yōu)的約簡結(jié)果,從而得到較為準確的診斷規(guī)則。
圖4 PRFD系統(tǒng)和RSES系統(tǒng)運行時間對比曲線Fig.4 Comparison of system uptime between PRFD and RSES
圖5 PRFD和RSES系統(tǒng)準確率對比曲線Fig.5 Comparison of system accuracy between PRFD and RSES
文中提出一種并行粗糙集約簡算法,通過屬性擴張和收縮,實現(xiàn)并行化處理。相關(guān)實驗仿真顯示,較傳統(tǒng)方法比較而言本文方法降低了數(shù)據(jù)約簡的執(zhí)行時間,而且也提高了約簡的準確率。文中方法復雜配電網(wǎng)絡的故障診斷提供了一種可行的解決方案。
[1]束洪春,孫向飛,于繼來.電力系統(tǒng)自動化粗糙集理論在電力系統(tǒng)中的應用[J].電力系統(tǒng)自動化,2004,28(3):90-95.
[2]孫秋野,張化光,戴瓂.基于改進粗糙集約簡算法的配電系統(tǒng)在線故障診斷[J].中國電機工程學報,2007,27(7):58-64.
[3]束洪春,孫向飛,司大軍.基于粗糙集理論的配電網(wǎng)故障診斷研究[J].中國電機工程學報,2001,2l(10):73-78.
[4]肖大偉,王國胤,胡峰.一種基于粗糙集理論的快速并行屬性約簡算法[J].計算機科學,2009,36(3):208-211.
[5]CHEN De-gang,ZHAO Su-yun,ZHANG Lei,et al.Sample pair selection for attribute reduction with rough set[J].IEEE Transactions on Knowledge and Data Engineering,2012,24 (11):2080-2093.
[6]王國胤,于洪,楊大春.基于條件信息熵的決策表約簡[J].計算機學報,2002,25(7):759-766.
[7]ZHU Yong-li,LU Jin-ling.Bayesian networks-based approach for power systems fault diagnosis[J].IEEE Transactions on Power Delivery,2006,21(2):634-639.
[8]LIN Xiang-ning,KE Shuo-hao.A fault diagnosis method of power systems based on improved objective function and genetic algorithm-tabu search[J].IEEE Transactions on Power Delivery,2010,25(3):1268-1274.
[9]劉清,劉群.粒及粒計算在邏輯推理中的應用[J].計算機研究與發(fā)展,2004,41(4):546-551.
[10]童曉陽,謝紅濤,孫明蔚.計及時序信息檢查的分層模糊Petri網(wǎng)電網(wǎng)故障診斷模型[J].電力系統(tǒng)自動化,2013,37 (6):63-68.
An RS parallel reduction based approach for distribution network fault diagnosis
WANG Xiao-hong
(Shaanxi Provincial Party School of the CPC,Xi’an 710061,China)
With the increasing demand of intelligent fault diagnosis of distribution network,an RS parallel reduction based approach is proposed in this paper in order to address the limitations of incomplete information processing in traditional expert systems.This approach computes relevant positive areas and core values of rough set in parallel.The experiment results show that our approach improves the accuracy of attributes reduction and reduces the performing time of executing reduction.Our approach has the significance to automatic generation of decision rules and classification and recognition of fault information.
distribution network;fault diagnosis;parallel reduction;rough set
TN302
A
1674-6236(2016)01-0181-03
2015-10-29稿件編號:201510219
國家自然科學基金項目(61372184)
王小紅(1975—),女,陜西寶雞人,講師。研究方向:數(shù)據(jù)挖掘與知識工程。