張延旭, 胡春潮, 黃 曙, 馮善強(qiáng), 林冠強(qiáng)
(1. 廣東電網(wǎng)有限責(zé)任公司電力科學(xué)研究院, 廣東省廣州市 510080; 2. 廣東電網(wǎng)有限責(zé)任公司惠州供電局, 廣東省惠州市 516000)
基于Apriori算法的二次設(shè)備缺陷數(shù)據(jù)挖掘與分析方法
張延旭1, 胡春潮1, 黃 曙1, 馮善強(qiáng)1, 林冠強(qiáng)2
(1. 廣東電網(wǎng)有限責(zé)任公司電力科學(xué)研究院, 廣東省廣州市 510080; 2. 廣東電網(wǎng)有限責(zé)任公司惠州供電局, 廣東省惠州市 516000)
為提升電力系統(tǒng)二次設(shè)備的運維和管控水平,從二次設(shè)備的缺陷數(shù)據(jù)出發(fā),提出了基于Apriori算法的二次設(shè)備缺陷數(shù)據(jù)挖掘與分析方法。首先,分析了關(guān)聯(lián)規(guī)則與Apriori算法的基本思路,然后建立了基于關(guān)聯(lián)規(guī)則的二次設(shè)備缺陷模型,在模型中考慮了二次設(shè)備缺陷的幾個重要屬性:二次設(shè)備的生產(chǎn)廠家、設(shè)備類型、設(shè)備缺陷的原因、發(fā)生缺陷的設(shè)備部位以及缺陷等級。進(jìn)一步,以一組自動化設(shè)備缺陷數(shù)據(jù)為例,闡述了基于Apriori算法的二次設(shè)備缺陷數(shù)據(jù)挖掘和分析方法,分析結(jié)果表明所提方法能夠用于尋找二次設(shè)備的薄弱環(huán)節(jié),并能夠找到誘發(fā)薄弱環(huán)節(jié)的原因,同時還具有分析設(shè)備家族性缺陷等功能。
二次設(shè)備; 關(guān)聯(lián)規(guī)則; 數(shù)據(jù)挖掘; Apriori算法
二次設(shè)備的可靠運行是電力系統(tǒng)安全穩(wěn)定的重要保障[1]。近年來,隨著經(jīng)濟(jì)的飛速發(fā)展,電網(wǎng)規(guī)模不斷擴(kuò)大,電網(wǎng)中二次設(shè)備的數(shù)量也發(fā)生了跨越式的增長,“設(shè)備多,人少”的矛盾給二次設(shè)備的運維人員帶來了相當(dāng)大的工作負(fù)擔(dān),同時也給電網(wǎng)運行帶來了風(fēng)險,二次設(shè)備的運維和管控水平亟待提高[2-4]。二次設(shè)備的運維人員在日常工作中會對所發(fā)現(xiàn)和處理的缺陷進(jìn)行記錄和歸檔,方便日后的查看、統(tǒng)計和分析[5]。這些二次設(shè)備缺陷數(shù)據(jù)中蘊含著大量的有用信息,對缺陷數(shù)據(jù)進(jìn)行挖掘和分析將對提升二次設(shè)備的運維和管控水平有著重要的意義。但當(dāng)前對于二次設(shè)備缺陷數(shù)據(jù)的挖掘和分析仍然缺乏理論性和系統(tǒng)性,主要體現(xiàn)在分析方法簡單,僅進(jìn)行簡單的分類和統(tǒng)計,對于數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系等重要特性并未涉及,分析結(jié)果對二次設(shè)備運維和管控的指導(dǎo)意義不大[6]。
當(dāng)前,數(shù)據(jù)挖掘已經(jīng)被應(yīng)用到電工領(lǐng)域的許多專業(yè)中去解決一些重要問題[7-10]。文獻(xiàn)[8]在多能源互補協(xié)調(diào)和“信息—物理—社會”系統(tǒng)深度融合的背景下探討了數(shù)據(jù)科學(xué)及其在能源互聯(lián)網(wǎng)中的應(yīng)用,分析了數(shù)據(jù)挖掘技術(shù)的新進(jìn)展,并對數(shù)據(jù)挖掘技術(shù)在能源系統(tǒng)中的應(yīng)用現(xiàn)狀進(jìn)行了回顧與展望。文獻(xiàn)[9]引入了聚類分析理論,從數(shù)據(jù)挖掘的角度對光伏出力進(jìn)行了建模,并將其用于含光伏發(fā)電的系統(tǒng)可靠性評估。文獻(xiàn)[10]采用數(shù)據(jù)挖掘和典型場景模擬思想,提出了一種新穎的基于混合聚類分析的網(wǎng)損評估方法。
但數(shù)據(jù)挖掘在二次系統(tǒng)分析中的運用并不多,主要側(cè)重于基于數(shù)據(jù)挖掘?qū)崿F(xiàn)對二次系統(tǒng)的狀態(tài)評價。文獻(xiàn)[11]將粗糙集與神經(jīng)網(wǎng)絡(luò)有效融合,設(shè)計了一套改進(jìn)算法用于將二次設(shè)備的基礎(chǔ)數(shù)據(jù)加工處理成狀態(tài)評價所需要的狀態(tài)量信息,文獻(xiàn)[12]采用數(shù)據(jù)挖掘技術(shù)研制出了一套保護(hù)設(shè)備故障信息管理與分析系統(tǒng),為實現(xiàn)繼電保護(hù)裝置的狀態(tài)檢修提供依據(jù),為分析處理電網(wǎng)故障提供決策支持。
本文提出了一種基于Apriori算法的二次設(shè)備缺陷數(shù)據(jù)挖掘與分析方法,分析了關(guān)聯(lián)規(guī)則與Apriori算法的基本思路,建立了基于關(guān)聯(lián)規(guī)則的二次設(shè)備缺陷模型,并以某電力公司自動化裝置的缺陷數(shù)據(jù)為例,闡述了基于Apriori算法的二次設(shè)備缺陷數(shù)據(jù)挖掘方法和基于數(shù)據(jù)挖掘結(jié)果的缺陷分析方法。
1.1 關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則(Association Rules)能夠反映事物與事物之間的相互依存性和關(guān)聯(lián)性。如果通過數(shù)據(jù)的挖掘能夠反映兩個或多個事物之間存在一定的關(guān)聯(lián)關(guān)系,就有助于進(jìn)一步分析事物與事物間的關(guān)聯(lián)機(jī)理,甚至可以通過其中一項事物的發(fā)生去預(yù)測其他事物的發(fā)生。
關(guān)聯(lián)規(guī)則的挖掘廣泛用于數(shù)據(jù)挖掘領(lǐng)域,最典型的應(yīng)用便是對客戶購物習(xí)慣的分析,在人們?nèi)粘>W(wǎng)購的過程中,常常被網(wǎng)站自動推送的“猜您喜歡”所吸引,這便是關(guān)聯(lián)規(guī)則的挖掘給商家和客戶所帶來的利益與便捷。
關(guān)聯(lián)規(guī)則所涉及的一個事物被稱為一個項目(Item),由不同的項目構(gòu)成的集合成為項集I(Itemset),其元素個數(shù)稱為項集的長度,長度為k的項集稱為k-項集(k-Itemset)。被用于關(guān)聯(lián)規(guī)則挖掘的樣本集Y是項集的一個子集,即Y?I,樣本的全體構(gòu)成了樣本數(shù)據(jù)庫D。
評價一條關(guān)聯(lián)規(guī)則的好壞有兩個關(guān)鍵指標(biāo):支持度(Support)和置信度(Confidence)。支持度表示某規(guī)則有多大可能性發(fā)生,置信度表示某規(guī)則有多大程度值得信賴。
對于一個項集I的2個子項集A和B(B?I,A?I,且A∩B=?)而言,兩者的關(guān)聯(lián)規(guī)則R可以表示為:
R:A?B
(1)
用count(A)來表示樣本集Y中包含A的樣本數(shù)量,用count(B)來表示樣本集Y中包含B的樣本數(shù)量,則項集A的支持度為:
(2)
規(guī)則R的支持度為:
(3)
規(guī)則R的置信度為:
(4)
關(guān)聯(lián)規(guī)則的最小支持度記為Ssupmin,它用于衡量規(guī)則需要滿足的最低重要性,關(guān)聯(lián)規(guī)則的最小置信度記為Cconfmin,它表示關(guān)聯(lián)規(guī)則需要滿足的最低可靠性。如果規(guī)則R滿足support(R)≥Ssupmin且confidence(R)≥Cconfmin,則稱關(guān)聯(lián)規(guī)則R為強(qiáng)關(guān)聯(lián)規(guī)則,強(qiáng)關(guān)聯(lián)規(guī)則對于指導(dǎo)實際決策具有建設(shè)性的意義[13]。
1.2 Apriori算法
Apriori算法是關(guān)聯(lián)規(guī)則挖掘中最常用的數(shù)據(jù)挖掘算法之一。其核心思想是通過候選集生成和向下封閉檢測來尋找頻繁項集,即利用逐層搜索的迭代方法,利用“K-1項集”來搜索“K項集”。數(shù)據(jù)挖掘過程主要可以分為以下2步。
1)通過迭代,檢索出樣本中的所有頻繁項集,即支持度不低于用戶設(shè)定的最小支持度的項集。
2)通過比較頻繁項集的置信度和最小置信度,確定強(qiáng)關(guān)聯(lián)規(guī)則。
利用Apriori算法進(jìn)行數(shù)據(jù)挖掘時需要用到2個重要的Apriori算法性質(zhì)。
性質(zhì)1:頻繁項集的子集必為頻繁項集,例如假設(shè)項集{A,B}是頻繁項集,則{A}和{B}也為頻繁項集。
性質(zhì)2:非頻繁項集的超集一定是非頻繁的,例如假設(shè)項集{A}不是頻繁項集,則{A,B}和{A,C}也不是頻繁項集。
基于這2個重要性質(zhì),在實際操作中,首先在初始候選項集中基于最小支持度找出頻繁“1項集”的集合,該集合記作L1。再基于最小支持度并利用L1頻繁搜索“2項集”的集合L2,而L2用于搜索L3。如此下去,直到不能找到“K項集”,搜索每個LK都需要一次數(shù)據(jù)庫掃描[14]。
為提高設(shè)備缺陷的管理水平,實現(xiàn)設(shè)備缺陷的及時處理和日后分析,當(dāng)前電力公司的設(shè)備巡檢人員在發(fā)現(xiàn)設(shè)備異常時,都應(yīng)及時將缺陷信息錄入生產(chǎn)系統(tǒng),生產(chǎn)系統(tǒng)中管理著歷年各設(shè)備的缺陷信息,信息量巨大。每一項錄入的缺陷涉及多方面的信息子項,這些信息子項主要可以分為3類。
1)與出現(xiàn)缺陷的二次設(shè)備本身緊密相關(guān)的信息,如設(shè)備的生產(chǎn)廠家、設(shè)備類型、設(shè)備型號、設(shè)備的投運時間、發(fā)生缺陷的二次設(shè)備部位等。
2)針對缺陷的簡要評價信息,如缺陷的級別和缺陷的主要原因等。
3)針對缺陷事件本身的發(fā)現(xiàn)、處理等流程性的信息,如發(fā)現(xiàn)缺陷的時間、處理的時間和所涉及的專業(yè)等。
其中,前2類信息主要用于缺陷的事后分析,而第3類更偏向于缺陷的管理。本文針對前2類信息,并考慮部分類型的信息之間存在冗余關(guān)系,提取出二次設(shè)備的生產(chǎn)廠家、二次設(shè)備型號、二次設(shè)備缺陷的原因、發(fā)生缺陷的設(shè)備部位以及缺陷等級等5項重要信息作為數(shù)據(jù)挖掘和缺陷分析的對象。
在數(shù)據(jù)挖掘中考慮二次設(shè)備的生產(chǎn)廠家與設(shè)備類型能有助于分析二次設(shè)備的共性問題和家族性缺陷;考慮二次設(shè)備缺陷原因和缺陷發(fā)生部位有助于分析設(shè)備的薄弱環(huán)節(jié),為設(shè)計、調(diào)試和檢修等提供建設(shè)性的參考依據(jù);考慮缺陷的嚴(yán)重程度能夠給不同的缺陷樣本提供客觀的區(qū)分度。
構(gòu)建關(guān)聯(lián)規(guī)則項集Q,用于表示二次設(shè)備的缺陷集,如式(5)所示。
Q=(F,N,R,P,L)
(5)
式中:F,N,R,P,L分別為代表不同缺陷類別信息的向量,向量F表示二次設(shè)備的生產(chǎn)廠家,向量N表示二次設(shè)備類型,向量R代表二次設(shè)備缺陷的原因,向量P代表二次設(shè)備發(fā)生缺陷的部位,向量L表示缺陷的等級。
二次設(shè)備的缺陷原因多種多樣,主要包括參數(shù)設(shè)置錯誤、產(chǎn)品設(shè)計問題(如不滿足設(shè)計要求、不滿足反措要求等)、產(chǎn)品質(zhì)量問題(如工藝、原材料或品控等)、超期服役、接觸不良、施工不滿足要求、未按要求進(jìn)行驗收以及強(qiáng)電場作用等。二次設(shè)備可能發(fā)生缺陷的部位包括程序固件、電源模塊、功能插板、二次回路以及顯示器等。缺陷的級別分為3個層次:一般、重大和緊急。
可見,每一個缺陷樣本都是由這5類缺陷信息構(gòu)建的五維空間上的一個點,通過Apriori算法挖掘最多可能獲得頻繁“5項集”。假設(shè)二次設(shè)備共有n個廠家、m個類型、p個缺陷原因、q個缺陷部位以及3個缺陷級別,則初始候選項集共包含有總數(shù)為n+m+p+q+3個項,在此基礎(chǔ)上基于Apriori算法進(jìn)行頻繁項集的篩選以及關(guān)聯(lián)規(guī)則的挖掘。
從生產(chǎn)系統(tǒng)中導(dǎo)出某電力公司某年度一整年的自動化裝置缺陷數(shù)據(jù),以此缺陷數(shù)據(jù)為例,基于Apriori算法對自動化裝置的缺陷數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則挖掘,并針對所獲得的關(guān)聯(lián)規(guī)則進(jìn)行進(jìn)一步分析,以得出對實際生產(chǎn)有指導(dǎo)意義的結(jié)果。
3.1 樣本的基本信息
對該電力公司某年度自動化裝置的缺陷數(shù)據(jù)進(jìn)行簡單清理后,共獲得1 377條樣本。樣本中,設(shè)備的生產(chǎn)廠家共有96家,設(shè)備共包括工作站、測控、時間同步設(shè)備和交換機(jī)等11類,設(shè)備缺陷原因包括接觸不良、超期服役、產(chǎn)品設(shè)計問題和產(chǎn)品質(zhì)量問題等13類,設(shè)備缺陷發(fā)生部位包括程序固件、功能插件和電源模塊等20類,缺陷嚴(yán)重程度包括一般、重大和緊急3類。
3.2 頻繁集搜索與強(qiáng)關(guān)聯(lián)規(guī)則的關(guān)系確定
由于樣本數(shù)較大,而各類型樣本數(shù)所占比例就相對較低,因此,設(shè)置Apriori算法計算的支持度為1.5%,同時設(shè)置置信度為60%,則本文樣本經(jīng)過Apriori算法挖掘后所得到的頻繁“1項集”為41項,頻繁“2項集”為139項,頻繁“3項集”為112項,頻繁“4項集”為24項以及頻繁“5項集”為1項。經(jīng)過篩選,得出對于分析二次系統(tǒng)缺陷比較有參考意義的關(guān)聯(lián)規(guī)則21項,如表1所示。
3.3 基于強(qiáng)關(guān)聯(lián)規(guī)則的缺陷分析
對表1所示的強(qiáng)關(guān)聯(lián)規(guī)則的分析如下。
1)為了便于分析缺陷數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,可以基于強(qiáng)關(guān)聯(lián)規(guī)則繪制缺陷數(shù)據(jù)的關(guān)聯(lián)關(guān)系圖,如根據(jù)表1中的關(guān)聯(lián)規(guī)則1至4能夠繪制如圖1所示的關(guān)聯(lián)關(guān)系圖。在關(guān)聯(lián)關(guān)系圖中,對部分有重疊的關(guān)聯(lián)規(guī)則進(jìn)行了合并,括號內(nèi)的數(shù)值為支持度和置信度。
由圖1可知,廠家A所生產(chǎn)的工作站發(fā)生缺陷的原因較為集中,主要體現(xiàn)在超期服役和接觸不良兩個方面。因此,為了提高廠家A所生產(chǎn)的工作站的運行可靠性,應(yīng)在設(shè)備生產(chǎn)制造中提高設(shè)備相關(guān)元器件的制造工藝和質(zhì)量,降低接觸不良發(fā)生的概率,同時嚴(yán)格控制工作站的服役時間,并在設(shè)備運維方面,針對服役時間較長的工作站增加巡維的力度。
表1 基于頻繁項集的強(qiáng)關(guān)聯(lián)規(guī)則Table 1 Strong association rules based on frequent sets
圖1 強(qiáng)關(guān)聯(lián)規(guī)則關(guān)聯(lián)關(guān)系Fig.1 Relationship of strong association rules
可見,這一類關(guān)聯(lián)規(guī)則能夠幫助深入分析特定廠家二次設(shè)備的缺陷原因,為相關(guān)設(shè)備的生產(chǎn)制造和運維策略都提供支撐。
2)綜合關(guān)聯(lián)規(guī)則2,5,6可以看出,廠家A,B,D所生產(chǎn)的工作站的程序固件問題比較突出,而根據(jù)關(guān)聯(lián)規(guī)則7可知,工作站所發(fā)生的程序固件問題,有相當(dāng)一部分都與不滿足標(biāo)準(zhǔn)要求相關(guān),置信度高達(dá)85%。同時,根據(jù)關(guān)聯(lián)規(guī)則8可知,工作站的程序固件缺陷也與產(chǎn)品的設(shè)計問題有一定的關(guān)聯(lián)關(guān)系。因此,為了提升工作站的運行可靠性,應(yīng)在廠家A,B,D的制造、出廠和現(xiàn)場驗收等環(huán)節(jié)的標(biāo)準(zhǔn)規(guī)范性上對其工作站的程序固件進(jìn)行有針對性的管控,另一方面,提高程序固件的設(shè)計合理性,以降低其程序固件出錯的概率。
可見,根據(jù)強(qiáng)關(guān)聯(lián)規(guī)則,能夠在一定程度上體現(xiàn)二次設(shè)備的家族性缺陷,同時也有助于分析家族性缺陷的原因,為設(shè)備的生產(chǎn)和驗收等提供有針對性的參考依據(jù)。
3)由強(qiáng)關(guān)聯(lián)規(guī)則9至11可知,廠家C和廠家D的測控存在超期服役的問題較為突出,同時,廠家D的測控存在接觸不良的問題較為突出。而通過關(guān)聯(lián)規(guī)則12和13可知,測控裝置的超期服役問題很大程度上體現(xiàn)在了電源模塊的缺陷,而接觸不良問題很大程度上體現(xiàn)在了輔助元器件的缺陷,置信度分別達(dá)到73%和62%??梢?解決廠家C和廠家D測控超期服役的問題,主要應(yīng)從提升其電源模塊的可靠性入手,在設(shè)計和制造上提升其質(zhì)量,在運維層面加強(qiáng)對其的巡維力度。
而解決廠家D測控接觸不良的問題,應(yīng)重點針對其輔助元器件的質(zhì)量進(jìn)行改進(jìn),通過強(qiáng)關(guān)聯(lián)規(guī)則14也驗證了這一點。針對測控裝置接觸不良問題提出解決方案有助于整體提升電力系統(tǒng)監(jiān)控功能的可靠性。
4)由強(qiáng)關(guān)聯(lián)規(guī)則15可知,對于廠家E所生產(chǎn)的測控裝置而言,程序固件問題是其家族性缺陷,更應(yīng)該值得注意的是,關(guān)聯(lián)規(guī)則16指出,測控裝置的程序固件缺陷很大程度上屬于重大缺陷,對電力系統(tǒng)穩(wěn)定運行的威脅較大。因此,為提高測控裝置的可靠性,應(yīng)重點針對廠家E的程序固件提出管控措施,從程序的設(shè)計、編寫和出廠以及現(xiàn)場驗收等環(huán)節(jié)對其進(jìn)行嚴(yán)格把關(guān),有利于降低測控裝置故障率,提高電網(wǎng)遙信、遙測信息的可靠性以及遙控功能的可依賴性。
5)由強(qiáng)關(guān)聯(lián)規(guī)則17至19可知,功能插件是交換機(jī)的薄弱環(huán)節(jié),而超期服役是交換機(jī)功能插件缺陷的主要原因,更應(yīng)該值得注意的是,關(guān)聯(lián)規(guī)則19指出,交換機(jī)的功能插件缺陷很大程度上屬于重大缺陷,對電力系統(tǒng)穩(wěn)定運行的威脅較大。因此,為提升交換機(jī)的運行可靠性,應(yīng)針對服役時間較長的交換機(jī)進(jìn)行有針對性的巡維,并及時更換超期服役的功能插件。
6)此外,根據(jù)強(qiáng)關(guān)聯(lián)規(guī)則20和21可知,時間同步設(shè)備的薄弱環(huán)節(jié)是其功能插件,而二次回路也是測控裝置的薄弱環(huán)節(jié)之一。因此,為了提升測控裝置和時間同步設(shè)備的運行可靠性,應(yīng)針對薄弱環(huán)節(jié),在設(shè)計、生產(chǎn)和運維中有相應(yīng)的側(cè)重。
本文基于Apriori算法對二次設(shè)備缺陷數(shù)據(jù)挖掘與分析方法進(jìn)行了研究,并以算例分析的方式將該方法應(yīng)用到某電力公司自動化裝置的缺陷數(shù)據(jù)挖掘和分析中。通過分析缺陷數(shù)據(jù)挖掘的結(jié)果,得到如下結(jié)論。
1)該方法能夠有效分析二次設(shè)備的薄弱環(huán)節(jié),并能夠找到誘發(fā)薄弱環(huán)節(jié)的原因,給二次設(shè)備運維和管控提供參考依據(jù)。
2)該方法能分析出二次設(shè)備生產(chǎn)廠家的家族性缺陷,對同一廠家的設(shè)備驗收和運維具有指導(dǎo)意義。
3)該方法能夠分析各廠家在生產(chǎn)設(shè)備時存在的問題,使得設(shè)備質(zhì)量的改進(jìn)方案更加具有針對性。
但由于從生產(chǎn)系統(tǒng)中導(dǎo)出的設(shè)備缺陷數(shù)據(jù)在描述同一對象時存在一些表述上的差異或信息殘缺,因此,在對設(shè)備缺陷進(jìn)行分析之前需要進(jìn)行數(shù)據(jù)清理。但當(dāng)前本文主要采用人工數(shù)據(jù)清理的方式,雖然生產(chǎn)系統(tǒng)中管理著海量的設(shè)備缺陷信息,但由于數(shù)據(jù)清理的效率低,一定程度上限制了本文方法對于海量缺陷數(shù)據(jù)的分析能力。在下一步工作中,將著手解決數(shù)據(jù)清理的效率問題,屆時將本文方法應(yīng)用于分析生產(chǎn)管理系統(tǒng)中的海量數(shù)據(jù),以期獲得對電力系統(tǒng)安全穩(wěn)定運行更加有意義的結(jié)論。
[1] 郭創(chuàng)新,陸海波,俞斌,等.電力二次系統(tǒng)安全風(fēng)險評估研究綜述[J].電網(wǎng)技術(shù),2013,37(1):112-118.
GUO Chuangxin, LU Haibo, YU Bin, et al. A survey of research on security risk assessment of secondary system[J]. Power System Technology, 2013, 37(1): 112-118.
[2] 曹楠,王芝茗,李剛,等.智能變電站二次系統(tǒng)動態(tài)重構(gòu)初探[J].電力系統(tǒng)自動化,2014,38(5):113-121.DOI:10.7500/AEPS20130518007.
CAO Nan, WANG Zhiming, LI Gang, et al. Study on dynamic reconfiguration in secondary system of intelligent substation[J]. Automation of Electric Power Systems, 2014, 38(5): 113-121. DOI: 10.7500/AEPS20130518007.
[3] 袁浩,屈剛,莊衛(wèi)金,等.電網(wǎng)二次設(shè)備狀態(tài)監(jiān)測內(nèi)容探討[J].電力系統(tǒng)自動化,2014,38(12):100-106.DOI:10.7500/AEPS201210277.
YUAN Hao, QU Gang, ZHUANG Weijin, et al. Discussion on condition monitoring contents of secondary equipment in power grid[J]. Automation of Electric Power Systems, 2014, 38(12): 100-106. DOI: 10.7500/AEPS201210277.
[4] 王冬青,李剛,曹楠.智能變電站保護(hù)功能自動校驗研究[J].電網(wǎng)技術(shù),2012,36(1):7-11.
WANG Dongqing, LI Gang, CAO Nan. Research on automatic checking of protection functions for smart substation[J]. Power System Technology, 2012, 36(1): 7-11.
[5] 雷立超,高山,徐芳.水電廠二次設(shè)備檢修維護(hù)中缺陷分析處理的常用方法[J].水電與新能源,2016(8):35-37.
LEI Lichao, GAO Shan, XU Fang. Defect analysis and treatment in the maintenance of the secondary equipment in hydropower plants[J]. Hydropower and New Energy, 2016(8): 35-37.
[6] 宮宇,呂金壯.大數(shù)據(jù)挖掘分析在電力設(shè)備狀態(tài)評估中的應(yīng)用[J].南方電網(wǎng)技術(shù),2014,8(6):74-77.
GONG Yu, Lü Jinzhuang. Application of big data mining analysis in power equipment state assessment[J]. Southern Power System Technology, 2014, 8(6): 74-77.
[7] 馬瑞,周謝,彭舟,等.考慮氣溫因素的負(fù)荷特性統(tǒng)計指標(biāo)關(guān)聯(lián)特征數(shù)據(jù)挖掘[J].中國電機(jī)工程學(xué)報,2015,35(1):43-51.
MA Rui, ZHOU Xie, PENG Zhou, et al. Data mining on correlation feature of load characteristics statistical indexes considering temperature[J]. Proceedings of the CSEE, 2015, 35(1): 43-51.
[8] 趙俊華,董朝陽,文福拴,等.面向能源系統(tǒng)的數(shù)據(jù)科學(xué):理論、技術(shù)與展望[J].電力系統(tǒng)自動化,2017,41(4):1-11.DOI:10.7500/AEPS20160813002.
ZHAO Junhua, DONG Zhaoyang, WEN Fushuan, et al. Data science for energy systems: theory, techniques and prospect[J]. Automation of Electric Power Systems, 2017, 41(4): 1-11. DOI: 10.7500/AEPS20160813002.
[9] 郭一飛,高厚磊,田佳.引入聚類分析的光伏出力建模及其在可靠性評估中的應(yīng)用[J].電力系統(tǒng)自動化,2016,40(23):93-100.DOI:10.7500/AEPS20160301008.
GUO Yifei, GAO Houlei, TIAN Jia. Photovoltaic output modeling by introducing clustering analysis and its application in reliability evaluation[J]. Automation of Electric Power Systems, 2016, 40(23): 93-100. DOI: 10.7500/AEPS20160301008.
[10] 李昀昊,王建學(xué),王秀麗.基于混合聚類分析的電力系統(tǒng)網(wǎng)損評估方法[J].電力系統(tǒng)自動化,2016,40(1):60-65.DOI:10.7500/AEPS20150119008.
LI Yunhao, WANG Jianxue, WANG Xiuli. A power system network loss evaluation method based on hybrid clustering analysis[J]. Automation of Electric Power Systems, 2016, 40(1): 60-65. DOI: 10.7500/AEPS20150119008.
[11] 王師霜.二次設(shè)備狀態(tài)評價數(shù)據(jù)挖掘技術(shù)的研究與應(yīng)用[D].保定:華北電力大學(xué),2013.
[12] 李勛,龔慶武,楊群瑛,等.基于數(shù)據(jù)挖掘技術(shù)的保護(hù)設(shè)備故障信息管理與分析系統(tǒng)[J].電力自動化設(shè)備,2011,31(9):88-91.
LI Xun, GONG Qingwu, YANG Qunying, et al. Fault information management and analysis system based on data mining technology for relay protection devices[J]. Electric Power Automation Equipment, 2011, 31(9): 88-91.
[13] 趙洪英,蔡樂才,李先杰.關(guān)聯(lián)規(guī)則挖掘的Apriori算法綜述[J].四川理工學(xué)院學(xué)報(自然科學(xué)版),2011,24(1):66-70.
ZHAO Hongying, CAI Lecai, LI Xianjie. Overview of association rules Apriori mining algorithm[J]. Journal of Sichuan University of Science & Engineering (Natural Sicence Edition), 2011, 24(1): 66-70.
[14] 崔貫勛,李梁,王柯柯,等.關(guān)聯(lián)規(guī)則挖掘中Apriori算法的研究與改進(jìn)[J].計算機(jī)應(yīng)用,2010,30(11):2952-2955.
CUI Guanxun, LI Liang, WANG Keke, et al. Research and improvement on Apriori algorithm of association rule mining[J]. Journal of Computer Applications, 2010, 30(11): 2952-2955.
Apriori Algorithm Based Data Mining and Analysis Method for Secondary Device Defects
ZHANGYanxu1,HUChunchao1,HUANGShu1,FENGShanqiang1,LINGuanqiang2
(1. Electric Power Research Institute of Guangdong Power Grid Co. Ltd., Guangzhou 510080, China; 2. Huizhou Power Supply Bureau of Guangdong Power Grid Co. Ltd., Huizhou 516000, China)
To enhance the maintenance and management level of secondary devices in the power system, a data mining and analysing method for secondary device defects based on the Apriori algorithm is proposed. Firstly, the basic ideas of association rules and Apriori algorithm are analyzed. Then a secondary defect model based on association rules is proposed, in which several important properties of secondary equipment defects (including secondary equipment manufacturer, device type, causes of device defects, position of device defect and defect levels) are taken into account. Furthermore, by taking the defect data of automation equipment as examples, the defect data mining and analyzing method based on data mining results are presented. Analysis results show that the proposed method is able to search for the weaknesses of secondary devices and the causes of weaknesses, while enunciating the family defects of devices.
secondary device; association rule; data mining; Apriori algorithm
2017-03-06;
2017-06-09。
上網(wǎng)日期: 2017-08-04。
張延旭(1988—),男,通信作者,博士,工程師,主要研究方向:電力系統(tǒng)保護(hù)、控制及其自動化。E-mail: 13560121482@139.com
胡春潮(1984—),男,碩士,工程師,主要研究方向:繼電保護(hù)和智能變電站。E-mail: huchunchao@139.com
黃 曙(1979—),男,碩士,教授級高級工程師,主要研究方向:智能變電站新技術(shù)。
(編輯 蔡靜雯)
( continued on page 163)( continuedfrompage151)