林 斌,曾 瑛,李星南,陳文偉,羅 云
(1.廣東電網(wǎng)電力調(diào)度控制中心 廣東 廣州 510600;2.四川創(chuàng)立信息科技有限責(zé)任公司 四川 成都610093)
基于近鄰傳播聚類的電力通信告警分析方法
林 斌1,曾 瑛1,李星南1,陳文偉2,羅 云2
(1.廣東電網(wǎng)電力調(diào)度控制中心 廣東 廣州 510600;2.四川創(chuàng)立信息科技有限責(zé)任公司 四川 成都610093)
在電力通信告警相關(guān)性分析中,往往需要將原始告警數(shù)據(jù)庫(kù)轉(zhuǎn)化為事務(wù)型數(shù)據(jù)庫(kù),針對(duì)傳統(tǒng)均勻滑動(dòng)時(shí)間窗口提取告警事務(wù)效率低的問題,文中提出一種基于近鄰傳播聚類的滑動(dòng)時(shí)間窗口法,通過將近鄰傳播聚類算法應(yīng)用于告警數(shù)據(jù)預(yù)處理過程中,將原始告警數(shù)據(jù)轉(zhuǎn)化成能夠用于滑動(dòng)時(shí)間窗口法處理的若干時(shí)間段。實(shí)驗(yàn)證明,基于近鄰傳播聚類的滑動(dòng)時(shí)間窗口法具有更高的事務(wù)提取效率,解決了固定時(shí)間段劃分方法的不合理性,有利于告警相關(guān)性分析,在告警事務(wù)提取中具有更廣泛的應(yīng)用前景。
告警事務(wù);關(guān)聯(lián)分析;近鄰傳播聚類;時(shí)間窗口;滑動(dòng)步長(zhǎng)
滑動(dòng)時(shí)間窗口法解決了原始告警數(shù)據(jù)中的時(shí)間非同步性,將告警數(shù)據(jù)庫(kù)轉(zhuǎn)化為告警事務(wù)數(shù)據(jù)庫(kù),并且滑動(dòng)步長(zhǎng)的設(shè)置能夠完全將全部的告警信息轉(zhuǎn)化為告警事務(wù)。滑動(dòng)時(shí)間窗口法的設(shè)計(jì)對(duì)告警事務(wù)提取至關(guān)重要,目前已有的滑動(dòng)時(shí)間窗口法大部分是均勻時(shí)間窗口法[5],即設(shè)定固定的窗口寬度和滑動(dòng)步長(zhǎng),其值大部分由實(shí)驗(yàn)和經(jīng)驗(yàn)值所得。這種方法簡(jiǎn)單易行,然而電力系統(tǒng)中故障可能隨時(shí)發(fā)生,因此告警序列具有突發(fā)性,告警序列中可能有很長(zhǎng)時(shí)間里沒有告警發(fā)生,假如采取固定時(shí)間窗口和滑動(dòng)步長(zhǎng)進(jìn)行告警事務(wù)的提取將會(huì)出現(xiàn)大量的空告警事務(wù),這樣不僅導(dǎo)致提取事務(wù)效率低,且耗費(fèi)一定的時(shí)間和空間資源。文獻(xiàn)[6]提出了一種基于雙約束滑動(dòng)時(shí)間窗來(lái)提取告警事務(wù)的方法,該方法將時(shí)間段劃分為多個(gè)子時(shí)間段,各子時(shí)間段段內(nèi)差異最小和段間差異最大,因此提高了提取事務(wù)的效率,然而該方法的計(jì)算量較大,并且需要事先指定劃分的時(shí)間段數(shù)目,但告警序列具有數(shù)據(jù)量大、分布不確定等特點(diǎn),因此確定時(shí)間段的數(shù)目比較困難。
文中設(shè)計(jì)了一種基于近鄰傳播聚類的滑動(dòng)時(shí)間窗口法,主要思想是根據(jù)近鄰傳播聚類算法將告警序列劃分成若干相對(duì)集中而獨(dú)立的子告警時(shí)間段,然后對(duì)時(shí)間段設(shè)定合適的窗口寬度和滑動(dòng)步長(zhǎng),以提高告警事務(wù)提取效率,該方法無(wú)需事先確定劃分時(shí)間段的數(shù)目,劃分時(shí)間段效率高且穩(wěn)定性好。變化的窗口寬度和滑動(dòng)步長(zhǎng)根據(jù)告警的實(shí)際情況設(shè)定,具有更好的靈活性,時(shí)間和空間資源利用率較高。
數(shù)據(jù)挖掘中的聚類算法是一種有效的數(shù)據(jù)分析方法,其目的是把大量的數(shù)據(jù)對(duì)象分成若干類,使得每個(gè)類中的數(shù)據(jù)之間最大程度地相似,而不同類中的數(shù)據(jù)對(duì)象最大程度地不同。告警序列是按時(shí)間順序采集的,時(shí)間間隔小的告警數(shù)據(jù)間的關(guān)聯(lián)性較大,因此,找出發(fā)生時(shí)間密集的告警子序列對(duì)提取告警事務(wù)有很大的影響,利用聚類的方法可以解決這一問題:將告警序列劃分成若干時(shí)間段,同一時(shí)間段中的告警數(shù)據(jù)彼此相似,與其他時(shí)間段中的告警數(shù)據(jù)差別較大,說明同一時(shí)間段內(nèi)的告警數(shù)據(jù)間的相關(guān)性較大,然后利用滑動(dòng)時(shí)間窗口法將每個(gè)時(shí)間段的告警數(shù)據(jù)轉(zhuǎn)化成告警事務(wù)。
在提取告警事務(wù)的過程中,滑動(dòng)時(shí)間窗口法需要設(shè)置一定的時(shí)間窗口,同一時(shí)間窗口發(fā)生的告警認(rèn)為是同時(shí)發(fā)生的,每個(gè)窗口的所有告警看作一個(gè)告警事務(wù),即將告警數(shù)據(jù)庫(kù)轉(zhuǎn)化為事務(wù)數(shù)據(jù)庫(kù);在同一窗口內(nèi)連續(xù)出現(xiàn)的告警可以記為同一告警,以消除告警冗余,因?yàn)橥粋€(gè)告警有可能被互聯(lián)的網(wǎng)絡(luò)設(shè)備同時(shí)檢測(cè)到。
定義1滑動(dòng)時(shí)間窗。令告警事件集為E,告警序列為V,一般情況下V是時(shí)間遞增序列V=(e1,t1),(e2,t2),…,(en,tn),ei∈E,Tb≤ti≤Te,i=1,…,n,Tb為告警序列的起始時(shí)間,Te為結(jié)束時(shí)間,子序列Vw={w,tb,te}稱為告警序列V的一個(gè)時(shí)間窗口,其中稱為窗口寬度,記為W。
定義2滑動(dòng)步長(zhǎng)。假設(shè)告警序列當(dāng)前窗口的起始和結(jié)束時(shí)間分別為Ti和Tj,設(shè)置滑動(dòng)步長(zhǎng)為s,則新窗口的起始和結(jié)束時(shí)間分別為Ti+s和Tj+s。
定義3告警情景發(fā)生的最大間隔和最小間隔。假設(shè)一個(gè)遞增的告警序列為(C,t1),(C,t2),(D,t3),(D,t4),其中時(shí)間點(diǎn)t1<t2<t3<t4,對(duì)于告警情景CD來(lái)說,t4-t1為最大間隔;t3-t2為最小間隔。
SAP系統(tǒng)技術(shù)的引進(jìn)和發(fā)展,成為了企業(yè)之間競(jìng)爭(zhēng)和邁向國(guó)際化的重要手段。SAP系統(tǒng)以其卓越的技術(shù)設(shè)計(jì),極大地滿足了現(xiàn)代資源管理發(fā)展的需要。我們?cè)趹?yīng)用此技術(shù)的同時(shí)也要對(duì)它的不足改進(jìn),完善企業(yè)資源管理系統(tǒng)。
告警時(shí)間序列是一組分布不均勻的離散數(shù)據(jù)點(diǎn),相關(guān)性強(qiáng)的數(shù)據(jù)總是比較頻繁的出現(xiàn)在同一時(shí)間段內(nèi),如果將這些在時(shí)間上相似性比較大的時(shí)間段找出來(lái),然后分別設(shè)定不同的窗口寬度和滑動(dòng)步長(zhǎng),就可以有效地提高事務(wù)型數(shù)據(jù)庫(kù)的生成效率和關(guān)聯(lián)規(guī)則的挖掘效率。近鄰傳播聚類是以找到數(shù)據(jù)對(duì)象中最優(yōu)的類代表點(diǎn)的集合為目標(biāo),每個(gè)集合中各個(gè)數(shù)據(jù)點(diǎn)之間彼此相似性較高,在告警序列劃分時(shí)間段中具有較高的穩(wěn)定性和自適應(yīng)性。
2.1近鄰傳播聚類算法
算法開始將告警時(shí)間序列中發(fā)生告警的時(shí)間點(diǎn)轉(zhuǎn)化為二維的樣本點(diǎn),然后計(jì)算樣本點(diǎn)之間的相似度作為該算法的輸入,輸出的聚類結(jié)果為多個(gè)相對(duì)集中的子時(shí)間序列及所劃分子時(shí)間序列中告警事件的聚類中心。在告警序列上進(jìn)行聚類分析,每個(gè)數(shù)據(jù)對(duì)象均為告警信息,通過傳遞每個(gè)數(shù)據(jù)對(duì)象之間的吸引度和歸屬度,形成的每一個(gè)類為一個(gè)相關(guān)性較大的時(shí)間段。
在本文中,根據(jù)近鄰傳播聚類算法[8]的思想,將所有樣本點(diǎn)看作潛在的聚類中心,使得聚類結(jié)果不受初始聚類中心選擇的影響,具有更高的魯棒性。該算法充分利用吸引度信息和歸屬度信息交替更新的過程,傳遞的信息以相似度矩陣為基礎(chǔ)。具體信息傳播過程如圖1所示,實(shí)線傳遞歸屬度信息a (i,k),虛線傳遞吸引度信息r(i,k)。
圖1 信息傳播過程
吸引度信息r(i,k)為從點(diǎn)xi發(fā)送到候選聚類中心xk的信息,表示xk作為xi的類代表點(diǎn)的適合程度,反映了xk適合作為xi聚類中心積累的相似度證據(jù)。歸屬度信息a(i,k)為從候選聚類中心xk發(fā)送到點(diǎn)xk的信息,表示xi選擇xk作為類代表點(diǎn)的合適程度,反映了xi選擇xk作為聚類中心積累的相似度證據(jù)。信息傳播在迭代過程中將吸引度信息和歸屬度信息進(jìn)行組合來(lái)決策出最終的聚類中心及其每個(gè)類代表點(diǎn)下所有的樣本點(diǎn),即計(jì)算所有樣本點(diǎn)的r(i,k)和a(i,k)之和,從而確定xi是否為聚類中心,然后根據(jù)相似度將非聚類中心的點(diǎn)分配給最近的聚類中心。吸引度矩陣和相似度矩陣更新公式如下:
其中s(i,k)表示數(shù)據(jù)點(diǎn)xk和xi的相似度,距離越小相似度越高,在告警時(shí)間序列中,每個(gè)告警事務(wù)是若干告警項(xiàng)集合,在時(shí)間軸上具有強(qiáng)烈的相關(guān)性。
式(3)為歸屬度矩陣更新公式,式(4)表示xk為其他點(diǎn)聚類中心的可能性,由其他所有樣本點(diǎn)發(fā)送到xk的非負(fù)吸引度相加得到。算法中將s(k,k)的值設(shè)定為參考值,記為P值,表示開始時(shí)每個(gè)告警事件樣本點(diǎn)成為聚類中心的可能性相同,P值越大說明該點(diǎn)成為聚類中心的概率高。實(shí)驗(yàn)證明,P值的大小和樣本點(diǎn)最終的聚類數(shù)目相關(guān),P值越高,聚類個(gè)數(shù)就越多,一般情況下我們選取所有相似度的均值作為值,可以得到中等數(shù)目的聚類個(gè)數(shù)。為了避免算法過程出現(xiàn)振蕩,引入阻尼因子dam,每一次的迭代過程,吸引度和歸屬度矩陣的更新結(jié)果就是當(dāng)前值和上一次的結(jié)果加權(quán)而得,公式如下:
其中,dam∈[0,1),主要用來(lái)調(diào)節(jié)算法的收斂速度和穩(wěn)定性。rold(i,k)和aold(i,k)為上一次r(i,k)和a(i,k)的迭代結(jié)果。直到發(fā)生迭代次數(shù)超過開始輸入的最大值或者聚類中心在若干次連續(xù)的迭代過程中不發(fā)生改變的情況,算法終止。
2.2時(shí)間窗口寬度和滑動(dòng)步長(zhǎng)
時(shí)間窗口w大小決定了事務(wù)數(shù)據(jù)庫(kù)中的每個(gè)事務(wù)的大小,影響關(guān)聯(lián)規(guī)則的時(shí)間粒度,間接決定了最大頻繁項(xiàng)集的長(zhǎng)度,跟關(guān)聯(lián)規(guī)則挖掘的效率有極大的關(guān)系?;瑒?dòng)步長(zhǎng)的大小跟相鄰事務(wù)間的區(qū)別粒度有關(guān),步長(zhǎng)越小,則相鄰事務(wù)間的區(qū)別性不大,步長(zhǎng)越長(zhǎng),則事務(wù)間的關(guān)聯(lián)性較差,在滿足滑動(dòng)步長(zhǎng)小于窗口寬度的條件下,選擇合適的窗口寬度和滑動(dòng)步長(zhǎng)要根據(jù)電力通信網(wǎng)的實(shí)際網(wǎng)絡(luò)情況而定。窗口寬度越小,越不容易發(fā)現(xiàn)有價(jià)值的關(guān)聯(lián)規(guī)則,窗口寬度越大,其包含有價(jià)值的關(guān)聯(lián)規(guī)則的同時(shí)也包含了大量的噪音,導(dǎo)致挖掘出來(lái)的關(guān)聯(lián)規(guī)則數(shù)目龐大,一般情況下,典型的窗口寬度為5秒到600秒,常用的窗口寬度集為{5 s,10 s,30 s,60 s,120 s,300 s,600 s}。具體設(shè)置應(yīng)該根據(jù)網(wǎng)絡(luò)中發(fā)生告警的具體情況而定,隨著電力通信網(wǎng)網(wǎng)絡(luò)管理性能的提高,告警傳輸時(shí)延呈下降趨勢(shì),窗口寬度應(yīng)該相應(yīng)的減小;另一方面,當(dāng)網(wǎng)絡(luò)的規(guī)模增長(zhǎng)使得告警的傳播路徑延長(zhǎng),窗口寬度應(yīng)該相應(yīng)的增大。
滑動(dòng)步長(zhǎng)跟提取事務(wù)的時(shí)間效率有關(guān),滑動(dòng)步長(zhǎng)越長(zhǎng),提取事務(wù)所需時(shí)間相對(duì)較少,當(dāng)s>w時(shí),在提取告警事務(wù)的過程中會(huì)漏掉部分告警信息;s=w時(shí),無(wú)法體現(xiàn)出告警事務(wù)間的相關(guān)性;s<w時(shí),能夠?qū)⒏婢蛄型暾剞D(zhuǎn)化為事務(wù)型數(shù)據(jù)庫(kù)。一般情況下,滑動(dòng)步長(zhǎng)小于時(shí)間窗口的一半。對(duì)于告警時(shí)間序列較長(zhǎng)時(shí),推薦滑動(dòng)步長(zhǎng)為窗口寬度的十分之一,常用其取值范圍為[1,w/4],以保證相鄰窗口有足夠的重疊。
在以上的條件限制下,在反復(fù)的實(shí)驗(yàn)總結(jié)中選擇合適的窗口寬度和滑動(dòng)步長(zhǎng),窗口寬度w的取值范圍為公式(7),在實(shí)際情況中根據(jù)具體的告警場(chǎng)景設(shè)置。
△w為時(shí)間段的寬度,Pmax為時(shí)間段內(nèi)不同情景最大間隔的最大值?;瑒?dòng)步長(zhǎng)的取值范圍為
其中Qmax為時(shí)間段內(nèi)不同場(chǎng)景最小間隔的最小值。
仿真驗(yàn)證采取廣東電力通信網(wǎng)中的告警樣本,告警預(yù)處理后截取其中的部分樣本,首先對(duì)原始告警數(shù)據(jù)進(jìn)行清洗,然后提取告警級(jí)別、告警時(shí)間、告警名稱、告警對(duì)象來(lái)表示告警事件,采用基于近鄰傳播聚類的滑動(dòng)時(shí)間窗口法和均勻滑動(dòng)時(shí)間窗口法分別處理時(shí)間長(zhǎng)為50 s、100 s、200 s和300 s的告警序列,得到的告警事務(wù)數(shù)目如圖2所示。
圖2 采用兩種方法對(duì)同一告警序列提取的事務(wù)數(shù)之比
對(duì)同一告警時(shí)間序列處理,本文采用的方法提取的事務(wù)數(shù)目相對(duì)來(lái)說有所減少,能夠有效降低噪聲數(shù)據(jù)對(duì)關(guān)聯(lián)規(guī)則挖掘的影響,有利于關(guān)聯(lián)規(guī)則挖掘。然后比較了基于近鄰傳播聚類的滑動(dòng)時(shí)間窗口法和均勻滑動(dòng)時(shí)間窗口法在提取告警事務(wù)時(shí)的效率,從圖2得到50 s、100 s、200 s和300 s的告警序列中采用均勻時(shí)間窗口法分別提取的告警事務(wù)數(shù)23、48、98和148,對(duì)比采用本文聚類窗口滑動(dòng)法提取相同數(shù)目的事務(wù)數(shù)所需時(shí)間,得到圖3所示結(jié)果。
圖3 采用兩種不同方法提取告警事務(wù)的效率比較
從圖3中可以明顯看到,文中提出的基于聚類的窗口滑動(dòng)法的提取效率高于均勻滑動(dòng)時(shí)間窗口法,因?yàn)樵撍惴ㄍㄟ^聚類形成的多個(gè)告警子序列將沒有告警發(fā)生的時(shí)間段過濾,從而節(jié)省了時(shí)間資源[11]。從實(shí)驗(yàn)結(jié)果可以得到,合理的劃分時(shí)間段數(shù)目對(duì)提高提取告警事務(wù)效率至關(guān)重要。文獻(xiàn)[6]中提出的基于雙約束滑動(dòng)時(shí)間窗口法的主要內(nèi)容為首先隨機(jī)的選擇k個(gè)時(shí)間點(diǎn),每個(gè)時(shí)間點(diǎn)初始地代表了一個(gè)時(shí)間段的中心,對(duì)剩余的每個(gè)告警事件,根據(jù)其與初始的k個(gè)時(shí)間點(diǎn)之間的距離,將它賦值給最近的時(shí)間段,然后重新計(jì)算每個(gè)時(shí)間段的中心,這個(gè)過程不斷重復(fù),直到準(zhǔn)則函數(shù)收斂,定義準(zhǔn)則函數(shù)為
其中:ti/2表示時(shí)間段ti的中間點(diǎn),E表示所有時(shí)間點(diǎn)的均方誤差和,E越小,說明該劃分的效果越好。t是每個(gè)時(shí)間段中的時(shí)間點(diǎn)。準(zhǔn)則E試圖使生成的結(jié)果每個(gè)時(shí)間段盡可能地緊湊和獨(dú)立[12]。此算法嘗試找出使平方誤差函數(shù)值最小的k個(gè)時(shí)間段劃分,當(dāng)劃分的時(shí)間段是密集的,而時(shí)間段彼此之間區(qū)別明顯時(shí),劃分的效果較好,根據(jù)式(9)計(jì)算得到,基于雙約束滑動(dòng)時(shí)間窗口法和基于聚類滑動(dòng)時(shí)間窗口法的均方誤差和分別是20.3028和20.2055,因此本文算法劃分的效果更好,更適合運(yùn)用在告警序列劃分中。
綜上所述,和基于雙約束滑動(dòng)時(shí)間窗口法相比,基于近鄰傳播聚類滑動(dòng)時(shí)間窗口法有以下優(yōu)勢(shì):劃分的時(shí)間段的數(shù)目不需要提前知道,能夠自動(dòng)生成合理的劃分時(shí)間段數(shù)目;劃分相同的時(shí)間段數(shù)目誤差平方和更低;算法穩(wěn)定性好,參考值P不變則聚類結(jié)果不變。
告警序列一般分布不均勻,突發(fā)性強(qiáng),因此在將其轉(zhuǎn)化為事務(wù)型數(shù)據(jù)庫(kù)進(jìn)行關(guān)聯(lián)規(guī)則挖掘時(shí),提取效率是首要考慮的因素。本文提出的基于近鄰傳播聚類的告警事務(wù)提取方法利用近鄰傳播聚類算法將告警時(shí)間序列聚類成多個(gè)相似度較高的時(shí)間段,然后分別設(shè)置不同的窗口寬度和滑動(dòng)步長(zhǎng)進(jìn)行告警事務(wù)的提取。實(shí)驗(yàn)結(jié)果證明,與均勻滑動(dòng)時(shí)間窗口法相比,本文算法提取告警事務(wù)效率較高,與基于雙約束滑動(dòng)時(shí)間窗口法相比,無(wú)需事先輸入劃分時(shí)間段數(shù)目能夠自動(dòng)生成合理的時(shí)間段數(shù)目。近鄰傳播聚類在大數(shù)據(jù)分析中應(yīng)用比較廣泛,電力通信網(wǎng)是大型異構(gòu)通信網(wǎng)絡(luò),其產(chǎn)生的告警數(shù)據(jù)巨大,具有典型的大數(shù)據(jù)特征,利用大數(shù)據(jù)技術(shù)將該算法分布式處理能夠?yàn)殡娏νㄐ啪W(wǎng)中告警預(yù)處理帶來(lái)新的發(fā)展契機(jī)。
[1]CHEN Chao,LI Tong-yanTongyan L.Study of alarm association rules mining based on matrixmapping[C]//Electronics,Communications and Control(ICECC),2011 International Conference on.IEEE,2011:2861-2864.
[2]Wu Y,Du S,Luo W.Mining alarm database of telecommunication network for alarmassociation rules[C]//Dependable Computing,2005.Proceedings.11th Pacific Rim International Symposium on.IEEE,2005:281-286.
[3]Leng X,Li X.Alarm fuzzy association rules parallel miningin multi-domain distributed communicationnetwork[C]//Communication Technology(ICCT),2012 IEEE 14th International Conference on.IEEE,2012:501-506.
[4]Wang Y,Li G,Xu Y,et al.An algorithm for mining of association rules for the information communication network alarms based on swarm intelligence[J].Mathematical Problems in Engineering,2014:1-14.
[5]Van Vaerenbergh S,Via J.Santamana I.Nonlinear system identification using a new sliding-window kernel RLS algorithm[J]Journal of Communications,2007,2(3):1-7.
[6]李彤巖,李興明.基于雙約束滑動(dòng)時(shí)間窗口的告警預(yù)處理方法研究[J].計(jì)算機(jī)應(yīng)用研究,2013(2):582-584.
[7]肖宇,于劍.基于近鄰傳播算法的半監(jiān)督聚類[J].軟件學(xué)報(bào),2008(11):2803-2813.
[8]Frey B J,Dueck D.Clustering by passing messages between data points[J].science,2007,315(5814):972-976.
[9]Givoni I E,F(xiàn)rey B J.A binary variable model for affinity pro-pagation[J].Neural Computation,2009,21(6):1589-1600.
[10]Sahu N,Thakur G S.Document clustering using message passing between data points[C]//CommunicationSystems and Network Technologies(CSNT),2013 International Conference on.IEEE,2013:591-596.
[11]李剛.基于SOA的Web GIS系統(tǒng)框架設(shè)計(jì)分析[J].陜西電力,2011(2):38-41.
[12]趙志偉,陳學(xué)有,潘瓊.采用特征值法和Prony法相結(jié)合的PSS自適應(yīng)控制[J].陜西電力,2012(6):49-52,62.
【相關(guān)參考文獻(xiàn)鏈接】
[1]肖寅,姜興龍,龔文斌,等.基于大數(shù)據(jù)處理的ETL框架的研究與設(shè)計(jì)[J].2016,24(2):21-24.
[2]沈琦,陳博.基于大數(shù)據(jù)處理的ETL框架的研究與設(shè)計(jì)[J]. 2016,24(2):25-27.
[3]姜慧霖.基于層次聚類的案例檢索策略 [J].2014,22(17): 158-161.
[4]李全鑫,魏海平.基于聚類分類法的信息過濾技術(shù)研究[J]. 2014,22(20):14-16.
[5]燕國(guó)云,侯大志.基于灰色聚類的通信鏈路效能分析[J]. 2015,23(2):181-183.
[6]呂海燕,張杰,王麗娜.基于聚類分析的微博用戶標(biāo)簽自動(dòng)生成[J].2015,23(7):67-69.
[7]鄧森林,陳衛(wèi)東.基于遺傳模擬退火的K-means聚類方法[J]. 2014,22(6):54-56.
[8]劉念杰,秦會(huì)斌.基于電力線載波通信的智能調(diào)光系統(tǒng)設(shè)計(jì)[J].2014,22(8):149-152.
[9]劉俊材.物聯(lián)網(wǎng)環(huán)境下電力傳輸線路安全監(jiān)控系統(tǒng)體系架構(gòu)研究[J].2014,22(16):155-158.
[10]羅志華,熊興中,袁文林.基于電力載波通信的智能家居遠(yuǎn)程控制技術(shù)研究[J].2015,23(6):153-155.
[11]李曉迎,孫友偉,姚秋莎基于電力線物聯(lián)網(wǎng)通信協(xié)議的設(shè)計(jì)[J].2015,23(20):82-85.
[12]張衛(wèi)華.基于矩陣的apriori算法的改進(jìn)[J].2015,23(13): 52-54.
An analysis method of power communication alarm information based on affinity propagation clustering
LIN Bin1,ZENG Ying1,LI Xing-nan1,CHEN Wen-wei2,LUO Yun2
(1.Power dispatch and control Center of Guangdong Power Grid Corporation,Guangzhou 510600,China;2.Sichuan Enrising Information Techonlogy Co.Ltd,Chengdu 610093,China)
In power communication alarm correlationanalysis,the original alarm database needs to be transformed into a transactional database.Traditional sliding time window has low efficiency on extracting alarm transactions,so sliding time window method based on propagation clustering is proposed.With this method,affinity propagation clustering is applied to alarm pretreatment,the alarm sequence would be considered to a series of data objects which is turned into some segments with higher similarity.The performance testing of the algorithm indicates that this method has higher extract efficiency,which solves the irrationality of fixed time window.The method is helpful for alarm correlation analysis and has a wider application prospect for extracting alarm transactions.
alarm transactions;correlation analysis;affinity propagation clustering;time window;sliding step
TN914
A
1674-6236(2016)16-0142-04
2015-08-26稿件編號(hào):201508134
北京市自然科學(xué)基金項(xiàng)目(4142049)
林 斌(1969—),男,廣東揭陽(yáng)人,高級(jí)工程師。研究方向:電力系統(tǒng)通信網(wǎng)運(yùn)維和管理。