鄧梅,余劍峰
(國(guó)網(wǎng)宜昌供電公司,湖北 宜昌 443000)
隨著電力行業(yè)改革逐步深化,部分電網(wǎng)已經(jīng)完成了智能化改造,能夠極大降低實(shí)時(shí)監(jiān)控工作人員的工作強(qiáng)度,并且提升了監(jiān)控效率,降低了潛在風(fēng)險(xiǎn)發(fā)生概率。較為典型的是110kV以上變電站通過(guò)集中監(jiān)控的管理方式將監(jiān)控信息進(jìn)行集中處理,使得電網(wǎng)監(jiān)控工作人員能夠?qū)@些信息進(jìn)行集中處理并及時(shí)進(jìn)行調(diào)控措施。
我們現(xiàn)階段對(duì)于電網(wǎng)實(shí)時(shí)監(jiān)控工作的模式主要表現(xiàn)為通過(guò)人工管理來(lái)實(shí)現(xiàn),但是有較多的客觀因素會(huì)對(duì)人工監(jiān)控的流程造成困擾,并且對(duì)監(jiān)控效率造成影響。由于工作人員的精力有限,因此長(zhǎng)時(shí)間對(duì)大量的電氣信號(hào)進(jìn)行識(shí)別的過(guò)程中,會(huì)出現(xiàn)由于工作人員精力降低而出現(xiàn)的各種失誤與低效,如果出現(xiàn)對(duì)故障的判斷失誤,將會(huì)對(duì)電網(wǎng)造成較大程度的損失。由此要加強(qiáng)電網(wǎng)監(jiān)控功能就需要依靠自動(dòng)辨識(shí)方法來(lái)提供一種能夠輔助工作人員及時(shí)判斷電網(wǎng)信息,可以有效減輕監(jiān)控人員的負(fù)擔(dān)、加快電網(wǎng)事故處理的流程、避免信號(hào)漏看導(dǎo)致的電網(wǎng)事故。
因此本文所研究的監(jiān)控方式,能夠以聚類(lèi)信息識(shí)別分類(lèi)為理論基礎(chǔ),相對(duì)傳統(tǒng)人工監(jiān)控而言,能夠在數(shù)據(jù)處理的基礎(chǔ)上,按照監(jiān)控信息發(fā)出時(shí)間為依據(jù)進(jìn)行分段,將原本連續(xù)的監(jiān)控信息切分成多個(gè)文本,而后采用統(tǒng)計(jì)學(xué)的方法對(duì)文本進(jìn)行預(yù)處理形成對(duì)應(yīng)特征向量,并通過(guò)數(shù)據(jù)挖掘的方法對(duì)特征向量集合進(jìn)行聚類(lèi)分析得出聚類(lèi)規(guī)則。最終能夠讓對(duì)大量監(jiān)控信息進(jìn)行智能化處理,為工作人員的具體工作提供較嚴(yán)謹(jǐn)?shù)妮o助功能,及時(shí)發(fā)出的告警信號(hào),維護(hù)電網(wǎng)安全穩(wěn)定運(yùn)行的目的。
對(duì)固定時(shí)間的信息進(jìn)行獲取。電網(wǎng)設(shè)備能夠在自身發(fā)生異常時(shí)進(jìn)行告警,告警信息發(fā)出的同時(shí)會(huì)附加具體時(shí)間。根據(jù)時(shí)間尺度來(lái)對(duì)信息進(jìn)行獲取并處理為數(shù)據(jù)樣本,需要以3秒為間隔對(duì)就近時(shí)間段內(nèi)信息數(shù)量進(jìn)行統(tǒng)計(jì)。具體如下式所示:
上式中的S、t、m分別表示處理后獲取的監(jiān)控信息、具體時(shí)段、時(shí)段中的信息數(shù)量,其中(tn,mn,cn)表示時(shí)間區(qū)間tn里獲取的具體信息數(shù)量mn,包括文本cn。
下一步需要對(duì)信息熵模型進(jìn)行構(gòu)建。一般出現(xiàn)設(shè)備故障后的10秒內(nèi)將會(huì)發(fā)出告警信息,將時(shí)間跨度設(shè)置為30秒能夠?qū)τ行盘?hào)進(jìn)行全部獲取,所形成的告警信號(hào)文檔為S,對(duì)其信息熵進(jìn)行計(jì)算的公式為:
其中φ、n分別表示常數(shù)以及狀態(tài)數(shù),數(shù)值范圍為告警信息數(shù)量的上限值,P(k)表示出現(xiàn)概率,通過(guò)下式來(lái)進(jìn)行獲?。?/p>
最后,基于信息熵的告警信息文檔篩選。在監(jiān)控系統(tǒng)中單獨(dú)的告警信息不能作為故障判斷的依據(jù),每當(dāng)設(shè)備異?;螂娋W(wǎng)故障時(shí),總是伴隨著大量的一次設(shè)備的電氣、物理信號(hào)和二次設(shè)備的動(dòng)作信號(hào);與之相對(duì)應(yīng)的,單一出現(xiàn)的告警信號(hào)往往是電網(wǎng)輔助設(shè)備發(fā)出的告警信號(hào),不能作為設(shè)備故障(或異常)的判斷依據(jù)。因此,對(duì)應(yīng)時(shí)段的監(jiān)控信息熵越大,則該時(shí)段告警信號(hào)發(fā)出不會(huì)是規(guī)律的,其熵越大出現(xiàn)設(shè)備故障(或異常)的幾率越高。為此,本方法以30s為時(shí)間跨度,每隔10s進(jìn)行一次采樣,計(jì)算對(duì)應(yīng)的監(jiān)控信息文檔S的熵。將信息熵H (S) <0.3的監(jiān)控信息文檔篩選掉,即排除監(jiān)控告警信號(hào)發(fā)出特別規(guī)律的時(shí)段。
其他信息文檔中記錄有30s內(nèi)的告警信息,遠(yuǎn)高于10s的設(shè)備故障信息送到標(biāo)準(zhǔn),因此需要進(jìn)行二次篩選來(lái)對(duì)有效文本內(nèi)容進(jìn)行確定。需要通過(guò)以下篩選流程來(lái)完成:(1)對(duì)(ti, mi, ci)進(jìn)行刪除,并對(duì)刪除后的熵H'(S)進(jìn)行計(jì)算;(2)以處理后數(shù)據(jù)變化最大的項(xiàng)為中心,從邊緣對(duì)數(shù)據(jù)項(xiàng)進(jìn)行處理,直至H (S') <H(S)。
圖1 信息剔除方案
由以上步驟可以得到任意監(jiān)控系統(tǒng)在任意時(shí)段得到的監(jiān)控信息文檔集合{Si}。其中為含有有效告警信息的文檔。
第一,進(jìn)行文本提取步驟要根據(jù)統(tǒng)計(jì)分詞的特征項(xiàng)進(jìn)行,通常設(shè)備告警信息文本具有較為明確的描述標(biāo)準(zhǔn),所以運(yùn)用統(tǒng)計(jì)分詞來(lái)進(jìn)行處理,對(duì)2個(gè)漢字進(jìn)行互現(xiàn)信息系數(shù)統(tǒng)計(jì)可用下式來(lái)進(jìn)行:
上式中M(X,Y )與P(X,Y )分別表示兩個(gè)漢字的互現(xiàn)信息系數(shù)以及兩個(gè)漢字的相鄰出現(xiàn)概率,P(X)、P(Y )表示兩個(gè)漢字在告警信息文本中的出現(xiàn)概率。兩個(gè)漢字在文本中的出現(xiàn)次數(shù)以及是否相鄰決定了其成為關(guān)鍵詞的可信程度。需要在文本特征中設(shè)置M(X,Y)>0。
第二,還需要對(duì)無(wú)意義詞匯進(jìn)行去除。如“的”、“了”等無(wú)意義漢字進(jìn)行剔除以提高特征項(xiàng)集合的有效性,處理后表示為:其中δ表示處理完成后的最終詞。再通過(guò)TF-IDF公式來(lái)對(duì)詞條權(quán)重進(jìn)行確定,其算式表現(xiàn)為:
上式中,f(δ1,d )表示文檔中出現(xiàn)δ1的頻率,N表示總文檔數(shù)量,ni表示文檔中包含δi的文檔數(shù)量。通過(guò)TF-IDF公式來(lái)對(duì)詞條權(quán)重進(jìn)行確定,wi與δi與特異性呈正比關(guān)系,假設(shè)其在單個(gè)文檔中出現(xiàn)的頻率遠(yuǎn)高于在多個(gè)文檔中出現(xiàn)的頻率,那么可以判斷δi用于表征文檔d的可信度越高。
第三,建立文本特征空間向量。通過(guò)文本特征量的提取可以計(jì)算得到不同詞條在文檔中的權(quán)重。但是這樣得到的權(quán)重沒(méi)有進(jìn)行歸一化處理,歸一化處理后的權(quán)重為:
因此任意文檔可以表征為一個(gè)二維向量,其形式如下式(7)所示:
通過(guò)不同詞條建立一個(gè)坐標(biāo)軸后,能夠?qū)υ谠撟鴺?biāo)空間中確定該二維向量確實(shí)是在該空間中。
對(duì)多個(gè)對(duì)象進(jìn)行選擇,并且用k來(lái)對(duì)其數(shù)量進(jìn)行表示,建立初始簇集合,表示為??倲?shù)為k的對(duì)象通過(guò)來(lái)進(jìn)行表示,即特征向量集合。通過(guò)夾角余弦公式對(duì)新獲取文本與特征向量的相似度進(jìn)行計(jì)算,該算式表示為:
重新整合后形成新的函數(shù),成為評(píng)價(jià)函數(shù),具體算式如下所示:
式(10)中,J 表示為任意數(shù)值與特征向量的均方差之和,即為具體的評(píng)價(jià)函數(shù)數(shù)值。xn為文本文檔Sn對(duì)應(yīng)的特征向量,為第k個(gè)簇的特征向量,為文檔Sn與第k個(gè)簇的相似度。Zk為第k個(gè)簇中含有的元素個(gè)數(shù),K為所有簇的個(gè)數(shù)。
重復(fù)樣本歸入聚類(lèi)簇中心的步驟,當(dāng)評(píng)價(jià)函數(shù)的數(shù)值沒(méi)有出現(xiàn)任何變化后,能夠?qū)個(gè)簇的正交形態(tài)進(jìn)行確定,告警信號(hào)能夠根據(jù)其表示的特征向量進(jìn)行模板對(duì)應(yīng)。最后,采用人工識(shí)別的方式來(lái)對(duì)完成的簇進(jìn)行檢查確認(rèn),對(duì)告警信號(hào)的文本文檔具體告警內(nèi)容進(jìn)行明確。通過(guò)以上所有步驟可以對(duì)任意時(shí)間長(zhǎng)度的告警信號(hào)進(jìn)行聚類(lèi)分析,將其轉(zhuǎn)化為對(duì)應(yīng)的k個(gè)典型特征向量(即k個(gè)典型故障告警文本模板)。
步驟1:每隔10s統(tǒng)計(jì)一次最近30s的告警信號(hào),形成新增文檔S。
步驟3:計(jì)算新增文檔S與各個(gè)簇中心特征向量的相似度,對(duì)其進(jìn)行分類(lèi)。
從上述方法可以發(fā)現(xiàn),本問(wèn)研究?jī)?nèi)容提出的一種基于聚類(lèi)的電網(wǎng)運(yùn)行監(jiān)控信息智能辨識(shí)分類(lèi)方法。本文的方法能夠在電網(wǎng)監(jiān)控研究中對(duì)科學(xué)分析法進(jìn)行應(yīng)用,通過(guò)聚類(lèi)分析對(duì)歷史告警信息的特征向量進(jìn)行分析提取后,建立有效的特征向量信息文本集合,并且通過(guò)聚類(lèi)分析法對(duì)特征向量空間進(jìn)行構(gòu)建,在對(duì)典型告警信息內(nèi)容的空間特征向量進(jìn)行確定后,在出現(xiàn)新告警信息后能夠?qū)ζ溥M(jìn)行有效的分析計(jì)算,通過(guò)計(jì)算其與特征向量的相似度來(lái)對(duì)具體的有效告警信息進(jìn)行確定,能夠有效提升監(jiān)控工作人員對(duì)于告警信息的輔助處理,并且在信息自動(dòng)分類(lèi)的狀態(tài)下,提升對(duì)于告警信號(hào)的識(shí)別效率與準(zhǔn)確度,對(duì)人工監(jiān)控可能出現(xiàn)的失誤情況進(jìn)行有效彌補(bǔ),促使電網(wǎng)運(yùn)行安全系數(shù)的提升。