作者簡介:暢楠(1986— ),男,中級工程師,本科;研究方向:輸配電工程,配網(wǎng)運維管理、數(shù)字化轉(zhuǎn)型。
摘要:配網(wǎng)智能融合終端運維信號多樣,數(shù)值范圍和波動特性各異,增加了辨識難度。為提高精度,文章采用樸素貝葉斯算法進行大數(shù)據(jù)分析,通過預(yù)處理運維信號,包括噪聲濾除和特征提取,將信號轉(zhuǎn)化為適合異常辨識的形式?;谪惾~斯理論和特征條件獨立假設(shè),對信號進行并行化分類,實現(xiàn)異常運維信號的辨識。實驗結(jié)果顯示,該方法的相關(guān)系數(shù)高達0.968,證明了其辨識效果顯著,為配網(wǎng)智能融合終端的運維管理提供了有力支持。
關(guān)鍵詞:大數(shù)據(jù);配網(wǎng)智能融合終端;運維信號;異常辨識
中圖分類號:TP391.5" 文獻標志碼:A
0" 引言
配網(wǎng)智能融合終端在運行過程中生成的運維信號數(shù)量巨大且多樣化,涵蓋了電壓、電流、功率、頻率等多種類型的信號,數(shù)值范圍和波動特性各不相同。這些信號具有實時性,需要實時監(jiān)測和處理。同時,信號中存在噪聲干擾,對異常信號的準確辨識造成干擾。這些特性影響了運維信號異常辨識的準確性。
嚴宇平等[1]構(gòu)建了配電網(wǎng)載波通信網(wǎng)絡(luò)模型,根據(jù)該模型獲取通信節(jié)點的載波通信信號,并利用分類器實現(xiàn)載波通信異常信號的辨識。但該方法難以適應(yīng)高頻率的數(shù)據(jù)更新,同時對于高維特征空間的降維和特征選擇不夠高效。于海平等[2]考慮配電網(wǎng)量測終端故障數(shù)據(jù)不平衡的問題,引入卷積神經(jīng)網(wǎng)絡(luò)-長短記憶模型進行故障數(shù)據(jù)的分類識別,具有較高的故障分類精度。但對于實時性要求較高的運維信號,該方法需要進一步的優(yōu)化來降低計算延遲。王艷等[3]針對電力物聯(lián)感知背景下配電設(shè)備監(jiān)測信號特點,提出壓縮感知及異常識別算法。離線訓(xùn)練采用動態(tài)閾值原子自適應(yīng)奇異值分解,減少字典原子數(shù)量;在線階段,根據(jù)稀疏系數(shù)改變矩陣健康閾值進行異常識別,并更新字典提升精度。但該方法字典的更新策略需要根據(jù)實際應(yīng)用場景進行優(yōu)化調(diào)整,影響了自適應(yīng)性。這些方法雖然在一定程度上提高了配電網(wǎng)的運維質(zhì)量,降低了設(shè)備異常的漏檢和誤檢率,但在處理大規(guī)模數(shù)據(jù)時存在效率低下、計算復(fù)雜度高等問題,難以滿足實際運維中的實時性要求。因此,本文提出了一種基于大數(shù)據(jù)的配網(wǎng)智能融合終端運維信號異常辨識方法。
1" 預(yù)處理配網(wǎng)智能融合終端運維信號
原始運維信號數(shù)據(jù)常受噪聲、異常值干擾,制約了后續(xù)異常辨識。為提高辨識準確率,需對采集到的運維信號數(shù)據(jù)進行一系列預(yù)處理操作。針對缺失值,本文采取了填充處理,以確保訓(xùn)練異常識別分類器的準確性。拉格朗日插值法被運用于缺失值填充,假設(shè)給定了n個數(shù)據(jù)點,(x0,y0),(x1,y1),…,(xi,yi),…,(xn,yn),在處理缺失值時,先找到配網(wǎng)智能融合終端運維信號數(shù)據(jù)集中的已知點(這些點不包含缺失值),再使用這些已知點來計算拉格朗日插值多項式,并使用這個多項式來估計缺失值并進行插補操作,具體如式(1)所示。
C(x)=∑n+1i=0L(xi)yi(1)
式中,C(x)表示缺失值的插值結(jié)果;L(xi)表示拉格朗日基函數(shù)。
對原始數(shù)據(jù)集進行標準化處理即將不同屬性的數(shù)據(jù)轉(zhuǎn)換為具有相似數(shù)量級的數(shù)據(jù)。本文采用了最大-最小值法進行數(shù)據(jù)標準化[4]。在標準化處理后,不同屬性的數(shù)據(jù)將具有相似的尺度,使得各個屬性對模型的影響權(quán)重更加平衡,提高了模型的訓(xùn)練效果和泛化能力。
2" 基于大數(shù)據(jù)分析技術(shù)辨識運維信號異常
本文引入了大數(shù)據(jù)分析技術(shù)的樸素貝葉斯算法,分析預(yù)處理后的運維信號數(shù)據(jù),實現(xiàn)數(shù)據(jù)的分類識別,根據(jù)分類結(jié)果辨識出異常的運維信號[4]。樸素貝葉斯算法分類識別的原理就是確定每個終端運維數(shù)據(jù)的分類概率,將樣本數(shù)據(jù)分配給概率最大的類別[5]。預(yù)處理后的配網(wǎng)智能融合終端運維數(shù)據(jù)為(x1,x2,…,xm),其對應(yīng)的類別標簽分別為B={B1,B2,…,Bm},B1、B2、…、Bm分別表示正常數(shù)據(jù)、由采購錯誤或設(shè)備替換未更新等原因造成的終端設(shè)備型號異常數(shù)據(jù)、由設(shè)備丟失或損壞未報等原因造成的終端設(shè)備數(shù)量異常數(shù)據(jù)、由作業(yè)人員疏忽或環(huán)境變化等原因造成的終端設(shè)備安裝位置異常數(shù)據(jù)、由設(shè)備老化或配置錯誤等原因造成的終端設(shè)備技術(shù)參數(shù)異常數(shù)據(jù)等。計算各終端運維數(shù)據(jù)分類的后驗概率:
Q(Bixi)=Q(xiBi)Q(Bi)Q(xi)(3)
式中,Q(Bixi)表示配網(wǎng)智能融合終端運維信號xi屬于類別標簽Bi的后驗概率;Q(Bixi)Q(Bi)表示先驗概率;Q(xi)表示配網(wǎng)智能融合終端運維信號異常的分類概率。對于樸素貝葉斯分類器而言,當Q(xi)為常數(shù)時,就可以將最大化的后驗概率轉(zhuǎn)化為先驗概率。假設(shè)這些異常特征相互獨立,即可得到如下式所示各異常特征分類的條件概率:
Q(xiBi)=∏mi=1Q(xmBi)(4)
式(4)中,Q(xmBi)的取值可以從配網(wǎng)智能融合終端運維信號的訓(xùn)練樣本數(shù)據(jù)集中獲得。得到每個運維信號分類的條件概率后,將各運維信號辨識為條件概率最大的類別標簽,利用訓(xùn)練集數(shù)據(jù)進行處理,確定各異常信號的概率分布,并以此為依據(jù),將信號歸類至相應(yīng)的類別,即可完成配網(wǎng)智能融合終端運維信號的分類識別,得到每個運維信號數(shù)據(jù)的分類標簽。根據(jù)樸素貝葉斯算法輸出的后驗概率,設(shè)定一個概率閾值,區(qū)分正常和異常信號。
3" 仿真實驗
3.1" 實驗設(shè)置
實驗環(huán)境選用了高性能的計算機集群??紤]到該方法在大數(shù)據(jù)環(huán)境下運行,實驗采用了Hadoop的分布式文件系統(tǒng)(Hadoop Distributed File System,HDFS)來存儲數(shù)據(jù),利用Hive數(shù)據(jù)倉庫進行數(shù)據(jù)管理。同時,為了運行Spark SQL和對比辨識算法,實驗利用了Spark內(nèi)存計算框架。本文采集了2023年6月1日—2023年11月1日某電力公司的配網(wǎng)智能融合終端運維信號作為實驗樣本數(shù)據(jù),原始運維信號數(shù)據(jù)集有100000條記錄,缺失值占比5%,拉格朗日插值法中的已知點數(shù)5,數(shù)據(jù)標準化的最大值100,最小值0,異常分類標簽數(shù)量5,樸素貝葉斯算法迭代次數(shù)100,Hadoop集群的Map任務(wù)數(shù)量20,Reduce任務(wù)數(shù)量5。設(shè)定某個運維信號被分類為異常的后驗概率的閾值為0.7,超過0.7,則將其視為異常信號。其中,部分運維信號如圖1所示。
本文分別利用本文方法、嚴宇平等[1]方法和于海平等[2]方法,對實驗樣本數(shù)據(jù)進行分類識別。
3.2" 結(jié)果分析
經(jīng)過預(yù)處理后,配網(wǎng)智能融合終端運維信號的噪聲分量被去除,缺失值得到了補充,得到的信號如圖2所示。
本文分析運維信號,確定其信號特征,并與各信號異常類別標簽相對比,確定分類的條件概率為0.68,確定為由設(shè)備丟失或損壞未報等原因造成的終端設(shè)備數(shù)量異常數(shù)據(jù)這一類別,具體結(jié)果如圖3所示。
在配網(wǎng)智能融合終端運維信號的分配任務(wù)中,本文采用相關(guān)系數(shù)來評判不同方法對配網(wǎng)智能融合終端異常運維信號的辨識精度。本文將原始樣本數(shù)據(jù)集劃分為10組,將運維信號規(guī)模由1000增加到10000。不同數(shù)據(jù)規(guī)模下,利用各方法所得異常運維信號辨識結(jié)果和實際數(shù)據(jù)的相關(guān)系數(shù)如表1所示。
由表1可知,本文方法在配網(wǎng)智能融合終端運維信號異常辨識結(jié)果的相關(guān)系數(shù)平均為0.968,較其他方法分別提升了0.109、0.101,表明本文方法在運維信號異常辨識方面具有更高的準確性和可靠性。隨著配網(wǎng)智能融合終端運維信號樣本數(shù)據(jù)規(guī)模的不斷增加,本文方法的辨識優(yōu)勢越來越明顯,這是因為本文方法采用了大數(shù)據(jù)分析技術(shù)中的樸素貝葉斯算法對運維信號進行并行化分類識別,能夠快速處理大規(guī)模的數(shù)據(jù)集。
4" 結(jié)語
配網(wǎng)智能融合終端在日常運行過程中勢必會產(chǎn)生海量運維信號,為提升配網(wǎng)智能融合終端運維信號異常辨識的效果與效率,本文引入大數(shù)據(jù)分析技術(shù)設(shè)計辨識方法,首先采集并預(yù)處理了配網(wǎng)智能融合終端的運維信號數(shù)據(jù),然后采用樸素貝葉斯算法進行運維信號異常的并行辨識,最后通過仿真對比實驗驗證了該方法的可行性和有效性。未來,本文將關(guān)注配網(wǎng)智能融合終端運維信號的其他相關(guān)特性,以期發(fā)現(xiàn)更多的潛在信息和價值。
參考文獻
[1]嚴宇平,洪雨天,陳守明,等.基于參數(shù)估計的配電網(wǎng)載波通信異常信號識別方法[J].電測與儀表,2022(10):123-129.
[2]于海平,吳雪瓊,杜天碩.不平衡數(shù)據(jù)集下海量配電網(wǎng)量測終端故障診斷方法[J].電力系統(tǒng)及其自動化學(xué)報,2023(4):32-40.
[3]王艷,李煜,趙洪山,等.配電設(shè)備監(jiān)測信號的壓縮感知與設(shè)備異常識別[J].高電壓技術(shù),2022(1):11-19.
[4]盧曉強,李剛,周萬竣,等.基于最小二乘雙支持向量機的配電網(wǎng)短路故障辨識方法研究[J].武漢大學(xué)學(xué)報(工學(xué)版),2022(4):401-408.
[5]程曉磊,王鵬,王淵,等.基于大數(shù)據(jù)的配電網(wǎng)故障診斷預(yù)測模型設(shè)計[J].電氣傳動,2022(2):61-66.
(編輯" 王雪芬)
Abnormal identification method of operation and maintenance signal of distribution network
intelligent fusion terminal based on big data
CHANG" Nan
(State Grid Shaanxi Electric Power Co., Ltd., Xingping Power Supply Branch, Xingping 712000, China)Abstract:" The intelligent integration of distribution network terminal operation and maintenance signals is diverse, with different numerical ranges and fluctuation characteristics, which increases the difficulty of identification. To improve accuracy, this article adopts naive Bayesian algorithm for big data analysis. By preprocessing the operation and maintenance signal, including noise filtering and feature extraction, the signal is transformed into a form suitable for anomaly identification. Based on Bayesian theory and independent assumption of feature conditions, parallelized classification of signals is carried out to identify abnormal operation and maintenance signals. The experimental results show that the correlation coefficient of the design method is as high as 0.968, which proves its significant identification effect and provides strong support for the operation and maintenance management of intelligent integration terminals in the distribution network.
Key words: big data; intelligent fusion terminal of distribution network; operation and maintenance signal; abnormal identification