蘇紀臣
(國網(wǎng)寧夏電力有限公司,寧夏 銀川 750001)
隨著我國電力自動化水平的穩(wěn)步提升,針對變電站的管理也逐漸趨于智能化[1]。由于變電站生產(chǎn)安全決定了電力系統(tǒng)運行的安全性和高效性,再加上通過變電站工程現(xiàn)場的智能測量設備實時監(jiān)測變電站運行情況[2],對提高變電站內設備檢修與維護的準確性、實時性與經(jīng)濟效益,降低變電站運行維護成本等方面都有著重要意義。
由于智能化變電站是我國電力發(fā)展的一個趨勢,同時,智能化變電站在線監(jiān)測與診斷技術近年來在電力行業(yè)受到了高度重視,其在線監(jiān)測數(shù)據(jù)現(xiàn)場并行處理技術得到了深入研究,這對電力系統(tǒng)的安全運行具有重要的意義。在變電站工程現(xiàn)場中有很多智能測量設備,如直流電源監(jiān)控裝置、高壓設備絕緣監(jiān)測裝置、諧波在線監(jiān)測裝置、電壓監(jiān)測儀以及小電流接地裝置等設備,這些智能測量設備均具有數(shù)據(jù)上傳功能[3]。但是,目前缺乏統(tǒng)一的管理以及采集手段[4],智能測量設備具有各自的監(jiān)控領域以及監(jiān)控任務,使得變電站管理維護費用上升。不僅如此,智能測量設備傳輸信息量較少,受通訊規(guī)約約束,導致傳輸距離短以及傳輸速度慢,無法接入具有串口通信功能的設備[5]等,不能夠實現(xiàn)設備信息資源的充分利用。
目前,針對數(shù)據(jù)導出的研究已經(jīng)取得了一定的研究成果,例如數(shù)字化變電站中測量儀表數(shù)據(jù)采集系統(tǒng)設計[6]以及基于信息融合的智能變電站繼電保護設備自動測試系統(tǒng)[7],這兩種系統(tǒng)分別利用STM32處理器和信息融合技術實現(xiàn)變電站繼電保護設備測試,實現(xiàn)變電站機電保護設備數(shù)據(jù)采集與導出處理,但是這兩種系統(tǒng)在設計過程中并未考慮到要對數(shù)據(jù)進行進一步處理,導致數(shù)據(jù)處理效率較低以及導出時延較高。因此,本文研究時考慮到以上問題,利用歸一化方法對數(shù)據(jù)進行處理,在此基礎上利用K-means算法對數(shù)據(jù)處理結果進行聚類處理,以期提升變電站工程現(xiàn)場智能測量設備數(shù)據(jù)導出效率,并提升變電站工程智能測量設備數(shù)據(jù)管理水平。
變電站具有利用智能電子設備實現(xiàn)眾多設備的信息采集、信息監(jiān)測、協(xié)同互動、分析決策以及智能調節(jié)等眾多功能。所設計變電站工程現(xiàn)場智能測量設備數(shù)據(jù)批量導出系統(tǒng)總體結構如圖1所示。
圖1 系統(tǒng)總體結構圖Fig.1 Overall structure of the system
設置智能測量設備信息采集儀(下文簡稱采集儀)作為變電站工程現(xiàn)場智能測量設備數(shù)據(jù)批量導出系統(tǒng)的數(shù)據(jù)采集裝置,其可與變電站工程現(xiàn)場各類智能測量設備連接,利用透明轉發(fā)技術實現(xiàn)不同設備接入。選取SDH光纖環(huán)網(wǎng)將所采集到的海量數(shù)據(jù)遠程發(fā)送至數(shù)據(jù)中心,數(shù)據(jù)中心處理所采集的海量智能測量設備數(shù)據(jù)[8],利用批量導出算法將數(shù)據(jù)導出至Excel表格中。變電站管理人員及生產(chǎn)運行人員通過批量導出的Excel表格查詢與處理變電站工程現(xiàn)場智能測量設備的測量結果。
1.2.1 串口設備光電隔離總線
將RS485串行通信口應用于采集儀中,實現(xiàn)與眾多變電站工程現(xiàn)場智能測量設備通信。為提升智能測量設備通信可靠性,導出智能測量設備數(shù)據(jù)時,需重視不同智能測量設備之間的信號隔離與抗干擾情況[9]。將光電信號隔離裝置安置于不同智能測量設備接入總線端口中,令不同電位的智能測量設備可實現(xiàn)與系統(tǒng)保持良好的通信。RS485通信線路處于室外時,需設置雷擊保護電路,避免通信線路損壞。
1.2.2 智能測量設備采集儀
選取RS485,RS232以及RJ45等端口接入不同的電能采集終端等智能測量設備。通過應答方式采集智能測量設備數(shù)據(jù)[10],利用以太網(wǎng)通過透明轉發(fā)方式傳送至數(shù)據(jù)中心,數(shù)據(jù)中心向各個智能測量設備發(fā)送數(shù)據(jù)采集以及遙控設備等各種指令。
系統(tǒng)選取透明轉發(fā)技術,無需將編寫協(xié)議解釋程序應用于現(xiàn)場設備中以實現(xiàn)數(shù)據(jù)規(guī)約,具有調試安裝簡單以及成本投入低的優(yōu)勢[11]。選取網(wǎng)絡地址轉發(fā)技術,以改善變電站工程現(xiàn)場智能測量設備IP地址資源過于緊缺的情況。
1.3.1 數(shù)據(jù)歸一化處理
采集智能測量設備數(shù)據(jù)時,不同設備所采集數(shù)據(jù)格式存在較大差異,因此數(shù)據(jù)的歸一化處理極為重要[12]。采用標準轉換方式轉換采集儀所采集到的數(shù)據(jù)。用X=(X1,X2,…,Xp)表示維度為p的矢量,所采集數(shù)據(jù)觀測矩陣如下:
經(jīng)標準化處理后的數(shù)據(jù)矩陣如下:
矩陣中隨機元素公式如下:
經(jīng)過標準化變換后的原矩陣各行均值以及標準差分別為0和1。
1.3.2 智能測量設備數(shù)據(jù)分析
K-means聚類算法是目前應用較為廣泛的聚類算法,設存在樣本數(shù)量以及聚類數(shù)量分別為N和K,隨機選取K個樣本作為初始聚類算法的簇中心,計算未被劃分為簇中心的樣本1次迭代至初始簇中心點的距離,迭代過程中需設置聚類準則[13],根據(jù)聚類準則進行簇類分配。簇類分配完成后,獲取簇內全部數(shù)據(jù)平均值,將聚類中心不停移動,直至類內誤差平方和最小且數(shù)據(jù)集內數(shù)據(jù)無變化時表示聚類完成。
K-means聚類算法實現(xiàn)過程如下:
1)設置初始聚類中心{g1,g2,…,gk}為數(shù)據(jù)集內數(shù)量為k的隨機對象;
2)依據(jù)最小距離原則將樣本集內全部樣本分配至聚類的不同類別,公式如下:
3)更新聚類中心,聚類中心為各聚類中全部樣本均值,其計算公式如下:
4)聚類中心變化時,重復步驟2)和步驟3),直至聚類中心不發(fā)生改變,此時聚類中心的公式如下:
K-means聚類算法是基于劃分的聚類算法,具有較好的聚類效果,可應用于處理大規(guī)模變電站工程現(xiàn)場智能測量設備數(shù)據(jù)處理中,算法簡單,可伸縮性高,實際應用效果更好。
由于變電站工程現(xiàn)場智能測量設備數(shù)據(jù)量大,系統(tǒng)采集海量數(shù)據(jù)后,需采用合理的聚類分析處理方法實現(xiàn)數(shù)據(jù)分析[14],以提升數(shù)據(jù)批量導出效果。海量智能測量設備數(shù)據(jù)處理流程如下:
1)數(shù)據(jù)準備。采集不同的智能測量設備數(shù)據(jù)后,將所采集的數(shù)據(jù)置于HBase表內,存儲于本地;
2)提取信號特征。提取智能測量設備數(shù)據(jù)特征,并將所提取特征結果存儲于SequenceFile內;
3)獲取聚類中心。提取已知類別的少量樣本,其聚類中心的計算公式如下:
式中:Centerj,xi分別為類別Gj的聚類中心以及全部樣本;m為樣本數(shù)量。
利用式(8)獲取第1次迭代時聚類中心,并將聚類中心存儲于SequenceFile內;
4)K-means聚類。設置K-means聚類的終止條件,并將已完成特征提取的智能測量設備數(shù)據(jù)以及聚類中心的SequenceFile路徑進行聚類,將聚類結果發(fā)送至HDFS內,同樣存儲于Sequence?File內;
5)將利用K-means聚類方法所獲取結果應用于數(shù)據(jù)批量導出中。
以上過程可將海量變電站工程現(xiàn)場智能測量設備數(shù)據(jù)聚類處理,所獲取聚類結果可直觀體現(xiàn)智能測量設備數(shù)據(jù)具體情況[15],令所導出的數(shù)據(jù)更為精準。
將完成數(shù)據(jù)處理的變電站工程現(xiàn)場智能測量設備數(shù)據(jù)批量導出至Excel文件中,一是通過提取系統(tǒng)所在服務器的Excel進程使用數(shù)量,將數(shù)據(jù)集轉存至數(shù)組內;二是通過將系統(tǒng)所采集的智能測量設備數(shù)據(jù)集存放至數(shù)組內,以此獲取Excel內眾多單元格。通過以上兩個過程控制Excel使用進程在合理范圍,將所采集的數(shù)據(jù)批量導出至Excel文件內,實現(xiàn)智能測量設備數(shù)據(jù)的批量導出[16],提升所采集的智能測量設備數(shù)據(jù)實用性。
為檢測所設計的變電站工程現(xiàn)場智能測量設備數(shù)據(jù)批量導出系統(tǒng)的有效性,選取某電力公司作為實驗對象,該電力公司包含兩個智能變電站,變電站內包含智能測量設備16臺。采用所設計系統(tǒng)于2019年11月13日批量導出該電力公司兩個變電站智能測量設備的數(shù)據(jù),以驗證系統(tǒng)的有效性。為直觀驗證所設計系統(tǒng)批量導出性能,選取文獻[6]系統(tǒng)和文獻[7]系統(tǒng)作為對比系統(tǒng)。
為檢驗所設計的變電站工程現(xiàn)場智能測量設備數(shù)據(jù)批量系統(tǒng)的理論深度,對不同系統(tǒng)的數(shù)據(jù)處理時間進行了比較,結果如表1所示。
表1 數(shù)據(jù)處理時間對比Tab.1 Comparison of data processing time
分析表1可知,隨著實驗文件數(shù)量的增加,三種系統(tǒng)的數(shù)據(jù)處理時間均呈現(xiàn)上升趨勢,但是所設計系統(tǒng)的數(shù)據(jù)處理時間始終是最低的,這是因為該系統(tǒng)采用歸一化方法,提升了數(shù)據(jù)處理效率。
為進一步驗證所設計系統(tǒng)在理論上的優(yōu)勢,對三種系統(tǒng)的數(shù)據(jù)聚類時間進行了比較,結果如表2所示。
表2 數(shù)據(jù)聚類時間對比Tab.2 Comparison of data clustering time
分析表2可知,隨著實驗文件數(shù)量的增加,三種系統(tǒng)的數(shù)據(jù)聚類時間均呈現(xiàn)上升趨勢,但是所設計系統(tǒng)的數(shù)據(jù)聚類時間始終是最低的,這是因為所設計系統(tǒng)采用K-means聚類算法對數(shù)據(jù)進行了聚類處理,降低了數(shù)據(jù)聚類時間,提升了數(shù)據(jù)聚類效率。
統(tǒng)計不同系統(tǒng)處理海量智能測量設備數(shù)據(jù)的迭代次數(shù),并將所設計系統(tǒng)與另兩種系統(tǒng)對比,對比結果如圖2所示。
圖2 不同系統(tǒng)迭代次數(shù)對比Fig.2 Comparison of iteration times of different systems
從圖2實驗結果可以看出,隨著智能測量設備數(shù)量的增加,不同系統(tǒng)處理數(shù)據(jù)的迭代次數(shù)有所增加。所設計系統(tǒng)在智能測量設備數(shù)量為16臺時,達到全局最優(yōu)收斂的迭代次數(shù)僅為86次;另兩種系統(tǒng)在智能測量設備為16臺時,分別需要186次以及159次才可實現(xiàn)全局最優(yōu)收斂,驗證了所設計系統(tǒng)具有較高的數(shù)據(jù)處理迭代性能,可有效提升數(shù)據(jù)批量導出速率。
Sort是衡量數(shù)據(jù)管理性能的重要工具,可有效衡量不同系統(tǒng)的數(shù)據(jù)處理能力,Sort中自帶排序程序[17]。利用所設計系統(tǒng)采集智能測量設備數(shù)據(jù)并排序,重復3次排序取其中間值,將所設計系統(tǒng)與文獻[6]系統(tǒng)及文獻[7]系統(tǒng)對比,統(tǒng)計所設計系統(tǒng)批量導出數(shù)據(jù)的排序時間,對比結果如表3所示。
表3 不同系統(tǒng)導出數(shù)據(jù)排序時間對比Tab.3 Comparison of sorting time of exported data in different systems
從表3的實驗結果可以看出,所設計系統(tǒng)可對批量導出的智能測量設備數(shù)據(jù)進行Sort排列,具有較短的排序時間。采用所設計系統(tǒng)排序批量導出的不同智能測量設備數(shù)據(jù)時間均在300~400 ms之間;采用文獻[6]、文獻[7]系統(tǒng)導出的智能測量設備數(shù)據(jù)排序時間均高于800 ms。所設計系統(tǒng)具有較短的排序時間,驗證所設計系統(tǒng)具有較強的數(shù)據(jù)計算能力。
統(tǒng)計采用所設計系統(tǒng)批量導出變電站工程現(xiàn)場智能測量設備數(shù)據(jù)的導出時延,并將所設計系統(tǒng)與另兩種系統(tǒng)對比,對比結果如表4所示。
表4 不同系統(tǒng)批量導出性能對比Tab.4 Comparison of batch export performance of different systems
從表4對比結果可以看出,采用所設計系統(tǒng)批量導出變電站工程現(xiàn)場智能測量設備數(shù)據(jù)的時間明顯低于另兩種系統(tǒng),且導出單條數(shù)據(jù)的平均時延均低于另兩種系統(tǒng),有效驗證所設計系統(tǒng)具有較高的實時性。因此所設計系統(tǒng)具有較高的靈活性以及擴展性,可實現(xiàn)海量智能測量設備數(shù)據(jù)快速導出,數(shù)據(jù)處理性能優(yōu)越。
變電站工程現(xiàn)場智能測量設備數(shù)據(jù)具有多變性,其采集以及導出操作較為頻繁,系統(tǒng)的讀取性能極為重要[18]。統(tǒng)計采用所設計系統(tǒng)批量導出變電站工程現(xiàn)場智能測量設備數(shù)據(jù)的吞吐量,統(tǒng)計結果如圖3所示。
圖3 不同系統(tǒng)吞吐量對比結果Fig.3 Throughput comparison results of different systems
從圖3統(tǒng)計結果可以看出,采用所設計系統(tǒng)批量導出智能測量設備數(shù)據(jù)的吞吐量明顯高于另兩種系統(tǒng),運行40 s時的吞吐量高達8 264條;另兩種系統(tǒng)批量導出智能測量設備數(shù)據(jù)運行40 s時的吞吐量僅為4 056條以及3 867條。所設計系統(tǒng)具有較高的吞吐量,有效驗證采用所設計系統(tǒng)不僅可批量導出智能測量設備數(shù)據(jù),并且具有較高的數(shù)據(jù)處理能力,系統(tǒng)運行時具有較高的吞吐量,導出性能較好。
統(tǒng)計采用不同系統(tǒng)批量導出智能測量設備數(shù)據(jù)時的加速比,統(tǒng)計結果如圖4所示。
圖4 不同系統(tǒng)加速比對比Fig.4 Comparison of acceleration ratio of different systems
從圖4統(tǒng)計結果可以看出,采用所設計系統(tǒng)批量導出智能測量設備數(shù)據(jù)的加速比明顯高于另兩種系統(tǒng)[19],有效驗證所設計系統(tǒng)具有較高的批量導出性能。原因在于所設計系統(tǒng)采用的K-means聚類算法具有較高的并行性能[20],因此隨著智能測量設備數(shù)量的增加,加速比有所提升,另兩種系統(tǒng)在不同數(shù)量智能測量設備情況下均有較低的加速比。所設計系統(tǒng)可在較高加速比情況下實現(xiàn)智能測量設備數(shù)據(jù)的批量導出,可應用于變電站工程現(xiàn)場,主要原因是所設計系統(tǒng)充分考慮變電站不同智能測量設備的通信情況,為眾多智能測量設備通信提供便利,實現(xiàn)智能測量設備與數(shù)據(jù)中心的快速通信[21]。
設計變電站工程現(xiàn)場智能測量設備數(shù)據(jù)批量導出系統(tǒng),利用統(tǒng)一的數(shù)據(jù)采集手段采集變電站工程現(xiàn)場智能測量設備數(shù)據(jù),采用透明轉發(fā)技術實現(xiàn)設備運行信息快速接入,利用現(xiàn)有網(wǎng)絡資源實現(xiàn)變電站工程現(xiàn)場智能測量設備數(shù)據(jù)批量導出,以實現(xiàn)設備數(shù)據(jù)的采集與集中管理以及眾多智能測量設備的數(shù)據(jù)共享,提升數(shù)據(jù)利用率。系統(tǒng)測試結果驗證采用該系統(tǒng)批量導出智能測量設備數(shù)據(jù),可靠性較高,可滿足變電站智能測量設備海量數(shù)據(jù)存儲與處理需求,為變電站智能測量設備運行信息提供統(tǒng)一處理平臺。