武 婕,鄧 彬,黃穎祺,李 娜,周亞勝
(1.深圳供電局有限公司系統(tǒng)運行部,廣東深圳 518000;2.興唐通信科技有限公司科技發(fā)展部,廣東深圳 518000)
電網(wǎng)在長時間的運行過程中會產(chǎn)生大量的運行數(shù)據(jù),實時數(shù)據(jù)中會出現(xiàn)大量的假數(shù)據(jù),給系統(tǒng)的數(shù)據(jù)處理帶來了很大的困難[1]。因此,要做到防患于未然,迅速解決問題,確保電力系統(tǒng)正常穩(wěn)定運行,就必須對電力系統(tǒng)運行狀態(tài)的參數(shù)數(shù)據(jù)進行實時監(jiān)測和分析,及時跟蹤系統(tǒng)或設(shè)備的運行情況。由于傳統(tǒng)的數(shù)據(jù)庫需要讀寫數(shù)據(jù),而基于磁盤介質(zhì)的存儲結(jié)構(gòu)存在誤差大、效率低等問題,不能滿足高實時性數(shù)據(jù)處理的要求,因此,必須對實時系統(tǒng)中的假數(shù)據(jù)進行監(jiān)控[2-3]。
為了保證在負(fù)載變化、通信延時、通信鏈路丟失等情況下對虛假數(shù)據(jù)進行實時監(jiān)測,設(shè)計了一種約束傳感器實時監(jiān)測系統(tǒng)。但是該系統(tǒng)最大的缺點是不能完全保證系統(tǒng)的安全,因為不能充分考慮所有可能產(chǎn)生的假數(shù)據(jù)?;谀P驮囼炏到y(tǒng),實時估計當(dāng)前系統(tǒng)的狀態(tài)變量和測量值,并與最優(yōu)值、歷史數(shù)據(jù)或指標(biāo)函數(shù)進行比較,當(dāng)估計的殘值或指標(biāo)函數(shù)超過某個閾值,或當(dāng)前數(shù)據(jù)的概率分布與歷史數(shù)據(jù)的分布不一致時,即為誤差數(shù)據(jù)。但系統(tǒng)無法有效地檢測到重放攻擊數(shù)據(jù),從而導(dǎo)致監(jiān)測結(jié)果錯誤。為此,提出了基于半監(jiān)督的電網(wǎng)虛假數(shù)據(jù)實時監(jiān)測系統(tǒng)設(shè)計。
在電網(wǎng)綜合運行過程中,傳統(tǒng)的串口傳輸方式由于數(shù)據(jù)量大、傳輸速度慢,不利于數(shù)據(jù)的高效處理和實時監(jiān)控。針對這一問題,設(shè)計了基于半監(jiān)督的電網(wǎng)虛假數(shù)據(jù)實時監(jiān)測系統(tǒng)的硬件架構(gòu),如圖1 所示。
圖1 系統(tǒng)硬件結(jié)構(gòu)
由圖1 可知,該系統(tǒng)主要由功率放大器、數(shù)據(jù)采集卡、電荷放大器以及遠(yuǎn)程監(jiān)控設(shè)備等組成。將采集的數(shù)據(jù)和信息通過網(wǎng)絡(luò)傳輸給遠(yuǎn)程監(jiān)控設(shè)備,要求監(jiān)控設(shè)備的參數(shù)和工作模式通過人機交互界面實現(xiàn)[4]。
遠(yuǎn)程監(jiān)控機結(jié)構(gòu)如圖2 所示。
圖2 遠(yuǎn)程監(jiān)控機結(jié)構(gòu)
遠(yuǎn)程監(jiān)控機采用RV-2000 視頻監(jiān)控終端采集視頻信號[5-7],信號通過光纖網(wǎng)絡(luò)傳送給監(jiān)控服務(wù)器,監(jiān)控中心的監(jiān)控器將流媒體轉(zhuǎn)發(fā)服務(wù)器獲取的數(shù)據(jù)轉(zhuǎn)換并分解成為每秒25 幀的數(shù)字圖像,再由LCD 顯示屏顯示圖像內(nèi)容[8-10]。
采用1604HS 系列采集卡采集數(shù)據(jù),其具有4 個計數(shù)通道和3 個編碼測量通道,是一種具有數(shù)據(jù)采集功能的微機擴展卡[11]。通過USB 總線將數(shù)據(jù)采集卡連接到PC 機,1604HS 數(shù)據(jù)采集卡結(jié)構(gòu)如圖3 所示。
圖3 1604HS數(shù)據(jù)采集卡結(jié)構(gòu)
在監(jiān)控裝置安裝好數(shù)據(jù)采集系統(tǒng)后,實時運行的電壓或電流信號被傳感器采集,經(jīng)A/D轉(zhuǎn)換成FIFO。存儲在FIFO 中的數(shù)據(jù)達(dá)到一定數(shù)量之后,使用ARM 處理器處理數(shù)據(jù)[12]。
端子板是一種電子元件,其接線采用螺絲、夾子等元件,將多個端子板組合起來,根據(jù)不同功能對板件進行排列。通信傳輸與供電有機結(jié)合,使同一通信卡連接不同類型的儀器和信號,只需更換電路板跳線,就能有效減少線路上的節(jié)點數(shù)[13]。外端設(shè)有插接板,便于維修,更換外端時無需拆下連接線[14]。其具有接線快速、壓實可靠、故障發(fā)生率低的特點。無需特殊配置接線板,直接將導(dǎo)線與接線板連接,內(nèi)部采用專用接口,通過專用電纜可快速插入PLC 或DCS[15]。
由一對場效應(yīng)管和一個高增益運算放大器構(gòu)成的YE5850電荷放大器,具有輸入電流大、放大器功率大等特點,可以將輸出電壓的電荷量按一定比例放大。YE5850 型電荷放大器具有15 V 穩(wěn)定的工作電壓,外加限流保護電路,可直接由DC 輸入插座供電。
AV-500 功放不僅擁有先進的5.1 聲道解碼系統(tǒng),還支持WiFi-2.4 G、Bluetooth4.0 和高速USB2.0連接,有助于在網(wǎng)絡(luò)和移動設(shè)備上播放音頻媒體。通過對低音的合理管理,可調(diào)節(jié)高低通濾波器的轉(zhuǎn)角,達(dá)到音質(zhì)和諧的目的。在支持立體聲直通主調(diào)的同時,彈性調(diào)節(jié)空間音質(zhì)。全面支持多種音頻格式,采用多種高速連接方式,將接口設(shè)置為3 進1 出形式,實現(xiàn)快速切換。
半監(jiān)督迭代學(xué)習(xí)是兩種模式,分別是監(jiān)督模式下的學(xué)習(xí)方式和無監(jiān)督模式下的學(xué)習(xí)方式。使用半監(jiān)督迭代學(xué)習(xí)方法,既能標(biāo)記大量數(shù)據(jù),又能對標(biāo)記數(shù)據(jù)進行迭代學(xué)習(xí)與訓(xùn)練?;诎氡O(jiān)督學(xué)習(xí)建模如圖4 所示。
圖4 基于半監(jiān)督學(xué)習(xí)建模
針對長時間序列主信息特征,采用基于半監(jiān)督交疊的聚類分析方法提取樣本序列,并將該樣本序列用于對各種常規(guī)行為進行初始化,當(dāng)樣本數(shù)遠(yuǎn)小于總樣本數(shù)時,采用迭代學(xué)習(xí)方法進行訓(xùn)練,以提高半監(jiān)督學(xué)習(xí)的魯棒性[16]。
基于半監(jiān)督迭代學(xué)習(xí)訓(xùn)練過程如下:
步驟一:通過相應(yīng)的半監(jiān)督學(xué)習(xí),建立閾值模型,對不同種類的A 樣本進行判別,計算在這一步中,每個正常行為的樣本數(shù)為n;
步驟二:對最有可能出現(xiàn)的每一類樣品進行抽樣,如果抽樣不合格,應(yīng)立即停止這些樣品的采集工作;
步驟三:以半監(jiān)督學(xué)習(xí)方法獲得的參數(shù)為樣本序列的初始值,對電網(wǎng)采集的參數(shù)進行進一步訓(xùn)練;
步驟四:更新閾值模型參數(shù);
步驟五:依據(jù)更新后的閾值,判斷序列樣本,如果該樣本中存在訓(xùn)練參數(shù),則需按照步驟一重新訓(xùn)練;如果不存在,則立刻停止訓(xùn)練,輸出訓(xùn)練結(jié)果[17]。
利用半監(jiān)督學(xué)習(xí)模型來判斷數(shù)據(jù)是否異常,然后使用半監(jiān)督入侵檢測算法檢測虛假數(shù)據(jù)。對于半監(jiān)督迭代學(xué)習(xí)模型,當(dāng)序列的有效特性得到充分描述時,模型的預(yù)測殘差將不再包含任何有效信息,而殘差是純無序的隨機波動。檢測殘差序列包含了大量不能充分利用的信息,即序列中各項目間的相互關(guān)系,與純隨機噪聲序列相比,殘差序列具有更強的相關(guān)性?;诎氡O(jiān)督虛假數(shù)據(jù)檢測流程如圖5所示。
圖5 基于半監(jiān)督虛假數(shù)據(jù)檢測流程
訓(xùn)練時采用正態(tài)數(shù)據(jù)模型,每一刻對輸入數(shù)據(jù)進行N次預(yù)測,并且假設(shè)每一學(xué)習(xí)步的序列滿足正態(tài)分布N元,在每一刻的序列數(shù)據(jù)中,每個維度的方差和均值都是N,得到的統(tǒng)計值作為參考值。訓(xùn)練結(jié)束后,對模型進行異常檢測,并對測試集上的數(shù)據(jù)進行實時KLD 計算,在此基礎(chǔ)上得到當(dāng)前數(shù)據(jù)的殘差估計,假定殘差估計為N元正態(tài)分布,并對殘差估計分布與基準(zhǔn)數(shù)據(jù)之間的KLD 進行分析,以判斷當(dāng)前數(shù)據(jù)是否為假數(shù)據(jù),如果當(dāng)估計殘差小于預(yù)定的報警閾值時,判斷是否為正常數(shù)據(jù)。
針對迭代學(xué)習(xí)過程后的訓(xùn)練集數(shù)據(jù),在時間軸上的預(yù)測誤差向量序列為:
訓(xùn)練集中使用的全部都是正常數(shù)據(jù),因此,誤差向量序列統(tǒng)計結(jié)果為正常檢測依據(jù)。將實時獲取的誤差向量e與標(biāo)準(zhǔn)的KLD 統(tǒng)計,能夠得到異常檢測決策統(tǒng)計結(jié)果,如下所示:
式中,DKI表示異常檢測值數(shù)量,Ghj表示異常檢測系數(shù)。當(dāng)式(2)計算結(jié)果S大于設(shè)定報警閾值時,則說明該數(shù)據(jù)為虛假數(shù)據(jù),否則是正常數(shù)據(jù)。
設(shè)定3 種攻擊方式如下:
攻擊1:對遠(yuǎn)程終端設(shè)備進行攻擊,改變傳感器的測量值,影響系統(tǒng)狀態(tài)估計。
攻擊2:針對傳感器和數(shù)據(jù)采集監(jiān)控器進行數(shù)據(jù)傳輸攻擊,改變初始傳感器測量數(shù)據(jù)。
攻擊3:當(dāng)受到攻擊時,使監(jiān)測形式同樣發(fā)生改變。
分別使用基于約束傳感器的實時監(jiān)測系統(tǒng)R1、模型監(jiān)測系統(tǒng)R2和基于半監(jiān)督監(jiān)測系統(tǒng)R3對3 種攻擊下產(chǎn)生的虛假數(shù)據(jù)量進行監(jiān)測,監(jiān)測結(jié)果如圖6所示。
圖6 3種系統(tǒng)虛假數(shù)據(jù)量監(jiān)測結(jié)果對比
由圖6 可知,在攻擊1 情況下,使用基于約束傳感器的實時監(jiān)測系統(tǒng)、模型監(jiān)測系統(tǒng)的虛假數(shù)據(jù)量與實際虛假數(shù)據(jù)量分別相差22×104bit、10×104bit,使用基于半監(jiān)督監(jiān)測系統(tǒng)的虛假數(shù)據(jù)量與實際虛假數(shù)據(jù)量一致。
在攻擊2 情況下,使用基于約束傳感器的實時監(jiān)測系統(tǒng)、模型監(jiān)測系統(tǒng)的虛假數(shù)據(jù)量與實際虛假數(shù)據(jù)量分別相差6×104bit、10×104bit,使用基于半監(jiān)督監(jiān)測系統(tǒng)的虛假數(shù)據(jù)量與實際虛假數(shù)據(jù)量一致。
在攻擊3 情況下,使用基于約束傳感器的實時監(jiān)測系統(tǒng)、模型監(jiān)測系統(tǒng)的虛假數(shù)據(jù)量與實際虛假數(shù)據(jù)量分別相差2×104bit、10×104bit,使用基于半監(jiān)督監(jiān)測系統(tǒng)的虛假數(shù)據(jù)量與實際虛假數(shù)據(jù)量相差2×104bit。
通過上述分析可知,使用基于半監(jiān)督監(jiān)測系統(tǒng)的虛假數(shù)據(jù)量監(jiān)測結(jié)果更加精準(zhǔn),為了進一步驗證3種系統(tǒng)的監(jiān)測效率,以1 min 為時間間隔進行對比分析,結(jié)果如表1 所示。
表1 3種系統(tǒng)監(jiān)測效率對比分析
由表1 可知,使用基于約束傳感器的實時監(jiān)測系統(tǒng)最高監(jiān)測效率為0.81;使用模型監(jiān)測系統(tǒng)最高監(jiān)測效率為0.65;基于半監(jiān)督監(jiān)測系統(tǒng)最高監(jiān)測效率為0.96。
該文提出的基于半監(jiān)督的電網(wǎng)虛假數(shù)據(jù)實時監(jiān)測系統(tǒng),通過硬件結(jié)構(gòu)設(shè)計及軟件部分優(yōu)化,結(jié)合基于半監(jiān)督學(xué)習(xí)模型,通過迭代學(xué)習(xí)檢測虛假數(shù)據(jù),通過實驗驗證了該系統(tǒng)設(shè)計的合理性。根據(jù)電網(wǎng)綜合業(yè)務(wù)數(shù)據(jù)監(jiān)控的需要,利用專業(yè)實驗裝置對系統(tǒng)進行驗證,實現(xiàn)了對復(fù)雜電網(wǎng)結(jié)構(gòu)及特殊環(huán)境下的實時運行數(shù)據(jù)監(jiān)控?;诎氡O(jiān)督的電網(wǎng)虛假數(shù)據(jù)實時監(jiān)測系統(tǒng),提高了系統(tǒng)監(jiān)測效率,提高了電力企業(yè)數(shù)據(jù)質(zhì)量,確保電網(wǎng)安全穩(wěn)定地運行。