孫向聚,郝 婷,宋 曦,王 雪
(1.國網(wǎng)甘肅省電力公司信息通信公司,甘肅 蘭州 730050;2.國網(wǎng)甘肅省電力公司,甘肅 蘭州 730050)
良好的網(wǎng)絡(luò)運(yùn)行狀況是電網(wǎng)管理的重要指標(biāo)。隨著電網(wǎng)結(jié)構(gòu)的日益復(fù)雜和通信協(xié)議的多樣化,管理人員在面對復(fù)雜的電網(wǎng)數(shù)據(jù)時無所適從。針對這種情況,網(wǎng)絡(luò)運(yùn)行態(tài)勢感知方法應(yīng)運(yùn)而生[1]。然而,隨著電網(wǎng)信息交換頻繁和異常事件的發(fā)生,對電網(wǎng)的安全高效運(yùn)行提出了新的挑戰(zhàn)。有關(guān)專家對電網(wǎng)監(jiān)控通信網(wǎng)的運(yùn)行情況做了大量的研究。例如,劉紅軍等[2]優(yōu)先對網(wǎng)絡(luò)度量標(biāo)準(zhǔn)進(jìn)行度量,將靜態(tài)經(jīng)濟(jì)收益設(shè)定為網(wǎng)絡(luò)狀態(tài)轉(zhuǎn)移的判定準(zhǔn)則,采用演化博弈論構(gòu)建復(fù)制動態(tài)方程,動態(tài)再現(xiàn)不同攻擊方的對抗行為,預(yù)測各種攻擊行為的變化情況,設(shè)定符合當(dāng)前攻擊的防護(hù)措施,進(jìn)而完成網(wǎng)絡(luò)安全態(tài)勢感知。程家根等[3]優(yōu)先分析網(wǎng)絡(luò)安全態(tài)勢的主要特點(diǎn),使用RBF神經(jīng)網(wǎng)絡(luò)獲取網(wǎng)絡(luò)運(yùn)行態(tài)勢對應(yīng)的非線性映射關(guān)系,同時利用遺傳算法進(jìn)行尋優(yōu),實(shí)現(xiàn)網(wǎng)絡(luò)運(yùn)行態(tài)勢感知。
由于上述已有方法沒有刪除電網(wǎng)監(jiān)控通信網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)的冗余特征,導(dǎo)致感知結(jié)果較差,平均計(jì)算時間和迭代次數(shù)上升。為了解決上述問題,提出一種基于機(jī)器學(xué)習(xí)的電網(wǎng)監(jiān)控通信網(wǎng)絡(luò)運(yùn)行態(tài)勢感知方法。
決策樹是機(jī)器學(xué)習(xí)中使用次數(shù)比較多的學(xué)習(xí)分類算法[4-5],由多個不同的節(jié)點(diǎn)組成,分別為根節(jié)點(diǎn)、葉節(jié)點(diǎn)、中間節(jié)點(diǎn)。其中,一種類型的節(jié)點(diǎn)代表一種分類結(jié)果。
設(shè)定T為電網(wǎng)監(jiān)控通信數(shù)據(jù)訓(xùn)練數(shù)據(jù)集,主要通過特征向量和分類結(jié)果對訓(xùn)練集中的通信數(shù)據(jù)樣本進(jìn)行描述。其中,(A1,A2,…,An)代表分類對象屬性,同時全部分類結(jié)果共同建立的集合可以表示為{C1,C2,…,Cm}。為了實(shí)現(xiàn)中低壓配電網(wǎng)智能化,減少人為操作故障次數(shù),快速定位故障, 針對屬性Ai而言,操作故障值域可以表示為D(Ai)。另外,值域不僅可以是離散分布的,同時也可以是連續(xù)分布的。
針對給定訓(xùn)練集T而言,將不同的故障屬性取值和分類結(jié)果放置在[0,1]區(qū)間內(nèi)進(jìn)行量化處理,同時采用神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練與定位故障,獲取屬性Ai和分類結(jié)果之間的數(shù)學(xué)關(guān)系模型C(X),利用式(1)給出具體的表達(dá)形式:
C(X)=F(A1,A2,…,An)
(1)
式中:F為電網(wǎng)運(yùn)行數(shù)據(jù)的權(quán)值。
針對給定的電網(wǎng)監(jiān)控通信網(wǎng)絡(luò)而言,以上描述是通過權(quán)值和閾值進(jìn)行描述。所以,借助電網(wǎng)通信數(shù)據(jù)的具體權(quán)值和閾值分類特征Ai對不同分類結(jié)果之間的具體關(guān)系進(jìn)行分析。在Ai中加入決定強(qiáng)度概念DS(Ai)。其中決定強(qiáng)度DS(Ai)就是屬性Ai對分類結(jié)果的決定程度。利用式(2)給出對應(yīng)的計(jì)算結(jié)果:
(2)
式中:C(X)為屬性Ai偏導(dǎo)數(shù)對應(yīng)的絕對值;?為閾值。其中,決策強(qiáng)度的計(jì)算是通過分類結(jié)果C(X)和屬性Ai兩者共同實(shí)現(xiàn)的,為電網(wǎng)監(jiān)控通信網(wǎng)絡(luò)設(shè)備的現(xiàn)有狀態(tài)評估和檢修提供依據(jù)。
通過式(3)獲取電網(wǎng)監(jiān)控通信網(wǎng)絡(luò)運(yùn)行態(tài)勢對應(yīng)的激活函數(shù)f(x):
(3)
式中:μ0為任意常數(shù);x為偏導(dǎo)數(shù)的取值范圍;th為運(yùn)行時長。
針對單隱含層前饋神經(jīng)網(wǎng)絡(luò),能夠準(zhǔn)確推算出電網(wǎng)輸出對網(wǎng)絡(luò)輸入的偏導(dǎo)數(shù),具體的計(jì)算式如下:
(4)
式中:O1為輸出層不同神經(jīng)元的網(wǎng)絡(luò)輸出;Ii為輸入層神經(jīng)元的網(wǎng)絡(luò)輸入。
以下給出基于神經(jīng)網(wǎng)絡(luò)的決策樹建立過程:
1)數(shù)據(jù)預(yù)處理
監(jiān)控子站內(nèi)部設(shè)備主要包括中壓開關(guān)成套設(shè)備及其智能終端等,所以電網(wǎng)數(shù)據(jù)預(yù)處理主要包含數(shù)據(jù)篩選以及屬性取值的量化處理等終端操作。在量化處理過程中,按照某種順序?qū)傩院头诸惤Y(jié)果設(shè)定在區(qū)間[0,1]內(nèi)。
2)神經(jīng)網(wǎng)絡(luò)訓(xùn)練
通過給定的樣本對網(wǎng)絡(luò)進(jìn)行訓(xùn)練[6-7]。
3)建樹算法
選擇強(qiáng)度最大的屬性作為拓展屬性,詳細(xì)的操作流程為:
(1)考慮到電網(wǎng)監(jiān)控通信終端存在著分散、數(shù)據(jù)量多、距離長,架設(shè)有線通信不經(jīng)濟(jì)的問題,對于已經(jīng)給定的例子集合,選取決定強(qiáng)度最大的屬性Ai作為擴(kuò)展屬性。
(2)將屬性Ai取值相同的例子劃分到同一子集中。
(3)針對含有不同類的子集,假設(shè)分類精度低于預(yù)測精度,建立建樹算法。
(4)假設(shè)子集為同一類型,標(biāo)記對應(yīng)分支的種類,然后返回值調(diào)用處。
在上述分析的基礎(chǔ)上,電網(wǎng)監(jiān)控通信網(wǎng)絡(luò)交換數(shù)據(jù)包括上行的檢測數(shù)據(jù)、圖像數(shù)據(jù)、視頻數(shù)據(jù)和下行的控制命令,需要采用方差過濾器將電網(wǎng)數(shù)據(jù)集中的冗余特征和無利用價值的特征刪除,進(jìn)而采用基于神經(jīng)網(wǎng)絡(luò)的決策樹算法完成電網(wǎng)監(jiān)控通信網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)特征提取和分類預(yù)測[8-9]。
通過K-means算法進(jìn)行電網(wǎng)監(jiān)控通信網(wǎng)絡(luò)運(yùn)行態(tài)勢感知,詳細(xì)的操作過程如下所示。
優(yōu)先給出K-means算法的詳細(xì)操作步驟[10-11]:
(1)優(yōu)先確定聚類數(shù)量k,設(shè)定輸入數(shù)據(jù)向量組為X;同時在n個數(shù)據(jù)向量中隨機(jī)選擇k個向量,將其作為初始聚類中心。
(2)計(jì)算各個向量到k個初始聚類中心的歐式距離,同時獲取距離最小值中的向量所在的聚類中心。
(3)假設(shè)聚類中的數(shù)據(jù)向量存在明顯變化,則對聚類中心進(jìn)行重新計(jì)算,該系統(tǒng)通過將儲能電機(jī)工作電流多次聚類,得到電網(wǎng)設(shè)備的啟動及工作波形,實(shí)時監(jiān)測母線三相電壓、電流值等具體數(shù)據(jù),實(shí)時監(jiān)控電網(wǎng)監(jiān)控通信網(wǎng)絡(luò)運(yùn)行態(tài)勢。
(4)重復(fù)步驟(2)和步驟(3),直至各個聚類中心不再發(fā)生任何變化或者中心距離低于設(shè)定的閾值。
通過步驟(4)能夠獲取平方誤差函數(shù)E,具體的計(jì)算公式為
(5)
式中:k為聚類數(shù)量;xi為數(shù)據(jù)向量;mi為第i個聚類的平均值向量;xj為數(shù)據(jù)向量組。
通過K-means算法對電網(wǎng)監(jiān)控通信網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)進(jìn)行預(yù)處理[12-13]。聚類效果的好壞需要通過輪廓系數(shù)取值大小進(jìn)行判定,選取合適的輪廓系數(shù)能夠更好實(shí)現(xiàn)凝聚度的分離和結(jié)合。其中,輪廓系數(shù)的取值越大,則說明聚類效果越好,從而對整個電網(wǎng)監(jiān)控通信網(wǎng)絡(luò)的狀態(tài)進(jìn)行評估。以下給出輪廓系數(shù)的詳細(xì)計(jì)算過程:
(1)計(jì)算凝聚度,如式(6)所示:
(6)
式中:aij為凝聚度;xij為向量點(diǎn);xik為除了xij外的向量點(diǎn)。
(2)計(jì)算分離度bij:
(7)
式中:xkl為聚類中除了Xi簇中的點(diǎn)。
(3)針對向量xij,需要獲取輪廓系數(shù)計(jì)算公式:
(8)
式中:sij為輪廓系數(shù)。
另外,輪廓系數(shù)還能夠表示為式(9)的形式:
(9)
(4)計(jì)算全部向量點(diǎn)對應(yīng)的輪廓系數(shù),選取輪廓系數(shù)平均值s整體輪廓系數(shù),具體計(jì)算式如下所示:
(10)
式中:n為向量點(diǎn)總數(shù)。
針對態(tài)勢因子向量選擇最佳k值,進(jìn)行數(shù)據(jù)分析的主要目的需要確保數(shù)據(jù)的一致性。其中,需要特別注意的是:以電網(wǎng)監(jiān)控通信網(wǎng)絡(luò)運(yùn)行數(shù)據(jù)為初始數(shù)據(jù),所以在實(shí)際運(yùn)行過程中并沒有任何異常情況的出現(xiàn)。
傳統(tǒng)的K-means算法對初始條件十分敏感,即聚類結(jié)果可能會隨著初始聚類中心的變化而發(fā)生改變[14-15]。為了有效解決這一問題,需要對K-means算法進(jìn)行改進(jìn),經(jīng)過改進(jìn)后的K-means算法操作流程如圖1所示。
圖1 改進(jìn)的K-means算法的電網(wǎng)監(jiān)控通信操作流程圖
針對研究項(xiàng)目背景,對電網(wǎng)監(jiān)控通信網(wǎng)絡(luò)運(yùn)行態(tài)勢感知,考慮到骨干網(wǎng)無法組建精準(zhǔn)的模型函數(shù),需要借助機(jī)器學(xué)習(xí)完成電網(wǎng)監(jiān)控通信網(wǎng)絡(luò)運(yùn)行態(tài)勢感知。
(11)
(12)
(13)
為了驗(yàn)證所提基于機(jī)器學(xué)習(xí)的電網(wǎng)監(jiān)控通信網(wǎng)絡(luò)運(yùn)行態(tài)勢感知方法的有效性,需要進(jìn)行實(shí)例測試。
以某電力工程中的調(diào)度項(xiàng)目為例,其依據(jù)《電力監(jiān)控系統(tǒng)安全防護(hù)規(guī)定》(國家發(fā)展改革委2014年14號)、《電力監(jiān)控系統(tǒng)安全防護(hù)總體方案》(國能安全[2015]36號)《電力監(jiān)控系統(tǒng)安全防護(hù)管理規(guī)定》(Q/HNLCJ-YG04-2018)。在安全Ⅲ區(qū)建立系統(tǒng),在接通安全Ⅰ區(qū)的 EMS系統(tǒng)方面,從Ⅰ區(qū)到Ⅲ區(qū)的單一傳輸規(guī)定,采用正向隔離裝置進(jìn)行網(wǎng)絡(luò)安全防范;網(wǎng)絡(luò)發(fā)令客戶端通過調(diào)度數(shù)據(jù)網(wǎng)直接訪問,要求客戶端進(jìn)行防火墻設(shè)置,滿足并符合網(wǎng)絡(luò)安全管理要求。通信網(wǎng)絡(luò)應(yīng)采取保密、完整的措施,以確保本系統(tǒng)數(shù)據(jù)傳輸過程的安全。通過 VPN、 VLAN等,可以構(gòu)建虛擬專網(wǎng),為數(shù)據(jù)機(jī)密性和完整性提供一定的安全性。在每個前端系統(tǒng)的出口網(wǎng)絡(luò)上建立兩個不同方向的連接,以保證雙路由的備份,如圖2所示。
圖2 電力工程調(diào)度項(xiàng)目的電網(wǎng)監(jiān)控通信網(wǎng)絡(luò)
針對所提方法的感知性能進(jìn)行測試分析,優(yōu)先分析所提方法的真實(shí)電壓相角和預(yù)測到電壓相角兩者之間的差值變化,具體實(shí)驗(yàn)結(jié)果如圖3所示。
圖3 所提方法的電網(wǎng)監(jiān)控通信網(wǎng)絡(luò)運(yùn)行態(tài)勢感知性能測試分析
分析圖3中的實(shí)驗(yàn)數(shù)據(jù)可知,所提方法獲取的感知結(jié)果和真實(shí)值基本一致,說明所提方法具有較好的感知性能。
以下實(shí)驗(yàn)測試對比分析三種不同方法的感知性能,具體實(shí)驗(yàn)結(jié)果如圖4所示。
對圖4中的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行詳細(xì)分析可知,文獻(xiàn)[2]方法和文獻(xiàn)[3]方法感知性能明顯不如所提方法。由此更進(jìn)一步驗(yàn)證了所提方法能夠更好實(shí)現(xiàn)電網(wǎng)監(jiān)控通信網(wǎng)絡(luò)運(yùn)行態(tài)勢感知。
以下實(shí)驗(yàn)測試分別從平均計(jì)算時間、平均迭代次數(shù)以及電壓相角最大絕對誤差三方面進(jìn)行研究,利用圖5、圖6和表1給出具體的實(shí)驗(yàn)測試分析結(jié)果。
圖4 不同方法的電網(wǎng)監(jiān)控通信網(wǎng)絡(luò)運(yùn)行態(tài)勢感知性能測試分析
圖5 電壓相角最大絕對誤差
圖6 平均計(jì)算時間
表1 同方法的平均迭代次數(shù)測試分析
分析圖5、圖6以及表1中的實(shí)驗(yàn)數(shù)據(jù)可知,所提方法的電壓相角最大絕對誤差、平均計(jì)算時間以及平均迭代次數(shù)明顯低于文獻(xiàn)[2]方法和文獻(xiàn)[3]方法。主要是因?yàn)樗岱椒ú捎梅讲钸^濾器刪除數(shù)據(jù)集中的冗余和無相關(guān)特征,避免其他因素對感知性能產(chǎn)生影響,全面提升整個方法的感知性能,使所提方法的各項(xiàng)性能達(dá)到最優(yōu)狀態(tài)。
為了獲取更好的電網(wǎng)監(jiān)控通信網(wǎng)絡(luò)感知性能,提出一種基于機(jī)器學(xué)習(xí)的電網(wǎng)監(jiān)控通信網(wǎng)絡(luò)運(yùn)行態(tài)勢感知方法,采用決策樹遞歸特征消除算法,采用方差過濾器將電網(wǎng)數(shù)據(jù)集中的冗余特征和無利用價值的特征刪除,選取合適的輪廓系數(shù),通過誤差預(yù)測值對態(tài)勢因子進(jìn)行誤差修正,能夠大大減少平均計(jì)算時間和迭代次數(shù),獲取更加理想的感知結(jié)果。