劉曉霞,周明哲
(國網(wǎng)內(nèi)蒙古東部電力有限公司信息通信分公司,內(nèi)蒙古 呼和浩特 010010)
智能電網(wǎng),其實就是應用信息與通信技術(shù)智能化、全系統(tǒng)管理電力系統(tǒng)的輸電、發(fā)電、變電及用電情況。智能電網(wǎng)為我國電力行業(yè)產(chǎn)品創(chuàng)新與有效管理提供了技術(shù)保障,但在電力系統(tǒng)建設期間,智能電網(wǎng)信息采集是否完整和真實,通常會對其運行效果產(chǎn)生重大影響[1]。所以,有必要深度挖掘智能電網(wǎng)信息異常數(shù)據(jù)。陳杰等學者結(jié)合孤立森林算法與Wasserstein 生成式對抗網(wǎng)絡,并提出異常數(shù)據(jù)辨識方法。對距離生成對抗網(wǎng)絡(英文簡稱WGAN)交互訓練生成器與判別器進行有效融合,將電力統(tǒng)計數(shù)據(jù)分布特征提取出來,借助隔離樹算法識別均衡數(shù)據(jù),再對模型識別查全率、準確率和查準率等展開比較,研究結(jié)果發(fā)現(xiàn),這一異常數(shù)據(jù)強化算法能夠大大提升異常數(shù)據(jù)識別能力。學者李婧等在大規(guī)模電網(wǎng)異常負荷聚類中運用自適應k-means++,并檢驗了不同聚類狀態(tài)下的聚類結(jié)果,有效防止人工設置產(chǎn)生的聚類結(jié)果偏移,實現(xiàn)異常負荷分類精度的有效提升。本文在數(shù)據(jù)挖掘中應用云計算技術(shù),基于智能電網(wǎng)信息流特性,將異常數(shù)據(jù)輸入空間映射至特征空間,從而實現(xiàn)異常數(shù)據(jù)線性判定函數(shù)的構(gòu)造。
信息數(shù)據(jù)挖掘,指的是數(shù)據(jù)倉或數(shù)據(jù)庫內(nèi),通過各種分析技術(shù),分析、歸納和整理以往積累的繁雜數(shù)據(jù),提取有用信息數(shù)據(jù),為決策者提供有用的資訊資料,其中包括離群分析、分類算法、關聯(lián)規(guī)則等。當前,針對電力系統(tǒng)的特點,提出了一種基于概率論的電力系統(tǒng)建模方法。評價適合于只對少數(shù)網(wǎng)絡信息數(shù)據(jù)進行處理的電力系統(tǒng)模擬模式等,面對海量數(shù)據(jù)處理,應改進傳統(tǒng)算法,可采用預測算法與聚類算法,改進傳統(tǒng)信息數(shù)據(jù)挖掘算法,最后,將該方法用于電力系統(tǒng)的負載預報和電力消費的研究中。
本項目擬從云計算的基本特征出發(fā),針對智慧電網(wǎng)應用的實際應用,提出了一種新的解決方案:云基礎設施層、平臺層、應用軟件集合層、業(yè)務接入層。由于智能電網(wǎng)的網(wǎng)絡規(guī)模很大,任何一個節(jié)點或者一個計算機終端的運算需求都必須通過云端來進行配置;這樣一來,中央的壓力就更大了,而且權(quán)限的判斷也很繁瑣,極易導致網(wǎng)絡阻塞。因為電力系統(tǒng)有著清晰的分層空中、分級管理層次,所以,可根據(jù)級別創(chuàng)建主云與子云,以限定權(quán)限與資源分配,減少了對系統(tǒng)中多余的資源分配和權(quán)限的管理,實現(xiàn)云計算資源的合理化,同時該系統(tǒng)還可以實現(xiàn)對電力系統(tǒng)的實時處理。
智能電網(wǎng)信息數(shù)據(jù)驅(qū)動體系中,通過云計算技術(shù)搭建智能電網(wǎng)信息異常數(shù)據(jù)處理平臺,借助該云計算軟件,對數(shù)據(jù)計算單元進行設置,以展開數(shù)據(jù)處理,同時在輸出端與區(qū)塊鏈系統(tǒng)相連接,區(qū)塊鏈選擇分布式數(shù)據(jù)存儲,表現(xiàn)為加密算法、對點傳輸以及共識機制等特性,將其應用在智能電網(wǎng)中,既有助于永久性存儲數(shù)據(jù),又具備數(shù)據(jù)保密特性,便于用戶數(shù)據(jù)共享[2]。
在構(gòu)建智能電網(wǎng)的過程中,節(jié)點j 是一個數(shù)據(jù)點,j 表示的是信息流任意數(shù)據(jù)點,aj表示的是智能電網(wǎng)信息流,En表示的是信息流輸入空間,n 為空間維度。通過φ(.):En→G映射電網(wǎng)信息流輸入空間至特征空間,因此,在該特征空間構(gòu)建了一種用于電力系統(tǒng)的信息流動的線性決策方程,具體公式為:f(a)=εT.φ(a)-p,該公式中,φ(a)表示智能電網(wǎng)的信息流映射向量,線性判定函數(shù)f(a)偏移量采用P 表示,T 時刻下f(a)歸一化矢量采用εT表示。轉(zhuǎn)化p、εT的二次規(guī)劃問題為對偶問題,通過精準判斷其極值條件,對智能電網(wǎng)信息異常數(shù)據(jù)進行有效挖掘,具體公式為:
在該公式中,K(aj,a)為智能電網(wǎng)信息異常數(shù)據(jù)監(jiān)測函數(shù),信息異常數(shù)據(jù)監(jiān)測響應系數(shù)由λj表示[3]。
明確電網(wǎng)信息異常數(shù)據(jù)隸屬度,對信息異常數(shù)據(jù)的多維度屬性進行了高效的抽取,然后對其進行了清晰的劃分,并用公式對信息異常數(shù)據(jù)進行了計算,從而對其求解,公式是:
該公式中,x 代表的是智能電網(wǎng)信息異常數(shù)據(jù)的目標函數(shù)值,δpq為異常信息數(shù)據(jù)特征向量隸屬度,代表的是第a、b 個異常信息數(shù)據(jù)之間的距離。以信息異常數(shù)據(jù)為基礎,以此為基礎,有效地提取智能電網(wǎng)中的異常信息特征。公式表示是:
該公式中,M 是指網(wǎng)絡狀態(tài)下的異常值與簇群中心的間距,φ代表了網(wǎng)絡異常狀態(tài)下的權(quán)重。根據(jù)信息異常數(shù)據(jù)x 的資訊熵,將智能電網(wǎng)信息的異常數(shù)據(jù)輸入云端,并對其進行參數(shù)關聯(lián)程度的計算,具體為:
該公式中,β代表的是信息異常數(shù)據(jù)特征相關參數(shù)關聯(lián)系數(shù)[4]。
利用云計算技術(shù),預處理智能電網(wǎng)內(nèi)部異常數(shù)據(jù)信息,并對其進行高效挖掘。在對智能電網(wǎng)內(nèi)部異常信息數(shù)據(jù)進行挖掘期間,將信息異常數(shù)據(jù)的復雜性定義為f(pq),那么,智能電網(wǎng)數(shù)據(jù)庫包括:p 個異常數(shù)據(jù)庫和q 個正常數(shù)據(jù)庫,經(jīng)過反復篩選之后,得到了如下的公式:f(pq)=f(qo),p≠q,該公式中,異常信息數(shù)據(jù)特征數(shù)由o 表示。
在篩選出的異常信息資料的基礎上,準確地計算出智能電網(wǎng)的異常信息資料在空間上的分布,求解電力系統(tǒng)中的異常信息的權(quán)重,具體公式是:
該公式中,ωi表示的是第i 類別中的智能電網(wǎng)信息異常數(shù)據(jù)對應權(quán)值,而ξi代表的是智能電網(wǎng)信息異常數(shù)據(jù)的波動系數(shù)[5]。
為對云計算下的智能電網(wǎng)信息異常數(shù)據(jù)挖掘性能進行有效驗證,通過實驗平臺的搭建,展開測試,采用Windows 11 系統(tǒng),同時搭載頻率為200GHz、8GB 內(nèi)存的CORE i8 系統(tǒng)處理器,使用MySQL 2020 作為電力網(wǎng)絡中的異常數(shù)據(jù)源,并使用Java 軟件來建立試驗數(shù)據(jù)源。
通過對一個實際的電力系統(tǒng)的實際運行資料進行分析,選取了200 條異常資料,其中,接地故障49 條,電壓故障34 條,共計26 次故障和91 次發(fā)電設備故障。
為確保電網(wǎng)信息異常數(shù)據(jù)挖掘質(zhì)量,采用準確率指數(shù)來度量電力系統(tǒng)中異常信息的挖掘準確度,如果存在較高的查準率,說明電網(wǎng)具有越高的信息異常數(shù)據(jù)挖掘精度。查準率計算公式為:
其中,Gp為電網(wǎng)信息異常數(shù)據(jù)特征關聯(lián)度,Tr為電網(wǎng)信息異常數(shù)據(jù)采集周期,而hb代表的是智能電網(wǎng)的異常資料特征。
對電力系統(tǒng)中的異常信息資料進行了挖掘,利用冗余指數(shù)對電力系統(tǒng)中的異常信息資料進行分析,計算公式為:
該公式中,ψj為電網(wǎng)異常信息數(shù)據(jù)挖掘均衡性,S則為電網(wǎng)異常信息數(shù)據(jù)觀測向量。
該實驗為突出基于云計算的電網(wǎng)信息異常數(shù)據(jù)挖掘優(yōu)越性,比較了兩種基于適應性的K-means++和基于改進的支持型對抗網(wǎng)絡兩種不同的數(shù)據(jù)挖掘方法。在模擬實驗平臺中,對三種方法的異常數(shù)據(jù)挖掘冗余度、查準率展開挖掘,最后發(fā)現(xiàn),在檢驗智能電網(wǎng)信息異常挖掘精度的同時,由于數(shù)據(jù)規(guī)模不斷增大,三種算法的準確率也在不斷提高,其中,基于云計算的電力系統(tǒng)異常挖掘準確率最高。針對200 個電力系統(tǒng)中的異常數(shù)據(jù),其準確率達到98.9%;當有200 個電力網(wǎng)絡資料不正常時,該算法的召回率僅為72.3%,適用于進行異常數(shù)據(jù)的分析。在圖1 中顯示了電力系統(tǒng)信息的異常數(shù)據(jù)挖掘的冗余。
圖1 電網(wǎng)信息異常數(shù)據(jù)挖掘的冗余度
通過分析圖1 可知,針對當前電力系統(tǒng)中的異常數(shù)據(jù)日益增多,現(xiàn)有三種挖掘方法的冗余程度都小于50%,采用基于K 均值和基于改進的產(chǎn)生式對抗網(wǎng)絡的電力系統(tǒng)異常挖掘技術(shù),可使電力系統(tǒng)的異常挖掘冗余超過20%,應用本文所提出的方法對信息異常數(shù)據(jù)進行挖掘,雖然有200 個信息異常,但冗余還是不到10%,可見基于云計算的智能電網(wǎng)信息異常數(shù)據(jù)挖掘,有助于數(shù)據(jù)挖掘質(zhì)量的提升。
基于云計算下的智能電網(wǎng)信息異常數(shù)據(jù)挖掘中,深入分析智能電網(wǎng)中的異常數(shù)據(jù),能夠?qū)崿F(xiàn)對信息異常數(shù)據(jù)準確性、挖掘效率的全面提升。但該研究仍有一系列缺陷,主要是智能電網(wǎng)信息異常數(shù)據(jù)通常會由于時間的變遷而發(fā)生變化,所以挖掘?qū)崟r狀態(tài)的電網(wǎng)信息異常數(shù)據(jù)是今后需重點研究的課題之一。