周忠冉,顧亞林,張俊杰
(南京南瑞信息通信科技有限公司,江蘇,南京 210003)
現(xiàn)有的基于云計(jì)算架構(gòu)的電力物聯(lián)網(wǎng)會(huì)將這些數(shù)據(jù)全部傳入云端進(jìn)行數(shù)據(jù)分析和處理,這不但會(huì)使云端背負(fù)較大的計(jì)算壓力,也會(huì)給數(shù)據(jù)傳輸路線造成巨大的寬帶負(fù)擔(dān),因而這種模式已經(jīng)無法滿足行業(yè)日益増長的數(shù)據(jù)處理需求[1-2]。本文基于邊緣計(jì)算架構(gòu)設(shè)計(jì)了一種基于云邊協(xié)同架構(gòu)的電力物聯(lián)網(wǎng)數(shù)據(jù)分類處理方法。本方法把在邊緣層匯總收集的原始數(shù)據(jù)利用隨機(jī)森林算法進(jìn)行分類和處理,并反饋處理結(jié)果,相比較于傳統(tǒng)的云中心架構(gòu)的電網(wǎng)數(shù)據(jù)處理方法,本方法提升了數(shù)據(jù)處理的速度,同時(shí)又避免了將數(shù)據(jù)上傳和等待數(shù)據(jù)返回的延遲,達(dá)到了對數(shù)據(jù)的快速響應(yīng)。
(1)
其中,函數(shù)f(dj)為統(tǒng)計(jì)dj出現(xiàn)次數(shù)[3-5]。
數(shù)據(jù)集X依據(jù)第j個(gè)屬性劃分的對應(yīng)基尼系數(shù)公式為
(2)
其中,|X|是集合X中元素的個(gè)數(shù)。
選擇對應(yīng)基尼系數(shù)最小的第j個(gè)屬性作為其數(shù)據(jù)集分裂的依據(jù)進(jìn)行分割數(shù)據(jù)集。
結(jié)合粒子群算法思想,選取CART樹的數(shù)量T以及數(shù)據(jù)子集大小k的最優(yōu)解,縮短模型訓(xùn)練時(shí)間,提升模型檢測準(zhǔn)確率[6],每個(gè)粒子包含兩個(gè)屬性,分別為速度v和位置p。
假設(shè)對T和k進(jìn)行初始化的次數(shù)為A,粒子空間維度為B,在該粒子空間中,每個(gè)粒子在解空間中單獨(dú)搜尋最優(yōu)解,將其作為個(gè)體極值,則第a個(gè)粒子的個(gè)體極值表示為Pa={vab,pab},其中a=1,2,…,A,b=1,2,…,B。Pa通過學(xué)習(xí)自身歷史經(jīng)驗(yàn)和種群全體歷史經(jīng)驗(yàn),更新速度v和位置p數(shù)值,第a個(gè)粒子更新的va和pa[7]表示為
βrandom(vab)(Pab-pab)
(3)
Pab=pab+vab
(4)
引入袋外數(shù)據(jù)誤差εodb來找到最優(yōu)解,記為Pbest,對應(yīng)的εodb表達(dá)式為
(5)
其中,εi表示第i棵CART樹的袋外誤差。由于隨機(jī)森林構(gòu)建每一棵CART樹都是在數(shù)據(jù)集中選取一個(gè)子集進(jìn)行構(gòu)建,因此余下的數(shù)據(jù)集可以作為驗(yàn)證數(shù)據(jù)集去評估該棵CART樹[8]。袋外誤差率在一定程度上可以體現(xiàn)隨機(jī)森林的分類準(zhǔn)確率。
參數(shù)優(yōu)化流程如下所示。
第一步 初始化次數(shù)為A,粒子空間維度為B,每個(gè)粒子初始速度和位置分別為va和pa。
第二步 將每個(gè)粒子帶入隨機(jī)森林模型,計(jì)算εodb。
第三步 對于粒子Pa,如果其對應(yīng)的εodb 第四步 返回第二步,直到滿足最大迭代次數(shù)。 當(dāng)獲取最佳CART樹的數(shù)量T以及數(shù)據(jù)子集大小k后,可以根據(jù)該參數(shù)構(gòu)建隨機(jī)森林模型。 LSTM在RNN的基礎(chǔ)之上增加了一個(gè)長期狀態(tài)c來保存長期狀態(tài),解決了梯度消失問題,非常適合處理時(shí)間序列的分類問題[9]。 LSTM神經(jīng)單元的計(jì)算公式如下: ct=sigmod(ft)×ct-1+sigmod(it)×tanh(ct) (6) ht=sigmod(ot)×tanh(ct) (7) FCN將傳統(tǒng)CNN中的連接層全轉(zhuǎn)化成多個(gè)卷積層,故稱為全卷積網(wǎng)絡(luò)。當(dāng)卷積層的層數(shù)為L,X為長度為F0且時(shí)間步長為t的特征輸入向量時(shí),每層的濾波公式為 (8) 其中,l為當(dāng)前的層數(shù),Wl∈RFl×d×Fl-1為張量,bl∈RFl為偏置值,d為過濾持續(xù)時(shí)間,f(·)為校正線性單元。 LSTM-FCN通過在LSTM中加入注意機(jī)制,實(shí)現(xiàn)了LSTM-RNN中很難學(xué)習(xí)到的長時(shí)間依賴項(xiàng),其架構(gòu)如圖1所示。 圖1 LSTM-FCN 結(jié)構(gòu) 本文提出的方法架構(gòu)如圖2所示,分為設(shè)備層、邊緣層和云端層。設(shè)備層包含各個(gè)產(chǎn)生數(shù)據(jù)的設(shè)備終端,負(fù)責(zé)收集數(shù)據(jù),進(jìn)行數(shù)據(jù)預(yù)處理并將其發(fā)送到邊緣層;邊緣層為部署在設(shè)備層附近的數(shù)據(jù)處理器,其靠近設(shè)備終端,實(shí)時(shí)匯總預(yù)處理數(shù)據(jù),就近提供數(shù)據(jù)處理等服務(wù)。通過改進(jìn)的隨機(jī)森林模型將其分為正常上載數(shù)據(jù)和待處理數(shù)據(jù),之后將正常上載數(shù)據(jù)和待處理數(shù)據(jù)的結(jié)果反饋給設(shè)備,實(shí)現(xiàn)設(shè)備的實(shí)時(shí)檢測。同時(shí),將待處理數(shù)據(jù)上傳到云端層。在云端利用Bi-LSTM數(shù)據(jù)分類模型對這些數(shù)據(jù)進(jìn)行分類存儲(chǔ),利用大數(shù)據(jù)和專家系統(tǒng)進(jìn)行全網(wǎng)的設(shè)備分析和用戶用量等的分析,再將分析結(jié)果下傳到對應(yīng)的邊緣層,對涉及到的設(shè)備進(jìn)行優(yōu)化處理。 圖2 基于云邊協(xié)同架構(gòu)的電力物聯(lián)網(wǎng)數(shù)據(jù)分類處理方法架構(gòu) 在電力物聯(lián)網(wǎng)中,需要在邊緣層對數(shù)據(jù)進(jìn)行處理,快速判斷設(shè)備的運(yùn)行狀態(tài)并對其進(jìn)行故障檢測,完成對異常情況的及時(shí)處理,防止更大的故障出現(xiàn)。而電表中的數(shù)據(jù)通常用于進(jìn)行用量分析和需求分析,必須結(jié)合全網(wǎng)的數(shù)據(jù)進(jìn)行分析,需要傳輸?shù)皆贫藢雍筮M(jìn)行處理[10]。 因此,設(shè)備層實(shí)時(shí)采集和匯總原始數(shù)據(jù)D后,對其進(jìn)行數(shù)據(jù)預(yù)處理得到D′。根據(jù)數(shù)據(jù)的來源,邊緣層首先將數(shù)據(jù)進(jìn)行初步分類,判斷數(shù)據(jù)是否為異常數(shù)據(jù),將其分為正常上載數(shù)據(jù)UpD和待處理數(shù)據(jù)PeD。邊緣層直接將上載數(shù)據(jù)上傳到云端層進(jìn)行進(jìn)一步分類分析,同時(shí)將異常結(jié)果反饋給設(shè)備層,實(shí)現(xiàn)實(shí)時(shí)檢測。 對于獲得的預(yù)處理數(shù)據(jù)D′,在邊緣層使用優(yōu)化的隨機(jī)森林進(jìn)行故障檢測,偽代碼如圖2 所示。對數(shù)據(jù)D′采用滑動(dòng)窗口方式進(jìn)行特征提取,利用Bagging方法從原始數(shù)據(jù)集中隨機(jī)抽取訓(xùn)練數(shù)據(jù)子集訓(xùn)練T棵CART樹,利用測試數(shù)據(jù)集進(jìn)行測試,輸出結(jié)果為綜合T棵CART樹的分類結(jié)果。完成后將故障檢測結(jié)果下傳到設(shè)備層,并將待處理數(shù)據(jù)PeD={Time,Type,Data},打包發(fā)送到云端層。 算法1 隨機(jī)森林故障檢測模型 圖2 故障檢測模型 在云端層,接收到來自邊緣層處理數(shù)據(jù)PeD,需要對這些數(shù)據(jù)進(jìn)行分類存儲(chǔ)以便于之后的大數(shù)據(jù)分析。本文采用LSTM-FCN對數(shù)據(jù)進(jìn)行分類,分類過程如下。 (1) 輸入數(shù)據(jù)傳入時(shí)間卷積塊,數(shù)據(jù)在塊中先通過時(shí)間卷積層,再使用批量歸一化,之后通過ReLU激活函數(shù)得到該塊的輸出,輸出再作為輸入傳送到下一個(gè)卷積塊,重復(fù)2次上述過程。 (2) 經(jīng)過3個(gè)堆疊的時(shí)間卷積塊的數(shù)據(jù)進(jìn)入全局平均池化層。 (3) 輸入數(shù)據(jù)同時(shí)被送入維度混洗層(dimension shuffle layer),之后將變幻后的數(shù)據(jù)輸入到由BasicLSTM和Attention LSTM組成的LSTM塊中,之后經(jīng)過Dropout。 (4) 將全局平均池化層和LSTM塊的輸出進(jìn)行串聯(lián),發(fā)送到softmax分類層進(jìn)行分類,得到分類結(jié)果。 實(shí)驗(yàn)數(shù)據(jù)選取江蘇某市變電站2019年的數(shù)據(jù)作為樣本數(shù)據(jù)集,其中70%的數(shù)據(jù)作為訓(xùn)練集,剩下30%作為測試集。為了驗(yàn)證算法的性能,選取變電站1—6月的數(shù)據(jù),選用SVM 方法、貝葉斯和本文的隨機(jī)森林模型算法進(jìn)行比較,比較結(jié)果如圖3所示。 圖3 算法性能比較測試 從圖3可以看出,本文的隨機(jī)森林算法在準(zhǔn)確率上基本優(yōu)于其他2個(gè)算法,平均準(zhǔn)確率在93%左右。 為驗(yàn)證云端數(shù)據(jù)分類模型的性能,選取變電站2019年7月的數(shù)據(jù),分成數(shù)量大小為50、100、150、200、250的數(shù)據(jù)集,使用本文的LSTM-FCN和傳統(tǒng)的LSTM、FCN進(jìn)行比較,如圖4所示。從圖4可以看出,本文的LSTM-FCN算法在準(zhǔn)確率上基本優(yōu)于其他2個(gè)算法,平均準(zhǔn)確率在94%左右。 圖4 算法準(zhǔn)確率比較測試 選取變電站2019年1—5月的數(shù)據(jù),分別分成5個(gè)數(shù)據(jù)集,使用本文的LSTM-FCN和傳統(tǒng)的LSTM、FCN進(jìn)行比較,如圖5所示。從圖5可以看出,本文的LSTM-FCN算法在準(zhǔn)確率上基本優(yōu)于其他2個(gè)算法,平均準(zhǔn)確率在94%左右。 圖5 算法準(zhǔn)確率對比測試 現(xiàn)有的電力物聯(lián)網(wǎng)技術(shù)無法滿足行業(yè)日益増長的數(shù)據(jù)處理需求,本文基于電力物聯(lián)網(wǎng)架構(gòu)云邊架構(gòu),設(shè)計(jì)了一種基于云邊協(xié)同架構(gòu)的電力物聯(lián)網(wǎng)數(shù)據(jù)分類處理模型方法,利用隨機(jī)森林算法對感知層數(shù)據(jù)進(jìn)行實(shí)時(shí)分類和處理,在云端層利用LSTM-FCN數(shù)據(jù)分類模型對這些數(shù)據(jù)進(jìn)行分類存儲(chǔ),測試結(jié)果證明了該模型方法具有較好的實(shí)用價(jià)值。下一步將針對低帶寬、長時(shí)延場景下的云邊協(xié)同數(shù)據(jù)處理技術(shù)進(jìn)行研究,完善云邊協(xié)同模型,更好地支撐電力智慧物聯(lián)體系建設(shè)。1.3 LSTM-FCN
2 模型構(gòu)建
2.1 模型架構(gòu)
2.2 邊緣層數(shù)據(jù)分類
2.3 邊緣層故障檢測
2.4 云端數(shù)據(jù)分類
3 實(shí)驗(yàn)驗(yàn)證
4 總結(jié)