李莎
(1.長沙理工大學(xué),湖南長沙410000;2.國網(wǎng)湖南省電力有限公司益陽供電分公司,湖南益陽413000)
Tensorflow框架是由Disebellef所研發(fā)的人工智能學(xué)習(xí)系統(tǒng),該框架具有較強(qiáng)的可移植性和靈活性。目前,在深度學(xué)習(xí)框架中,該框架是具有代表性的,通過建立Tensorflow框架,進(jìn)一步構(gòu)建深入學(xué)習(xí)用電異常檢測模型,能夠?qū)崟r(shí)檢測異常的用電數(shù)據(jù)。第二,結(jié)構(gòu)遞歸神經(jīng)網(wǎng)絡(luò)和LSTM結(jié)構(gòu),對(duì)于長短期記憶特征典型網(wǎng)絡(luò)的結(jié)構(gòu)來說,是由一個(gè)或多個(gè)長短信息模塊構(gòu)成,其包含4個(gè)部分,分別為輸入、輸出門、遺忘門以及長短期記憶單元。對(duì)于結(jié)構(gòu)遞歸神經(jīng)網(wǎng)絡(luò)是通過相似的多個(gè)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)遞歸,進(jìn)一步構(gòu)造為復(fù)雜深度網(wǎng)絡(luò),在2維平面中其結(jié)構(gòu)是與樹類似的,一般來說,在遞歸時(shí)很容易產(chǎn)生權(quán)重指數(shù)消失,進(jìn)而會(huì)使數(shù)據(jù)無法與結(jié)構(gòu)遞歸神經(jīng)網(wǎng)絡(luò)獲得對(duì)應(yīng)聯(lián)系,而長短期記憶結(jié)構(gòu)遞歸神經(jīng)網(wǎng)絡(luò)能夠解決上述問題,同時(shí),在機(jī)器翻譯以及基因分類等多個(gè)領(lǐng)域中獲得應(yīng)用。
為能夠?qū)崿F(xiàn)對(duì)異常用電模式的相關(guān)檢測,本研究提出可使用記憶深度學(xué)習(xí)框架用戶切電模式檢測模型,如圖1所示:
圖1 模式檢測模型圖
該模型是通過深度學(xué)習(xí)的方式,以找到用戶用電與用電數(shù)據(jù)之間的關(guān)系,進(jìn)一步分析竊電用電數(shù)據(jù)。第一,數(shù)據(jù)源以及數(shù)據(jù)集。本研究數(shù)據(jù)源來源于某電力企業(yè)所采集數(shù)據(jù)采集數(shù)據(jù)頻率為每隔15分鐘,樣本是數(shù)據(jù)源的其中部分?jǐn)?shù)據(jù),對(duì)于某電表三相電流數(shù)據(jù)可構(gòu)成一個(gè)數(shù)據(jù)維度,共288維,標(biāo)簽數(shù)據(jù)為該企業(yè)現(xiàn)場檢查和專家分析結(jié)果。為確保數(shù)據(jù)的安全性,要求對(duì)所收集數(shù)據(jù)需經(jīng)過脫敏分析,為能夠使數(shù)據(jù)與實(shí)際情況相接近,在訓(xùn)練集中可降低異常數(shù)據(jù)比例為進(jìn)一步檢測模型在確定數(shù)據(jù)分析的能力,在測試時(shí)可適當(dāng)引入一些異常數(shù)據(jù),第二,數(shù)據(jù)預(yù)處理,在數(shù)據(jù)設(shè)計(jì)時(shí)會(huì)出現(xiàn)一些錯(cuò)誤或重復(fù)的數(shù)據(jù),對(duì)此需要對(duì)所采集的數(shù)據(jù)進(jìn)行預(yù)處理。本研究采用數(shù)據(jù)清洗以及歸一化處理,前者是刪除一些重復(fù)信息,進(jìn)行缺失信息補(bǔ)充,糾正錯(cuò)誤信息,如式1為數(shù)據(jù)歸一化處理公式。
特征提取網(wǎng)絡(luò)。為能夠?qū)崿F(xiàn)特征數(shù)據(jù)的提取,可研究利用特征提取模塊,通過該模塊是由長期記憶模塊連接構(gòu)成的,即由上一個(gè)短期記憶模塊輸出作為下一個(gè)模塊輸入,在具體使用過程中,要求構(gòu)建模型需對(duì)高維數(shù)據(jù)進(jìn)行處理,一般來說,特征之間關(guān)系包含于高維度數(shù)據(jù),這些特征能夠反映數(shù)據(jù)特性,在大量數(shù)據(jù)中存在較多特征關(guān)系,這種情況下利于準(zhǔn)確進(jìn)行模型判斷,而大多數(shù)單一模塊很難從高度數(shù)據(jù)中提取多種類型特征和特征關(guān)系。為解決該問題的研究,可將所輸入的高維度數(shù)據(jù)分為三個(gè)大小基本一致的子數(shù)據(jù),即X1、X2、X3,對(duì)于子數(shù)據(jù)可進(jìn)行特征提取,共有10個(gè)模塊,可構(gòu)建遞歸神經(jīng)網(wǎng)絡(luò)進(jìn)一步提取高維度數(shù)據(jù)特征,利用上述方法,能夠獲得特征數(shù)據(jù),以實(shí)現(xiàn)用戶用電模式特征匹配,進(jìn)一步標(biāo)注數(shù)據(jù)類型,為實(shí)現(xiàn)這一項(xiàng)目的的研究,提出可使用由三層全連接隱含層所構(gòu)成的神經(jīng)網(wǎng)絡(luò),以實(shí)現(xiàn)對(duì)用戶特征數(shù)據(jù)的匹配。在損失計(jì)算和梯度優(yōu)化時(shí),利用損失函數(shù)能夠準(zhǔn)確計(jì)算目前模型損失偏差,通過函數(shù)計(jì)算基因負(fù)反饋調(diào)節(jié),合理調(diào)整各參數(shù),如式(2)為本研究所構(gòu)建的損失函數(shù)公式。
在上述公式中實(shí)際分類標(biāo)簽為yreal,分類結(jié)果為yclass,針對(duì)該損失函數(shù),可采用適應(yīng)性矩陣估計(jì)優(yōu)化,以獲得最小化損失函數(shù)值,深度學(xué)習(xí)Tensorflow框模型實(shí)現(xiàn)反饋調(diào)節(jié)。
研究學(xué)者在模型結(jié)構(gòu)評(píng)價(jià)過程中提出混淆矩陣,針對(duì)異常用例數(shù)據(jù)作為負(fù)類,對(duì)于正常用電數(shù)據(jù)可將其定義為正類,使用混淆矩陣來表示最終的分類結(jié)果。比如,通常利用行對(duì)應(yīng)實(shí)際所屬類別,而列可對(duì)應(yīng)對(duì)應(yīng)分類器進(jìn)行類別預(yù)測,在混淆矩陣下形成多樣化的評(píng)價(jià)指標(biāo),包括準(zhǔn)確率,漏警率等指標(biāo),以實(shí)現(xiàn)模型結(jié)果評(píng)價(jià),如下公式所示:
在該公式中,正常數(shù)據(jù)分類的正常數(shù)目為ntp,異常數(shù)據(jù)分類的異常數(shù)目為ntn,將正常數(shù)據(jù)分類為異常數(shù)目為nFp,將異常數(shù)據(jù)分類為正常的數(shù)目為nFN,準(zhǔn)確率主要是指在測試樣本中,正確識(shí)別數(shù)目所占比例,如果準(zhǔn)確率高,表明該模型所識(shí)別異常用電概率越低,在總異常數(shù)據(jù)中漏警率是指模型錯(cuò)誤識(shí)別數(shù)據(jù)的比例,如果漏警的越低,表明利用該模型錯(cuò)誤識(shí)別用戶模式為正常的概率越低。
為驗(yàn)證本研究提出模型的有效性,將深度學(xué)習(xí)模型與非深度學(xué)習(xí)模型進(jìn)行比較,共開展5次實(shí)驗(yàn),選取平均值為最終結(jié)果,除此之外,將將該模型與多層長短期記憶深度學(xué)習(xí)模型進(jìn)行比較開展5次實(shí)驗(yàn),運(yùn)行周期長達(dá)15000次。
本研究由某電力公司所提供數(shù)據(jù)樣本作為數(shù)據(jù)集,該樣本中涉及多個(gè)用戶兩個(gè)月內(nèi)的三相電流有關(guān)數(shù)據(jù),共計(jì)3860條,在其數(shù)據(jù)集中共含有309條異常用電數(shù)據(jù),其中342條為正常數(shù)據(jù),在訓(xùn)練集中異常數(shù)據(jù)占8.28%。在測試集中有51條異常用電數(shù)據(jù),81條正常數(shù)據(jù),在測試集中異常數(shù)據(jù)占38.64%?;谏疃葘W(xué)習(xí),Tensorflow學(xué)習(xí)框架使用一臺(tái)計(jì)算機(jī),其CPU為INrelE34核,內(nèi)存為8G。測試集中部分異常數(shù)據(jù)如下表1所示:
表1 測試集中部分異常數(shù)據(jù)
相比支持向量基模型和BP神經(jīng)網(wǎng)絡(luò)模型來說,本研究提出的基于深度TensorFlow學(xué)習(xí)模型具有良好性能。經(jīng)過5000個(gè)周期運(yùn)行之后,研究提出的模型以及基于多層長短期記憶學(xué)習(xí)模型,兩種模型準(zhǔn)確率變化較小,認(rèn)為上述兩個(gè)模型逐漸趨于穩(wěn)定狀態(tài),經(jīng)過模型之后,相比基于多層長短期記憶學(xué)習(xí)模型來說,研究提出的模型準(zhǔn)確率要高,在經(jīng)過5000個(gè)周期之后,研究提出的模型相比基于多層長短期學(xué)習(xí)模型來說,準(zhǔn)確率變化幅度要小,整體來看,本研究提出的基于深度Tensorflow框?qū)W習(xí)框架模型,其具有良好的魯棒性和準(zhǔn)確性。
本研究提出基于深度學(xué)習(xí)以實(shí)現(xiàn)用戶異常數(shù)用電數(shù)據(jù)檢測模型,利用該模型能夠從用戶實(shí)際用電中獲取用電數(shù)據(jù),基于深度學(xué)習(xí)框架進(jìn)一步構(gòu)建用戶竊電檢測模型,提取數(shù)據(jù)特征,構(gòu)建結(jié)構(gòu)遞歸神經(jīng)網(wǎng)絡(luò),通過三層全連接進(jìn)一步構(gòu)建數(shù)據(jù)特征匹配神經(jīng)網(wǎng)絡(luò),將本研究提出的模型與基于支持向量機(jī)模型以及BP神經(jīng)網(wǎng)絡(luò)模型對(duì)比,通過實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),相對(duì)來說具有良好的識(shí)別準(zhǔn)確率和較低漏警率,可及時(shí)發(fā)現(xiàn)用戶模式的異常數(shù)據(jù),準(zhǔn)確性較高,除此之外,相比基于多層長短期記憶學(xué)習(xí)模型來說,本研究所提出的用戶竊電檢測模型,其具有魯棒性,準(zhǔn)確性。后續(xù)需深入研究深度學(xué)習(xí)模型學(xué)習(xí)速度以壓縮檢測時(shí)間,能夠快速提取用戶日常用電信息,實(shí)現(xiàn)特征匹配優(yōu)化,不斷滿足用電需求。