周 贛,華濟(jì)民,李銘鈞,付佳佳,黃 莉
(1. 東南大學(xué)電氣工程學(xué)院,江蘇省南京市 210096;2. 廣東電網(wǎng)有限責(zé)任公司,廣東省廣州市 510600)
用戶的竊電行為是配電網(wǎng)中非技術(shù)線損的主要原因之一,同時(shí)也影響電網(wǎng)的安全運(yùn)行,造成了巨大的社會經(jīng)濟(jì)損失,因此反竊電稽查成為電力公司極為重視的業(yè)務(wù)[1]。 高級量測體系(advanced metering infrastructure,AMI)的不斷完善使得利用數(shù)據(jù)挖掘技術(shù)識別用電異常逐漸興起[2]。然而,智能電能表的普及使得竊電者對電能表的攻擊手段不再局限于基于物理破壞的傳統(tǒng)模式,而逐步轉(zhuǎn)變?yōu)槭褂梦锫?lián)網(wǎng)信息技術(shù)攻擊智能電能表的新模式[3]。因此,研究一種準(zhǔn)確率更高的竊電檢測方法對于應(yīng)對日益增加的竊電類型,減少電力公司的經(jīng)濟(jì)損失具有重要的實(shí)際意義。
目前,基于數(shù)據(jù)驅(qū)動(dòng)的竊電檢測技術(shù)已經(jīng)成為國內(nèi)外的研究熱點(diǎn),主要包括基于聚類、分類以及狀態(tài)估計(jì)的三大類方法[4]。本文旨在基于分類的方法進(jìn)行用電異常的識別。針對這一問題,國內(nèi)外學(xué)者最早采用支持向量機(jī)(support vector machine,SVM)[1,5]、反向傳播(BP)神經(jīng)網(wǎng)絡(luò)[6]、多層感知機(jī)(multi-layer perceptron,MLP)[7]等模型進(jìn)行嘗試并取得了一定的成效。然而,受限于單模型的識別精度,學(xué)界逐漸開始關(guān)注通過模型融合的方式提升竊電檢測的準(zhǔn)確率。在這種學(xué)習(xí)模式下,現(xiàn)有文獻(xiàn)主要提出了集成學(xué)習(xí)和聯(lián)合學(xué)習(xí)2 種解決方案。前者是在多個(gè)弱學(xué)習(xí)器獨(dú)立訓(xùn)練的基礎(chǔ)上組合結(jié)果得到性能更優(yōu)的強(qiáng)監(jiān)督模型,主要包括Bagging[8-9]、Boosting[10-12]等形式。這種模型融合的方式充分利用了不同基學(xué)習(xí)器之間數(shù)據(jù)觀測的差異性,使得各基類模型得以取長補(bǔ)短,但本質(zhì)上并沒有改變數(shù)據(jù)的輸入模式。聯(lián)合學(xué)習(xí)則考慮了不同影響因素的特征或不同模式下的輸入數(shù)據(jù),在訓(xùn)練時(shí)通過多輸入通道融合不同的模型,同步地進(jìn)行參數(shù)的優(yōu)化更新,進(jìn)一步提高模型的預(yù)測效果。文獻(xiàn)[13]從時(shí)間、空間、氣候等多維度上獲取了特征參數(shù),將時(shí)序和非時(shí)序數(shù)據(jù)分別輸入長短期記憶(long short-term memory,LSTM)和MLP 模型中,通過混合模型有效提升了竊電識別的可靠性。文獻(xiàn)[14]基于多層次的數(shù)據(jù)源分析竊電行為,并提出了一個(gè)信息融合的分層識別模型,在實(shí)際現(xiàn)場的檢測中取得了顯著的效果。
盡管學(xué)界在用戶特征提取方法和分類模型算法優(yōu)化2 個(gè)方面進(jìn)行了大量的研究[15],但多為基于一維用電數(shù)據(jù)構(gòu)建竊電檢測模型??紤]到用戶用電行為的獨(dú)立性和隨機(jī)性,如果僅僅將原始的用電數(shù)據(jù)直接作為檢測模型的輸入,則會忽略用電數(shù)據(jù)本身具備的時(shí)序相關(guān)性。國內(nèi)外研究在考慮用電數(shù)據(jù)混合維度輸入的處理方法上僅做了有限的嘗試。文獻(xiàn)[16]通過寬度和深度模型(wide & deep network,WDNet)的結(jié)合提取了用電數(shù)據(jù)的非線性特征和周期性特征,在真實(shí)數(shù)據(jù)集上的測試結(jié)果驗(yàn)證了該方法在竊電檢測問題上的有效性,但是其在用電數(shù)據(jù)二維化處理上只是以周為單位進(jìn)行數(shù)據(jù)堆疊。近年來,深度學(xué)習(xí)技術(shù)在計(jì)算機(jī)視覺(computer vision,CV)和自然語言處理(natural language processing,NLP)上展現(xiàn)了突出的能力,通過圖像識別技術(shù)提高時(shí)序分類模型的精度也成為眾多領(lǐng)域的研究熱點(diǎn)[17-19],該方法本質(zhì)上就是利用多像素通道表征樣本差異性,從而更好地獲取時(shí)間序列的深層特征。因此,本文從數(shù)據(jù)輸入形式和特征提取方法兩方面著手,針對長時(shí)間尺度下的用戶用電數(shù)據(jù),提出一種基于圖轉(zhuǎn)換和混合卷積神經(jīng)網(wǎng)絡(luò)(CNN)的竊電檢測方法。首先,通過實(shí)際用戶在不同竊電模式下用電序列相關(guān)性的對比論證了用電數(shù)據(jù)二維化的有效性,并基于格拉姆角和場實(shí)現(xiàn)用電序列的圖轉(zhuǎn)換,與原始一維序列數(shù)據(jù)共同組成模型的輸入。然后,構(gòu)建混合卷積神經(jīng)網(wǎng)絡(luò),分別提取2 種維度數(shù)據(jù)的相關(guān)特征,以進(jìn)一步提高分類網(wǎng)絡(luò)的精度。最后,實(shí)際算例測試結(jié)果表明,該方法在竊電檢測問題上相較于傳統(tǒng)模型具有更優(yōu)的性能。
竊電最直接的影響在于該行為打破了用戶原本的用電周期性規(guī)律[16,20]。為了更好地展現(xiàn)這種差異性,本節(jié)以一個(gè)正常用戶為期4 周的用電數(shù)據(jù)為例,基于皮爾遜相關(guān)系數(shù)(Pearson correlation coefficient,PCC)對該樣本及其修改后的竊電樣本進(jìn)行相關(guān)性對比分析,來論證用電數(shù)據(jù)二維化的有效性。
常用的竊電手段主要有失壓法、失流法和智能電能表的篡改。為盡可能模擬上述實(shí)際場景,現(xiàn)抽象出3 種典型的竊電函數(shù),如表1 所示。其中,X={x1,x2,…,xd,…,xN}為用電序列數(shù)據(jù);α是(0.2,0.8)區(qū)間內(nèi)的竊電常系數(shù);γ為電量閾值,本例中取值為5;h(·)為竊電函數(shù)表達(dá)式。情況1 采用恒定的竊電系數(shù)模擬串入電阻降壓(失壓)場景或分流法竊電(失流)場景;情況2 采用一個(gè)設(shè)定的閾值來人為地減小電能表讀數(shù),模擬電能表受篡改的場景;情況3 通過數(shù)據(jù)置0 模擬電壓或電流回路開路的場景。基于上述函數(shù),按照連續(xù)或間歇性竊電劃分共可得6 種情景。由此,正常樣本通過數(shù)據(jù)修改可生成6 個(gè)竊電樣本,修改范圍為第3~4 周。
表1 3 種不同的竊電方式Table 1 Three different ways of electricity theft
分別對此正常樣本和6 個(gè)衍生竊電樣本的時(shí)序電量按周計(jì)算PCC 值(由于連續(xù)竊電場景中情況2、3 無法計(jì)算有效的PCC 值,本節(jié)不進(jìn)行展示,1.2 節(jié)中將補(bǔ)充說明),各場景下的PCC 矩陣熱力圖如圖1所示。從圖中可以看出,正常用戶的PCC 矩陣總體呈現(xiàn)較高的數(shù)值狀態(tài)。發(fā)生竊電后,除長期連續(xù)的恒定系數(shù)竊電場景外,其余場景中原本PCC 較高的位置上數(shù)值均有所降低,甚至出現(xiàn)了負(fù)值。以“周-周”為單位進(jìn)行觀察可以發(fā)現(xiàn),在“正常-竊電”“竊電-竊電”等多種組合場景下,用電數(shù)據(jù)的PCC 矩陣也存在明顯的差異。由此可見,通過用電數(shù)據(jù)二維化可以更有效地體現(xiàn)出正常用戶與竊電用戶之間時(shí)序上的關(guān)鍵特征差異。然而,以往的研究只是通過數(shù)據(jù)堆疊的方式實(shí)現(xiàn)用電數(shù)據(jù)的二維化轉(zhuǎn)換。為了能在更細(xì)粒度的模式下增強(qiáng)用電數(shù)據(jù)二維化后的時(shí)序相關(guān)性表達(dá),同時(shí)有效解決長期連續(xù)的恒定系數(shù)竊電場景下用電異常的識別問題,下節(jié)將介紹時(shí)間序列的圖轉(zhuǎn)換方法,為后續(xù)模型構(gòu)建奠定基礎(chǔ)。
圖1 不同場景下“周-周”用電相關(guān)性對比Fig.1 Comparison of electricity consumption correlation between weeks in different scenarios
近年來,CV 技術(shù)在監(jiān)督和非監(jiān)督問題中都得到了成功應(yīng)用。不少學(xué)者提出了時(shí)序圖轉(zhuǎn)換方法,并借助CV 技術(shù)來改善時(shí)間序列分類和異常檢測的效果。文獻(xiàn)[17]提出了2 種新穎的時(shí)序圖轉(zhuǎn)換方法,即通過格拉姆角和(Gramian angular summation,GASF)/差 分 場(difference field,GADF)和馬爾可夫轉(zhuǎn)移場(Markov transition field,MTF)來重新編碼時(shí)間序列數(shù)據(jù),并使用卷積神經(jīng)網(wǎng)絡(luò)提取圖像特征。文獻(xiàn)[21]利用壓縮距離擴(kuò)展了遞歸圖(recurrence plot,RP),根據(jù)序列數(shù)據(jù)的相空間變換信息補(bǔ)充了時(shí)間序列數(shù)據(jù)的特征,提供了一種簡單且無參數(shù)的時(shí)間序列分類方法。
為了同時(shí)保留用電數(shù)據(jù)的幅值相關(guān)性和時(shí)序依賴性,本文選取基于GASF 的圖轉(zhuǎn)換方法來構(gòu)建二維輸入。GASF 將笛卡爾坐標(biāo)系下的一維時(shí)間序列轉(zhuǎn)換成極坐標(biāo)系表示,再通過余弦函數(shù)對不同時(shí)間點(diǎn)進(jìn)行相關(guān)性的矩陣化輸出,滿足了上述竊電檢測問題兩方面的特征需求。下面將給出基于GASF圖轉(zhuǎn)換方法的主要流程[17]。
步驟2:在坐標(biāo)轉(zhuǎn)換時(shí),以半徑對應(yīng)時(shí)間戳,以角度對應(yīng)序列數(shù)值進(jìn)行雙射映射。其中,角度φi的計(jì)算方法如式(2)所示。
步驟3:利用兩角和的余弦函數(shù)保留不同時(shí)間間隔內(nèi)點(diǎn)(i,j)的相關(guān)性,生成一維時(shí)間序列的GASF 轉(zhuǎn)換矩陣G,由此可得用電數(shù)據(jù)二維化后三通道圖像。
為了更加直觀地展示正常用戶與竊電用戶圖像化表達(dá)上的不同,本節(jié)基于1.1 節(jié)中使用的正常用戶數(shù)據(jù),從第3 周開始進(jìn)行數(shù)值修改。其中G0表示原始用電數(shù)據(jù),G1~G3及G4~G6分別表示長期連續(xù)和間歇性竊電場景下基于表1 中3 種竊電函數(shù)修改得到的異常數(shù)據(jù)組,所得7 組一維用電序列曲線及其對應(yīng)的二維圖像如圖2 所示。
由圖2 可見,基于GASF 圖轉(zhuǎn)換變換后,各類型的用電數(shù)據(jù)表現(xiàn)出明顯的差異性。同時(shí),長期連續(xù)竊電情景下恒定系數(shù)竊電方式雖然能使用戶在用電數(shù)值上仍然保持一定的周期性,但細(xì)粒度的相關(guān)性圖轉(zhuǎn)換能有效反映竊電前后數(shù)據(jù)幅值上的變化,從而更好地挖掘出用戶潛在的竊電行為。
圖2 各場景下的用電曲線及其二維圖像Fig.2 Electricity consumption curves and twodimensional images in different scenarios
考慮到實(shí)際營銷業(yè)務(wù)中涉及的竊電類型較多,而本文主要從數(shù)據(jù)驅(qū)動(dòng)的角度出發(fā)來判別電力用戶是否存在竊電行為,并不會詳細(xì)探究具體竊電類型,因此后續(xù)提出的竊電檢測模型本質(zhì)上是在解決一個(gè)有監(jiān)督的二分類問題。針對這一問題,本文同時(shí)基于原始一維時(shí)間序列數(shù)據(jù)和由其轉(zhuǎn)換而成的二維圖像數(shù)據(jù),進(jìn)行全局特征和深層次相關(guān)性特征的提取,提出基于混合卷積神經(jīng)網(wǎng)絡(luò)的竊電檢測(hybrid CNN electricity-theft detection,HCED)方法,如圖3所示。下面將分別針對一維、二維以及融合處理模塊進(jìn)行詳細(xì)介紹。
圖3 基于混合卷積神經(jīng)網(wǎng)絡(luò)的竊電檢測模型Fig.3 Electricity theft detection model based on hybrid convolutional neural network
1)一維序列處理模塊
對于輸入為序列數(shù)據(jù)的分類問題,一維卷積神經(jīng)網(wǎng)絡(luò)(1D-convolutional neural network,1D-CNN)是常用的深度學(xué)習(xí)模型之一[22-24]。1D-CNN 通過堆疊的一維卷積層提取序列數(shù)據(jù)中局部時(shí)間窗內(nèi)的特征。為了更好地提取原始電力負(fù)荷數(shù)據(jù)的全局特征,防止網(wǎng)絡(luò)過深造成模型過擬合,本文采用兩層含卷積結(jié)構(gòu)的子模塊來處理一維序列數(shù)據(jù),每一個(gè)子模塊包含一維卷積操作(convolution 1D,Conv1D)、批量標(biāo)準(zhǔn)化(batch normalization,BN)和線性整流函數(shù)(rectified linear unit,Relu)。其中BN 層的加入可以起到一定的正則化作用,使層間數(shù)據(jù)分布相對穩(wěn)定并加快網(wǎng)絡(luò)收斂速度;Relu 函數(shù)(如式(4)所示)能增強(qiáng)模型的稀疏表示,二者均可有效防止網(wǎng)絡(luò)過擬合。同時(shí),采用網(wǎng)格搜索和交叉驗(yàn)證法確定各卷積層卷積核與全連接層神經(jīng)元的最佳數(shù)目。最終得到各卷積核尺寸為5,第1 層包含32 個(gè)卷積核,第2 層包含64 個(gè)卷積核。卷積層的輸出經(jīng)壓平操作(Flatten)后再輸入神經(jīng)元數(shù)量分別為512、128 的全連接層中,即可得到一維特征信息張量。此外,2 個(gè)全連接層間采用Dropout 操作以增強(qiáng)模型的泛化能力。
2)二維圖像處理模塊
在圖像識別模型的選擇上,傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)模型在網(wǎng)絡(luò)層數(shù)加深之后,會出現(xiàn)梯度爆炸或梯度消失等問題,導(dǎo)致模型能力退化。深度殘差網(wǎng)絡(luò)(deep residual network,ResNet)[25]引入殘差塊的概念以解決該問題。附錄A 圖A1 展示了殘差塊的基本結(jié)構(gòu)。當(dāng)輸入為x時(shí),其學(xué)習(xí)到的特征記為H(x),此時(shí)對應(yīng)的殘差為F(x)=H(x)-x。在激活前將F(x)與x用類似短路機(jī)制的“跳線”連接相加,保證了恒等映射和反向傳播的梯度傳遞。當(dāng)殘差趨近于0 時(shí),網(wǎng)絡(luò)學(xué)習(xí)到的特征接近于原始輸入,使得模型在層數(shù)增加時(shí)仍然能保持較好的訓(xùn)練效果,提高了深層網(wǎng)絡(luò)的準(zhǔn)確率。ResNet 在CV 領(lǐng)域得到了廣泛的應(yīng)用,且存在多種變體形式??紤]到過深的網(wǎng)絡(luò)容易過擬合,本文選擇ResNet18 作為二維圖像數(shù)據(jù)的識別模型,其結(jié)構(gòu)如表2 所示,其中紅色數(shù)字代表殘差塊的基本結(jié)構(gòu),藍(lán)色數(shù)字代表殘差塊的堆疊數(shù)目。
表2 二維卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖Table 2 Structure diagram of 2D-convolutional neural network
ResNet18 網(wǎng)絡(luò)由8 個(gè)殘差塊組成,在每個(gè)殘差塊中上一層輸出的像素特征信息經(jīng)過2 次卷積變換并通過恒等路徑與輸入相加,進(jìn)一步保證了輸入信息的完整性。此外,殘差塊中每個(gè)卷積層由尺寸為3×3 的二維卷積核(convolution 2D,Conv2D)單元構(gòu)成。第1 卷積層conv1 是一個(gè)獨(dú)立的卷積層,用以進(jìn)行特征轉(zhuǎn)換,接著通過最大池化(Max-pooling)層減小特征映射的長寬,提高網(wǎng)絡(luò)的泛化能力和下采樣效率。經(jīng)過8 個(gè)殘差塊和平均池化層后,全連接層將之前提取到的局部信息相連,最終輸出用電二維數(shù)據(jù)特征。為使模型適用于后續(xù)步驟中的網(wǎng)絡(luò)拼接,本文對全連接層的神經(jīng)元數(shù)目和激活函數(shù)加以修改,使其輸出維度為128,對應(yīng)使用Relu 激活函數(shù)。
3)模塊融合部分
上述卷積模塊分別從一維時(shí)間序列及二維圖像數(shù)據(jù)中提取得到用戶用電行為的廣度與深度特征。為了能讓模型同時(shí)學(xué)習(xí)到這兩類特征,對一維及二維處理模塊的輸出進(jìn)行拼接(Concatenate),以生成新的融合特征集合。拼接操作定義如式(5)所示:
為使混合模塊能夠公平地學(xué)習(xí)到來自雙通道的特征信息,本文設(shè)置n和m均為128。拼接操作整合了卷積模塊提取到的兩類用電特征信息,再將這個(gè)新的集合輸入神經(jīng)元數(shù)量為64 的全連接層進(jìn)行非線性特征學(xué)習(xí),最后通過Sigmoid 函數(shù)即可得到相應(yīng)的竊電概率。此時(shí),竊電概率大于0.5 者判定為竊電用戶,否則判定為正常用戶。
本章展示了算例分析和實(shí)驗(yàn)對比。算例數(shù)據(jù)來自國家電網(wǎng)有限公司[16],該數(shù)據(jù)集包含了從 2014年1 月到2016 年10 月共1 035 天的用戶用電記錄(其中正常用戶標(biāo)記為0,異常用戶標(biāo)記為1)。
所有實(shí)驗(yàn)均在Windows 10 操作系統(tǒng)的Pycharm(基于Python3.6)環(huán)境下進(jìn)行,使用Tensorflow、Keras 作為深度學(xué)習(xí)框架,實(shí)驗(yàn)平臺的硬件配置為Tesla K40 GPU 及Intel Xeon E5-2620 2 GHz CPU。
原始的用戶數(shù)據(jù)集有4 萬多條數(shù)據(jù),按照文獻(xiàn)[16]所述方式對數(shù)據(jù)集進(jìn)行缺失值填補(bǔ)、異常值剔除等處理。為了提高樣本可靠性,選取清洗后數(shù)據(jù)質(zhì)量較高的3 000 戶正常用戶與1 000 戶竊電用戶作為實(shí)驗(yàn)樣本,然后根據(jù)GASF 轉(zhuǎn)換方法生成所有樣本的二維圖像數(shù)據(jù)。選取樣本的80%作為訓(xùn)練集,20%作為測試集進(jìn)行實(shí)驗(yàn)。
一般地,根據(jù)分類器的預(yù)測結(jié)果分可為真陽性(true positive,TP)、假陽性(false positive,F(xiàn)P)、真陰性(true negative,TN)、假陰性(false negative,F(xiàn)N)這4 種情況,竊電分類器的預(yù)測結(jié)果可由表3 中的混淆矩陣表示。
表3 竊電檢測問題的混淆矩陣Table 3 Confusion matrix of electricity theft detection
假設(shè)上述4 種情況對應(yīng)的樣本數(shù)量分別為MTP、MFP、MTN、MFN。本文采用準(zhǔn)確率fC、查全率fR、受試者工作特性(ROC)曲線下面積fU以及F1 分?jǐn)?shù)fF作為衡量分類器優(yōu)劣的性能指標(biāo)。定義分別如下。
準(zhǔn)確率表示預(yù)測結(jié)果正確的樣本占總樣本的比例,如式(6)所示。它一般用于評價(jià)分類模型的整體準(zhǔn)確程度,越接近1 則分類效果越好。然而在樣本不均衡的情況下預(yù)測結(jié)果往往會偏向于樣本數(shù)量多的類別,此時(shí)準(zhǔn)確率將無法很好地評價(jià)一個(gè)分類器,因此仍需綜合各項(xiàng)指標(biāo)對模型進(jìn)行最終評估。
查全率也即真陽性率(TPR),其計(jì)算方法如式(7)所示。查全率越高,則代表實(shí)際正樣本被預(yù)測出來的概率越高。
受試者工作特性曲線是根據(jù)分類器輸出概率值與閾值的比較進(jìn)行正負(fù)樣本的劃分,并以假陽性率fFPR為橫坐標(biāo),以TPR 為縱坐標(biāo)繪制而成的曲線(fFPR的計(jì)算見式(8))。fU因其能夠有效反映TPR和FPR 之間的平衡關(guān)系而被廣泛應(yīng)用于樣本不均衡的場景中[26],該指標(biāo)數(shù)值上越接近1,則分類器性能越佳。
fF是同時(shí)兼顧模型查準(zhǔn)率(計(jì)算方法見式(9))和查全率的指標(biāo),如式(10)所示,它是兩者的調(diào)和平均數(shù)。fF的數(shù)值越大,意味著分類模型的效果越好。
本文在選擇GASF 作為時(shí)序二維化轉(zhuǎn)換方法的同時(shí),還嘗試了MTF 和RP 這2 種不同的方法。根據(jù)不同的輸入圖像格式,提出的竊電檢測模型可以進(jìn)一步劃分為HCED-GASF、HCED-MTF 和HCED-RP。為了更好地評估所提方法的性能,在同一數(shù)據(jù)集上選擇1D-CNN(參數(shù)如第2 章所述)、隨機(jī)森林(random forest,RF)[8]、WDNet[16]、SVM[1]和MLP[7]模型分別作為一維深度學(xué)習(xí)模型、集成學(xué)習(xí)模型、聯(lián)合學(xué)習(xí)模型以及常用機(jī)器學(xué)習(xí)模型的典型代表進(jìn)行對比實(shí)驗(yàn)。其中,1D-CNN 利用卷積層提取用電數(shù)據(jù)之間的非線性特征,同時(shí)也是本文所提混合結(jié)構(gòu)的一部分;RF 通過將多個(gè)弱決策樹模型集成為強(qiáng)決策樹模型,以增強(qiáng)其特征提取能力。
表4 描述了不同模型的性能指標(biāo)結(jié)果。為了更加直觀地體現(xiàn)出模型效果,圖4 可視化了各個(gè)模型的受試者工作特性曲線和查準(zhǔn)率-查全率曲線[27]。
圖4 各模型的受試者工作特性及查準(zhǔn)率-查全率曲線Fig.4 ROC and precision-recall curves of each model
表4 各模型性能對比Table 4 Performance comparison of each model
由表4 可知,本文提出的HCED 模型在4 個(gè)性能指標(biāo)上均優(yōu)于其他傳統(tǒng)的竊電檢測模型。在fU指標(biāo)上,HCED-RP 達(dá)到了最高的0.960,HCEDGASF 和HCED-MTF 均超過0.95(這種優(yōu)勢也能夠反映在ROC 曲線圖上),這是因?yàn)橛秒姅?shù)據(jù)二維化可以有效地將時(shí)間序列的相關(guān)性信息融合在模型訓(xùn)練過程中,使模型提取到更為全面的特征。同時(shí),相比于WDNet 中一維數(shù)據(jù)的堆疊模式,對序列數(shù)據(jù)采用圖像化重編碼的方式進(jìn)行預(yù)處理能夠更好地發(fā)揮深度卷積網(wǎng)絡(luò)三通道的特征提取能力。在fC、fR和fF這3 個(gè)指標(biāo)上,HCED-GASF 均取得了最佳評價(jià)結(jié)果,分別達(dá)到了0.941、0.830 和0.876。綜合各指標(biāo)來看,HCED-GASF 整體上表現(xiàn)出更優(yōu)的性能,特別是其具有最高的查全率(相較最低的SVM高出了17.73%),這表明有更多的正樣本(即竊電用戶)能被檢測出來,相較于其他模型更加適用于關(guān)注提高竊電行為檢出率的實(shí)際業(yè)務(wù)場景。
進(jìn)一步,表5 對比了HCED-GASF 和單一維度輸入的檢測模型性能。
表5 基于不同輸入形式的模型性能對比Table 5 Performance comparison of models based on different forms of input
由表5 可知,如果僅僅使用二維圖像輸入和ResNet18 檢測模型,效果并沒有優(yōu)于原始一維序列輸入的1D-CNN;而在本文提出的混合輸入模式方案(HCED-GASF)中,各項(xiàng)性能指標(biāo)都得到了顯著的提升。這是因?yàn)槿绻换趩我痪S度的數(shù)據(jù)構(gòu)建竊電檢測模型,則無法兼顧原始一維用電數(shù)據(jù)的全局非線性特征和時(shí)間序列上的相關(guān)性特征。而HCED-GASF 模型克服了以上單一模型的缺陷,將卷積神經(jīng)網(wǎng)絡(luò)的特征提取能力和圖像數(shù)據(jù)保留的時(shí)序相關(guān)性相結(jié)合,取得了優(yōu)勢互補(bǔ)的效果。
考慮到深度學(xué)習(xí)模型對訓(xùn)練過程中的數(shù)據(jù)集大小較為敏感,本節(jié)首先對不同訓(xùn)練集比例下的模型性能進(jìn)行測試,如表6 所示,對比實(shí)驗(yàn)中的訓(xùn)練集比例β分別為50%、60%、70%。由表6 可知,在所有訓(xùn)練樣本比例場景下,HCED-GASF 的性能指標(biāo)均高于其他對比模型,且該模型的輸出結(jié)果較為穩(wěn)定。一方面是因?yàn)榧词乖谙鄬^低的訓(xùn)練集比例下,二維圖像數(shù)據(jù)也能大大擴(kuò)充參數(shù)訓(xùn)練樣本,對一維序列數(shù)據(jù)起到補(bǔ)充和糾正的作用;另一方面在于深度殘差網(wǎng)絡(luò)對圖像數(shù)據(jù)進(jìn)行的全方位掃描捕捉到了新的深層次用電時(shí)序相關(guān)性特征,并且利用跳線機(jī)制有效避免了由于層數(shù)的增加、信息丟失過多而造成的模型能力退化現(xiàn)象。
表6 不同訓(xùn)練集比例下各模型的性能對比Table 6 Performance comparison of models with different proportions of training sets
進(jìn)一步,為了說明竊電樣本所占比例對各模型的影響,本文隨機(jī)選取了400、600、800、1 000、1 200 個(gè)竊電用戶樣本和3 000 個(gè)正常用戶樣本進(jìn)行組合,基于不同竊電樣本占比的樣本組合對比了不同模型的性能指標(biāo),其fU、fR、fF結(jié)果如圖5 所示。從圖中可以看出:1)竊電樣本的比例變化對各性能指標(biāo)都有一定的影響,以HCED-GASF 為例,其fU指標(biāo)在0.9~0.95 區(qū)間內(nèi)變化,而fR和fF在0.6~0.9 區(qū)間內(nèi)波動(dòng);2)隨著異常樣本比例的提升,深度學(xué)習(xí)模型能夠更多地學(xué)習(xí)到異常樣本的特征,使得原本偏向于正常樣本的結(jié)果得以糾正,因此各項(xiàng)性能指標(biāo)均能向更優(yōu)的趨勢發(fā)展;3)考慮到fU在樣本不均衡的情況下仍然是具有一定可靠性的指標(biāo),而HCED-GASF 的fU指標(biāo)在所有竊電樣本比例下均高于其他對比模型,同時(shí)其fR和fF也保持了較高的指標(biāo)水平,說明該模型在保證檢測精度的同時(shí)也能表現(xiàn)出較強(qiáng)的魯棒性。
圖5 竊電樣本占比對模型檢測性能的影響Fig.5 Influence of proportion for electricity theft samples on model detection performance
本文提出一種基于圖轉(zhuǎn)換和混合卷積神經(jīng)網(wǎng)絡(luò)的竊電檢測方法,通過融合一維、二維卷積神經(jīng)網(wǎng)絡(luò),對原始用電序列和基于GASF 圖轉(zhuǎn)換預(yù)處理后的二維用電圖像進(jìn)行特征提取,進(jìn)一步提升了竊電檢出率。同時(shí),靈敏度分析證明了該方法具有較強(qiáng)的魯棒性。
5G 等現(xiàn)代通信技術(shù)的發(fā)展使得細(xì)粒度數(shù)據(jù)的采集與傳輸不再受到制約,未來將不僅僅局限于日用電量,而是采用更細(xì)粒度、更多維度的輸入信息來提升竊電模型的檢測精度。
附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。