崔陽陽,趙洪山,曲岳晗,宋 瑋,蒲 靚,米增強
(華北電力大學(xué)電氣與電子工程學(xué)院,河北省 保定市 071003)
隨著用電信息采集系統(tǒng)和高級量測體系(advanced metering infrastructure,AMI)的 廣 泛 應(yīng)用,臺區(qū)用戶電力數(shù)據(jù)智能采集已實現(xiàn)全覆蓋[1],量測體系內(nèi)部積累了大量數(shù)據(jù)[2]。因此,利用大數(shù)據(jù)技術(shù)進(jìn)行臺區(qū)應(yīng)用分析(線損計算、用戶負(fù)荷預(yù)測、能效分析等)已經(jīng)成為一種趨勢[3-7]。
基于完整可靠的電力數(shù)據(jù)取得的研究結(jié)論具有實際應(yīng)用價值,可以正確反映臺區(qū)運行特性和客觀規(guī)律[2]。然而,在臺區(qū)電力數(shù)據(jù)采集和傳輸?shù)倪^程中,由于本地信道不穩(wěn)定、智能電表故障等導(dǎo)致數(shù)據(jù)會出現(xiàn)無規(guī)律缺失問題。若數(shù)據(jù)量達(dá)不到大數(shù)據(jù)分析的要求,則后續(xù)應(yīng)用分析的準(zhǔn)確度會下降[1]。因此,為了保證低壓臺區(qū)電力數(shù)據(jù)的完整性,對臺區(qū)電力數(shù)據(jù)進(jìn)行缺失補全是十分必要的。
傳統(tǒng)的缺失數(shù)據(jù)補全方法包括均值填充法、熱冷卡填補法、回歸填充法等[8-9]。這些方法雖然簡單快速,但忽略了低壓臺區(qū)用戶數(shù)據(jù)之間的時空關(guān)聯(lián)性,填補質(zhì)量不高。為此,有學(xué)者提出了基于矩陣補全[10]的方法,這類方法利用原始數(shù)據(jù)矩陣的低秩性(時空性)對隨機缺失數(shù)據(jù)進(jìn)行填充,但對于非凸問題采用的優(yōu)化方法過于復(fù)雜,且對長時間連續(xù)缺失數(shù)據(jù)填補效果不好。為此,部分研究提出基于自編碼的填補方法[11],該類方法雖然實現(xiàn)了各類缺失模式的填補,但基于淺層學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)的填補方式難以準(zhǔn)確刻畫臺區(qū)電力數(shù)據(jù)的深層非線性特征。深度學(xué)習(xí)技術(shù)的發(fā)展可以解決這一難題,深度學(xué)習(xí)采用無監(jiān)督方式,通過多個抽象級別對輸入大規(guī)模高維數(shù)據(jù)進(jìn)行深層特征提取[12-15]。近年來提出的U 型網(wǎng)絡(luò)(U-Net)在缺失圖像修復(fù)、高分辨率圖像重建等方面已經(jīng)取得了突破性進(jìn)展。文獻(xiàn)[16]提出的基于U-Net 超聲圖像分割的骨結(jié)構(gòu)重建可以為醫(yī)生提供直觀的術(shù)中導(dǎo)航信息。文獻(xiàn)[17]表明U-Net 有較強的圖像復(fù)原能力與一定的泛化能力。由于缺失圖像填充及分割圖恢復(fù)與低壓臺區(qū)電力缺失數(shù)據(jù)填補問題在本質(zhì)上具有明顯共性:都是根據(jù)非缺失部分,生成符合客觀規(guī)律的缺失成分[18];都面臨數(shù)據(jù)分布維度高、建模復(fù)雜的問題[19]。因此,U-Net 適用于解決低壓臺區(qū)電力缺失數(shù)據(jù)的補全問題。
針對臺區(qū)數(shù)據(jù)出現(xiàn)隨機缺失和連續(xù)缺失情況,本文提出基于殘差U 型網(wǎng)絡(luò)(residual U-Net,RUNet)的多用戶電力數(shù)據(jù)缺失補全方法。將用戶數(shù)據(jù)構(gòu)成時空張量格式,使模型更容易捕捉臺區(qū)電力數(shù)據(jù)的時空性。在U-Net 的基礎(chǔ)上引入殘差學(xué)習(xí)以及批歸一化(batch normalization,BN)優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),提高缺失數(shù)據(jù)的重構(gòu)精度。試驗結(jié)果表明,所提方法能夠有效地實現(xiàn)隨機缺失率不超過40%與連續(xù)缺失不超過2 d 的臺區(qū)電力數(shù)據(jù)補全,且補全精度相比傳統(tǒng)方法有一定程度的提高。
低壓臺區(qū)電力數(shù)據(jù)(電壓、電流或功率)的缺失填補問題本質(zhì)上可以轉(zhuǎn)化為缺失數(shù)據(jù)的重構(gòu)問題。U-Net 是一種無監(jiān)督深度學(xué)習(xí)網(wǎng)絡(luò),通過端到端的學(xué)習(xí)可實現(xiàn)缺失數(shù)據(jù)的重構(gòu)。模型結(jié)構(gòu)如附錄A圖A1 所示,該網(wǎng)絡(luò)由壓縮路徑和擴展路徑組成,壓縮路徑提取電力數(shù)據(jù)的高級特征,包含4 個模塊,每個模塊由2 個卷積層和1 個池化層組成;擴展路徑同樣包含4 個模塊,每個模塊先進(jìn)行上采樣然后和左側(cè)對應(yīng)的壓縮路徑的特征圖進(jìn)行融合。最后,再經(jīng)過2 個反卷積層進(jìn)行信息還原[20-21]。該網(wǎng)絡(luò)在結(jié)構(gòu)上與卷積自編碼類似,不同的是在編碼部分和解碼部分特別設(shè)計了跳躍連接,這使得網(wǎng)絡(luò)捕捉到更多時空細(xì)節(jié)信息[22-23]。
在編碼階段,卷積層卷積核的個數(shù)代表提取的特征圖的個數(shù),對于輸入張量x,第i個卷積核的輸出hi為:
式中:?為一維卷積運算符號;wi為第i個卷積濾波器權(quán)重;bi為第i個特征圖的偏置;δ(·)為激活函數(shù)。
解碼階段重構(gòu)的公式為:
式中:y為重構(gòu)值;N為特征圖的個數(shù)集合;c為偏置;w?i為權(quán)重的翻轉(zhuǎn)操作。
數(shù)據(jù)損失Lloss為:
式中:‖ · ‖為范數(shù)符號。
為增加模型對輸入臺區(qū)電力數(shù)據(jù)上下文語義信息的抽象能力,提高補全的精度,在U-Net 基礎(chǔ)上引入殘差學(xué)習(xí)。殘差網(wǎng)絡(luò)利用殘差單元模塊解決了隨網(wǎng)絡(luò)層次加深帶來的優(yōu)化問題[24-25]。殘差單元模塊通過短路連接實現(xiàn),結(jié)構(gòu)如附錄A 圖A2 所示,表達(dá)式為:
式中:x'和H(x')分別為殘差單元的輸入和輸出;F(x',w)為經(jīng)過權(quán)重層后的輸出結(jié)果;w為權(quán)重參數(shù)。
式(5)中,H(x')對x'的偏導(dǎo)數(shù)大于1,解決了網(wǎng)絡(luò)訓(xùn)練時梯度消失問題。當(dāng)H(x')為恒等映射,即F(x',w)的訓(xùn)練目標(biāo)接近0 時,信息能夠跨越多層進(jìn)行傳輸,解決了隨著網(wǎng)絡(luò)加深而出現(xiàn)的網(wǎng)絡(luò)退化問題[24]。
RU-Net 是U-Net 與殘差學(xué)習(xí)網(wǎng)絡(luò)的結(jié)合,具體表現(xiàn)在2 種短路連接的引入方式。一種是單個模塊中的短路連接,可以避免因卷積層加深出現(xiàn)的網(wǎng)絡(luò)退化問題;另一種是對稱的模塊間的短路連接,可以憑借殘差單元學(xué)習(xí)到恒等映射的性質(zhì),避免因下采樣次數(shù)較多造成輸入電力數(shù)據(jù)信息丟失問題。2 種短路連接的作用本質(zhì)上都是增加模型深度,使網(wǎng)絡(luò)結(jié)構(gòu)得到優(yōu)化,學(xué)習(xí)能力更強,適用于低壓臺區(qū)電力數(shù)據(jù)缺失填補,加深的網(wǎng)絡(luò)結(jié)構(gòu)使模型能夠更容易捕捉到低壓臺區(qū)電力數(shù)據(jù)的時空性。
考慮到臺區(qū)電力數(shù)據(jù)的時空性,需要進(jìn)行模型輸入時空量的構(gòu)建,構(gòu)建過程如附錄A 圖A3 所示。由圖可知,為捕獲臺區(qū)用戶電力數(shù)據(jù)的空間性(不同用戶之間的聯(lián)系)并考慮天氣和日類型(工作日、周末、節(jié)假日)對負(fù)荷的影響,試驗將該臺區(qū)所有用戶(l個)每個時間點的電力數(shù)據(jù)、溫度、濕度、風(fēng)速和日類型構(gòu)成Nh×1(Nh=l+4)的張量,即一個時間點為一個樣本張量,其中,Nh為輸入數(shù)據(jù)的維度。為應(yīng)對波動極端情況(突變),選取待填補時間前m個時間點的樣本張量堆疊至待填補張量??紤]到電力數(shù)據(jù)的周期性,選取以星期為時間單位前n個星期同一時間點樣本張量堆疊至待填補張量。(m+n+1)個時間點的臺區(qū)樣本張量構(gòu)成Nh×(m+n+1)的時空張量,作為模型的輸入,使模型更容易捕獲臺區(qū)電力數(shù)據(jù)的時空相關(guān)性。
考慮到臺區(qū)不同缺失量和缺失位置對重構(gòu)效果會產(chǎn)生不一樣的影響,需要采用合適的手段描述數(shù)據(jù)的缺失情況。試驗中構(gòu)建了一個與樣本xi維度一致的二值掩碼mi。取樣本xi與mi作哈達(dá)瑪積(Hadamard product)運算,即xi⊙mi,該種運算構(gòu)成含缺失值的樣本數(shù)據(jù),其中天氣和日類型數(shù)據(jù)始終保留。通過上述方式描述數(shù)據(jù)缺失情況,以精確可靠地量化不同缺失情況對模型缺失重構(gòu)效果的影響。
基于RU-Net 的電力缺失數(shù)據(jù)重構(gòu)模型結(jié)構(gòu)如附錄A 圖A1 和圖A2 所示。圖中,模塊的個數(shù)為初始設(shè)定值,F1、F2和F3為濾波器的個數(shù)。考慮到臺區(qū)用戶電力數(shù)據(jù)為一維時序數(shù)據(jù),使用一維卷積層進(jìn)行特征提取且采用ReLU 作為激活函數(shù)提高網(wǎng)絡(luò)訓(xùn)練速度。在訓(xùn)練時采用交替方向乘子法更新網(wǎng)絡(luò)參數(shù)。此時試驗選取l個臺區(qū)用戶,并將(m+n)個歷史張量堆疊至待修復(fù)空間張量,輸入為Nh×(m+n+1)維,輸出為Nh×1 維。
該模型可訓(xùn)練的參數(shù)集中在卷積層,輸入層、池化層、上采樣層中不存在可訓(xùn)練的參數(shù),卷積層中可訓(xùn)練參數(shù)Pparam的表達(dá)式為:
式中:k為卷積核大小;Fi和Fi?1分別為該層與上一層的特征圖(濾波器)的個數(shù)。
模型中卷積核的大小默認(rèn)為3,濾波器數(shù)量的選擇由試驗決定,模型的詳細(xì)網(wǎng)絡(luò)結(jié)構(gòu)如附錄A圖A3 所示??捎?xùn)練的參數(shù)如附錄A 表A1 和表A2所示。由表可知,模型訓(xùn)練主要調(diào)整思路是以2 為倍數(shù)縮減或者提高整個網(wǎng)絡(luò)的濾波器數(shù)量,在精度非常近似的情況下,選擇較小的濾波器值可以減少整個網(wǎng)絡(luò)參數(shù)的數(shù)量,提高訓(xùn)練速度。為提高訓(xùn)練的穩(wěn)定性,加快模型收斂,在RU-Net 的每個卷積層(為防止樣本振蕩,靠近輸入和輸出的卷積層除外)之后加入BN。
由于該模型的目標(biāo)是臺區(qū)電力缺失數(shù)據(jù)的填充,所以更加關(guān)注缺失數(shù)據(jù)的重構(gòu)精度,為實現(xiàn)這一目標(biāo)設(shè)計了損失函數(shù)L為:
式中:yi為模型的重構(gòu)輸出張量。
最終重構(gòu)后的電力數(shù)據(jù)x?i由原樣本中未缺失部分與模型輸出的缺失數(shù)據(jù)對應(yīng)的部分組成,即:
本文使用配置為Intel I5 2.2 GHz CPU,8 GB RAM 以及操作系統(tǒng)為Windows 10 的計算機,用實際的臺區(qū)用戶功率數(shù)據(jù)對所提模型的性能進(jìn)行了驗證。
在電能替代背景下,用戶側(cè)煤(氣)改電設(shè)備、電動汽車充電設(shè)備等大量接入,使得低壓臺區(qū)用戶電力數(shù)據(jù)表現(xiàn)出高維、時變、非線性的特點[2]。
該算例采用的數(shù)據(jù)來自中國某市配電網(wǎng)某臺區(qū)的用戶功率數(shù)據(jù)。為用于算例分析,在自動采集的實際數(shù)據(jù)中(采樣間隔為15 min),通過人工挑選出連續(xù)40 d 的無缺失數(shù)據(jù),結(jié)合對應(yīng)的天氣(溫度、濕度、風(fēng)速)、日類型構(gòu)成完整數(shù)據(jù)集。數(shù)據(jù)集具體包含2019 年7 月1 日00:00 至2019 年8 月9 日24:00的溫度、濕度、風(fēng)速、96 個用戶的功率數(shù)據(jù)和日類型,共3 840 組樣本。將該數(shù)據(jù)集按3∶1 的比例劃分為訓(xùn)練集和測試集。
為了更好地評價缺失值的填充效果,用平均絕對誤差EMAE、平均百分比誤差EMAPE和均方根誤差ERMSE這3 個指標(biāo)評估各種算法對臺區(qū)電力缺失數(shù)據(jù)的填補性能。
EMAE為樣本真實值與補全值之差的平均絕對值。EMAE能夠防止誤差相互抵消,因而可以準(zhǔn)確反映填補誤差的大小,其表達(dá)式為:
式中:fi為補全值;xi為真實值;N1為缺失值的個數(shù)。
EMAPE可以體現(xiàn)出誤差的相對性,更能表現(xiàn)臺區(qū)缺失數(shù)據(jù)的填補性能,表達(dá)式為:
ERMSE對真實值與補全值的較大誤差比較敏感,表達(dá)式為:
試驗將該臺區(qū)96 個用戶每個時間點的功率、天氣、節(jié)假日信息數(shù)據(jù)構(gòu)成100×1 的張量,即一個時間點為一個樣本張量,共有3 840 個樣本張量。選取待填補時間前3 個時間點的樣本張量(應(yīng)對波動極端(突變)情況)、以星期為時間單位,將前2 個星期同一時間點的張量(考慮功率數(shù)據(jù)的周期性)堆疊至待填補張量。6 個時間點的臺區(qū)張量構(gòu)成100×6 的時空張量作為模型的輸入,使模型更容易捕獲臺區(qū)功率數(shù)據(jù)的時空相關(guān)性。
在實際情況中,低壓臺區(qū)功率數(shù)據(jù)缺失率一般不會超過40%[1],所以分別用隨機缺失率為10%、20%、30%和40%的測試集數(shù)據(jù)選擇模型的網(wǎng)絡(luò)結(jié)構(gòu)和超參數(shù)。附錄A 圖A4(a)所示為所選擇的4 種模型和超參數(shù)在不同缺失率下的補全誤差對比,由圖可知,通過測試集樣本(隨機缺失40%)的補全誤差選擇的模型的網(wǎng)絡(luò)結(jié)構(gòu)和超參數(shù)的補全性能更好。測試集隨機缺失40%所選擇模型的訓(xùn)練過程如下。由附錄A 圖A4(b)可知,當(dāng)模型中包含6 個模塊且起始卷積層濾波器的數(shù)量為16 時,測試集的EMAE達(dá)到最小。當(dāng)模型中包含8 個模塊且起始卷積層濾波器的數(shù)量為36 時,測試集的EMAPE最小,但與模塊數(shù)為6 且濾波器數(shù)量為16 時僅差0.169。附錄A 表A3 和表A4 所示為網(wǎng)絡(luò)結(jié)構(gòu)訓(xùn)練后的壓縮路徑和擴張路徑結(jié)構(gòu)及詳細(xì)參數(shù)(表中只顯示卷積層、BP 層、池化層、上采樣層)。
在低壓臺區(qū),通過智能電表采集每個用戶的電力數(shù)據(jù),再傳輸?shù)郊衅鬟M(jìn)行管理??紤]臺區(qū)用戶電力數(shù)據(jù)在傳輸過程中由于信道不穩(wěn)出現(xiàn)的隨機缺失情況和少數(shù)用戶由于智能電表出現(xiàn)較為嚴(yán)重的故障,無法短時間內(nèi)恢復(fù),從而導(dǎo)致電力數(shù)據(jù)出現(xiàn)連續(xù)整天缺失的情況[1]。通過分析量化功率缺失數(shù)據(jù)補全的準(zhǔn)確性進(jìn)一步驗證所提方法的有效性。
3.5.1 功率數(shù)據(jù)隨機缺失補全結(jié)果
為檢驗?zāi)P蛯β孰S機缺失數(shù)據(jù)的補全效果,將測試集隨機缺失40%并作為訓(xùn)練后模型的輸入。附錄A 圖A5 所示為測試集部分樣本(一個時間點為一個樣本,所選樣本為2019 年8 月1 日的96 個樣本)的功率隨機缺失40%時以及補全數(shù)據(jù)熱圖。附錄A 圖A5(a)所示為隨機缺失熱圖(缺失率為40%)。由圖可知,缺失率為40%時,模型的功率補全結(jié)果符合實際負(fù)荷情況,說明訓(xùn)練后的模型對臺區(qū)用戶功率數(shù)據(jù)的時空性捕捉能力強。
為了進(jìn)一步展示功率隨機缺失數(shù)據(jù)的補全效果,將測試集其中一個樣本(2019 年8 月1 日12:00)和 一 個 用 戶 連 續(xù)4 d(2019 年8 月1 日—4 日)的補全曲線進(jìn)行了繪制。RU-Net 對缺失數(shù)據(jù)的填補效果如圖1 所示。圖中綠色曲線為樣本的真實值,紅色曲線代表隨機缺失40%后的重構(gòu)值,藍(lán)色曲線為缺失點。由圖1(a)可知,綠色曲線和紅色曲線擬合良好,說明功率數(shù)據(jù)隨機缺失40%時,模型能夠利用非缺失點與缺失點之間的非線性空間關(guān)系進(jìn)行功率缺失數(shù)據(jù)的補全。由圖1(b)可知,真實值和重構(gòu)值曲線擬合依然良好,即使對于突變(例如極端天氣影響)數(shù)據(jù),補全誤差仍然很小,說明模型也能很好地學(xué)習(xí)到時序波動(包括突變)的情況。
圖1 數(shù)據(jù)隨機缺失40%時的補全結(jié)果Fig.1 Complement results when 40% data are randomly missing
附錄A 圖A6 所示為全部的測試集樣本(2019年7 月31 日—8 月9 日,共960 個樣本)功率數(shù)據(jù)補全的EMAE、EMAPE和ERMSE的分布情況。由圖可知,功率的缺失數(shù)據(jù)填補的EMAE中位數(shù)為0.018 kW,EMAPE中位數(shù)為2.009%,ERMSE中位數(shù)為0.065 kW。從誤差數(shù)據(jù)分布上看,補全結(jié)果主要分布于中位數(shù)附近,補全誤差較大的樣本數(shù)量極少,3 種誤差離群點均少于5 個,即使對于離群點而言,EMAE、EMAPE和ERMSE的最大補全結(jié)果分別為0.025 kW、2.955%和0.101 kW,補全效果仍然很好。
缺失率越大,RU-Net 能從數(shù)據(jù)中獲得的相關(guān)信息越少。改變測試集的缺失比例,通過RU-Net 獲取重構(gòu)值,重構(gòu)結(jié)果與真實值之間的EMAE、EMAPE和ERMSE隨缺失率的變化情況如附錄A 表A5 所示。由表可知,當(dāng)缺失率小于50%時,真實值與補全值之間 的EMAE小 于0.026 kW,EMAPE小 于3.260% 且ERMSE小于0.090 kW,即在缺失率小于50%的時候,該模型能有效地補全功率缺失數(shù)據(jù)。說明模型即使無法從當(dāng)前空間相關(guān)的其他非缺失功率數(shù)據(jù)中獲取填補信息,也能根據(jù)歷史數(shù)據(jù)的時空相關(guān)性對數(shù)據(jù)進(jìn)行補全。但當(dāng)缺失率超過50%時,EMAE、EMAPE、ERMSE的計算值增加,幅度變大,尤其當(dāng)缺失率大于80%時,模型數(shù)據(jù)補全性能最差。在實際情況中,缺失率一般不會高于40%。因此,本文方法在實際中可以有效地完成缺失負(fù)荷數(shù)據(jù)的填補。
3.5.2 連續(xù)整天功率缺失數(shù)據(jù)補全結(jié)果
與通信攻擊、通信干擾導(dǎo)致的用戶電力數(shù)據(jù)大范圍隨機丟失不同,連續(xù)整天缺失一般是指由于電表損壞、通信裝置物理故障等導(dǎo)致少數(shù)特定用戶出現(xiàn)連續(xù)整天的電力數(shù)據(jù)缺失[17]。對這類長時間、非隨機缺失的量測數(shù)據(jù),通過RU-Net 填補缺失數(shù)據(jù),可以正確反映電力缺失數(shù)據(jù)真實的變化規(guī)律。相比傳統(tǒng)填補方法,使用符合實際情景的重構(gòu)數(shù)據(jù)可以大幅提高后續(xù)應(yīng)用分析的準(zhǔn)確性。下面將分析驗證本文所提方法對長時間缺失的功率數(shù)據(jù)的填補效果。
附錄A 圖A7(a)所示為測試集中某個客戶連續(xù)缺失2 d(2019 年8 月4 日—5 日)的熱圖,附錄A 圖A7(b)所示為RU-Net 模型功率數(shù)據(jù)補全結(jié)果,該補全結(jié)果與居民用電習(xí)慣相符,說明在連續(xù)整天缺失的情況下,RU-Net 模型仍然有很好的補全效果。圖2 展現(xiàn)了連續(xù)2 d 功率數(shù)據(jù)補全值與真實值之間的誤差。
圖2 連續(xù)缺失2 d 的補全結(jié)果Fig.2 Complement results for two consecutive missing days
由圖2 可知,真實值與重構(gòu)值曲線擬合良好,這表明對于長時間連續(xù)缺失的功率數(shù)據(jù),所提方法不僅補全精度高,還能正確體現(xiàn)功率數(shù)據(jù)時序上的變化特點。對于圖中負(fù)荷尖峰點(負(fù)荷突變),RU-Net給出的填補結(jié)果不僅能夠反映真實的變化趨勢,而且數(shù)值的差距不大。
附錄A 表A6 所示為本文方法在不同功率缺失天數(shù)下的補全誤差。由表可知,EMAE、EMAPE和ERMSE的變化趨勢和隨機缺失相似。此外,當(dāng)缺失天數(shù)超過8 d 時,算法性能下降較快。但實際情況中,一般在7 個工作日內(nèi)故障就會被修復(fù)[1]。因此,該模型對于整天功率缺失情況是有效的。
為了驗證本文提出的RU-Net 模型的優(yōu)勢,將該方法與自編碼、三次插值進(jìn)行對比。
圖3 所示為臺區(qū)測試集數(shù)據(jù)在3 種算法下隨機缺失率為10%~50%時的EMAE、EMAPE、ERMSE和運行時間的變化趨勢。由圖3(d)可知,RU-Net 的運行時間最長,自編碼、三次插值依次降低,三次插值隨著隨機缺失率的增加,運行時間增加。從整體上看由圖3(a)至圖3(c)可知,3 種算法在3 種誤差下都隨著缺失率的增加而增大,其中三次插值在3 種誤差下的補全效果最差,其次是自編碼,RU-Net 在3 種誤差下的補全效果最好,說明在U-Net 中殘差網(wǎng)絡(luò)以及BP 的引入增強了模型對臺區(qū)用戶負(fù)荷數(shù)據(jù)的適應(yīng)性,提高了對高級語義信息的編碼能力。
圖3 隨機缺失情況下模型誤差及運行時間對比結(jié)果Fig.3 Comparison results of model error and running time under random missing condition
從細(xì)節(jié)來看,RU-Net 補全的EMAE在缺失率分別為10%、20%和30%時,與三次插值相比精度提升約3 倍,與自編碼相比提升約2 倍;RU-Net 補全的EMAPE在缺失率分別為10%、20%和30%時,與三次插值相比精度提升約3 倍,與自編碼相比提升約1.7 倍;RU-Net 補全的ERMSE在缺失率分別為10%、20%和30%時,與三次插值相比精度提升約4 倍,與自編碼相比提升約2 倍。當(dāng)缺失率大于40%時,RU-Net 的EMAE、EMAPE和ERMSE呈 現(xiàn) 緩 慢增加的趨勢,而其他2 種算法誤差增加迅速。綜上表明,RU-Net 模型能夠?qū)W習(xí)低壓臺區(qū)歷史和非缺失負(fù)荷數(shù)據(jù)與待修復(fù)負(fù)荷數(shù)據(jù)的映射關(guān)系,對負(fù)荷數(shù)據(jù)特征的提取、時空相關(guān)性的抽象能力優(yōu)于其他算法,在不同功率數(shù)據(jù)缺失率下可以高效完成對低壓臺區(qū)功率缺失數(shù)據(jù)的修復(fù)。
圖4 所示為臺區(qū)測試集功率數(shù)據(jù)在缺失1~7 d的EMAE、EMAPE、ERMSE和 運 行 時 間 的 變 化 趨勢。 由圖4(d)可知,3 種算法運行時間的變化趨勢與隨機缺失情況下近似。由圖4(a)至圖4(c)可知,誤差趨勢與圖3 隨機缺失情況下的誤差趨勢相似,RU-Net 的誤差曲線始終在其他2 種算法之下,說明RU-Net 的補全精度最高。在連續(xù)缺失2 d 時,RUNet 補全的EMAE、EMAPE和ERMSE分別約為0.016 kW、2.002%和0.017 kW,與三次插值相比,精度分別提升約2.30 倍、1.70 倍和2.60 倍;與自編碼相比,精度分別提升 約1.67 倍、1.15 倍和2.30 倍。
圖4 整天缺失情況下模型誤差及運行時間對比結(jié)果Fig.4 Comparison results of model error and running time for a whole missing day
綜上可知,無論是在用戶功率數(shù)據(jù)隨機缺失還是在整天缺失情況下,RU-Net 補全方法均比三次插值、自編碼補全方法的性能更優(yōu)。
本文根據(jù)當(dāng)前低壓臺區(qū)用戶電力數(shù)據(jù)存在大量缺失的情況,提出了一種RU-Net 的深度學(xué)習(xí)電力缺失數(shù)據(jù)補全方法。該方法通過將臺區(qū)負(fù)荷、天氣、日類型數(shù)據(jù)構(gòu)造為時空張量格式,使模型更容易捕捉臺區(qū)電力數(shù)據(jù)的時空性。通過RU-Net 結(jié)構(gòu)訓(xùn)練及超參數(shù)的選擇,使模型能準(zhǔn)確學(xué)習(xí)低壓臺區(qū)多用戶電力數(shù)據(jù)相關(guān)性、負(fù)荷波動規(guī)律等難以顯式建模的復(fù)雜時空關(guān)系。通過引入殘差網(wǎng)絡(luò)和BP,增強了RU-Net 對臺區(qū)用戶電力數(shù)據(jù)的適應(yīng)性。在避免網(wǎng)絡(luò)退化的同時,提高了網(wǎng)絡(luò)深度和收斂速度,增強了補全模型對高級語義信息的編碼能力。所提方法在隨機缺失和整天缺失2 種情況下都有較好的補全效果。通過計算3 個誤差評價指標(biāo)驗證了該方法在隨機缺失率低于40%與連續(xù)缺失不超過2 d 情況下具有較高的補全精度。
附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。