梁高琪,劉國龍,趙俊華,c,*,劉艷麗,顧津錦,孫廣中,董朝陽
a School of Science and Engineering, Chinese University of Hong Kong, Shenzhen, Shenzhen 518172, China
b School of Computer Science and Technology, University of Science and Technology of China, Hefei 230027, China
c Shenzhen Institute of Artificial Intelligence and Robotics for Society, Shenzhen 518172, China
d School of Electrical and Information Engineering, Tianjin University, Tianjin 300072, China
e School of Electrical Engineering and Telecommunications, University of New South Wales, Sydney, NSW 2052, Australia
智能電網(wǎng)是為全社會各行業(yè)持續(xù)提供安全、經(jīng)濟的電力供應的重要基礎設施。智能電網(wǎng)中的狀態(tài)估計(state estimation)模塊在系統(tǒng)監(jiān)控(system monitoring and control)中起著至關重要的作用,有助于系統(tǒng)操作員感知系統(tǒng)的運行狀態(tài),從而做出準確的控制決策[1]。當前,智能電網(wǎng)的發(fā)展對狀態(tài)估計提出了新的要求:一方面,隨著可再生能源和新能源設備(如風力發(fā)電、太陽能和電動汽車等)的普及,智能電網(wǎng)將具有更大的不確定性[2]。為了減輕間歇性可再生能源對智能電網(wǎng)的不利影響,系統(tǒng)操作員需要更加頻繁地感知系統(tǒng)的運行狀態(tài),縮短調(diào)度間隔,這就需要高頻狀態(tài)估計的支持。另一方面,隨著計算能力的迅速提升,大數(shù)據(jù)技術正被廣泛應用于分析系統(tǒng)測量數(shù)據(jù)來發(fā)現(xiàn)隱藏信息[3]。而狀態(tài)估計是感知系統(tǒng)運行狀態(tài)的基本工具,可直接監(jiān)測電壓、電流、有功功率、無功功率等數(shù)據(jù),高頻的狀態(tài)估計結果有助于發(fā)現(xiàn)更多的隱藏信息,因此有利于提高系統(tǒng)的安全性和運行效率。
然而,高頻狀態(tài)估計面臨一些實際的挑戰(zhàn)和困難。首先,狀態(tài)估計基于部署在節(jié)點、發(fā)電機組、傳輸線路等成千上萬個表計來監(jiān)控系統(tǒng)狀態(tài)。在現(xiàn)有的數(shù)據(jù)采集與監(jiān)視控制系統(tǒng)(supervisory control and data acquisition, SCADA)中,大多數(shù)表計都是多年前部署的,并且以相對較低的頻率收集數(shù)據(jù),如每隔幾分鐘的采樣頻率[4,5]。其次,一些高頻采樣表計,如同步相量測量單元(phasor measurement unit, PMU),雖然能以比傳統(tǒng)表計更高的頻率采集數(shù)據(jù)[6-8],但是單一的測量值不足以支撐狀態(tài)估計的運算,因為在任何特定的時間點,狀態(tài)估計的輸入必須為一個測量向量。而PMU又較為昂貴,用PMU取代所有傳統(tǒng)表計在經(jīng)濟上不現(xiàn)實[7]。此外,即使所有傳統(tǒng)的表計都可以被PMU取代,系統(tǒng)的狀態(tài)感知能力也會受到通信信道容量的限制,造成PMU采集到的高頻數(shù)據(jù)不能完全傳輸?shù)娇刂浦行模枰R時存儲在遠程位置上[5],因此,PMU的高頻數(shù)據(jù)不能真正得到有效利用。綜上所述,目前由于技術等原因限制,實現(xiàn)高頻狀態(tài)估計仍然是一項艱巨的任務。
此外,由于通信故障或網(wǎng)絡攻擊[9],如假數(shù)據(jù)注入攻擊(false data injection attack, FDIA)[10,11]、網(wǎng)絡拓撲攻擊(cyber topology attack)[12-14]和信息物理攻擊(cyber-physical attack)[15,16]等,傳統(tǒng)表計和PMU收集的數(shù)據(jù)都有可能丟失或被篡改?,F(xiàn)實世界中的網(wǎng)絡攻擊事件,如2015年12月的烏克蘭大停電事故[17]和2019年3月的委內(nèi)瑞拉大停電事故[18],都表明網(wǎng)絡攻擊可能導致嚴重的后果。目前,有大量的文獻提出檢測異常數(shù)據(jù)的方法。例如,Ashok等[19]通過描述基于SCADA的狀態(tài)估計與基于負荷預測、機組調(diào)度和同步相量數(shù)據(jù)預測的系統(tǒng)狀態(tài)之間差異的統(tǒng)計特征來檢測異常數(shù)據(jù)。Esmalifalak等[20]利用基于分布式支持向量機(support vector machine, SVM)的方法來區(qū)分異常數(shù)據(jù)和正常數(shù)據(jù)。然而,就目前文獻而言,檢測到異常數(shù)據(jù)后,關于如何快速修復異常數(shù)據(jù)的研究非常有限。從這個層面來說,丟失的或被篡改的數(shù)據(jù)也給狀態(tài)估計的精準狀態(tài)感知帶來了不小的挑戰(zhàn)。
在上述背景下,為了應對這些挑戰(zhàn),基于現(xiàn)有測量條件,需要提出有效的方法來達到系統(tǒng)運行狀態(tài)的高頻感知。本文把這一問題看作一個數(shù)據(jù)完整性改進問題,認為控制中心接收到的原始測量數(shù)據(jù)為不完整數(shù)據(jù)(即低頻數(shù)據(jù)),系統(tǒng)操作員用于高頻決策的數(shù)據(jù)為完整數(shù)據(jù)(即高頻數(shù)據(jù))。因此,這一問題相當于解決了如何從低頻數(shù)據(jù)中恢復高頻數(shù)據(jù)以達到提高數(shù)據(jù)完整性的難題。不同研究領域針對該問題的視角和解決方法可能有所不同,而針對智能電網(wǎng),探索合適的方法來提高其狀態(tài)估計的數(shù)據(jù)完整性至關重要。
本文將采用超分辨率(super resolution, SR)技術來實現(xiàn)這一目標[21,22]。目前,從低分辨率數(shù)據(jù)中獲取高分辨率數(shù)據(jù)最有效的方法分別是基于插值、重建和機器學習[23]。基于機器學習的SR技術,通過給定的樣本獲取低分辨率和高分辨率圖像塊之間的先驗映射,具有良好的性能表現(xiàn),成為近些年的研究熱點[24]。例如,Dong等[25]提出了一種新的深度學習方法,即超分辨率卷積神經(jīng)網(wǎng)絡(super-resolution convolutional neural network, SRCNN),用于學習低分辨率和高分辨率圖像之間的端到端映射,該方法在恢復高分辨率圖像方面表現(xiàn)出優(yōu)越的性能。Wang等[26]提出了一種增強的超分辨率生成對抗網(wǎng)絡(enhanced super-resolution generative adversarial network, ESRGAN)來恢復圖像,結果表明,該方法比其他SR方法效果更好。
綜上所述,系統(tǒng)運行狀態(tài)的高頻感知對智能電網(wǎng)的發(fā)展具有重要意義。然而,傳統(tǒng)表計采樣頻率低、PMU投資成本高、通信信道容量受限、通信錯誤或網(wǎng)絡攻擊等,使得狀態(tài)估計的高頻感知在實際應用中存在阻礙和挑戰(zhàn)。因此,本文旨在提出一種超分辨率感知(super resolution perception, SRP)的技術來提高智能電網(wǎng)狀態(tài)估計的數(shù)據(jù)完整性。本文的主要貢獻如下:
(1)本文是最早研究智能電網(wǎng)狀態(tài)估計數(shù)據(jù)完整性問題的文獻。
(2)本文提出了一種有效的SRP方法,即超分辨率狀態(tài)估計網(wǎng)絡(super resolution perception net for state estimation, SRPNSE),用于從低頻數(shù)據(jù)中恢復高頻數(shù)據(jù),并應用于狀態(tài)估計,同時證明了該方法的有效性和實用價值。
本文結構如下:第1節(jié)為背景介紹;第2節(jié)描述了智能電網(wǎng)狀態(tài)估計及其數(shù)據(jù)完整性問題;第3節(jié)給出了SRP模型,并給出了SRPNSE的網(wǎng)絡結構和基于深度學習的求解方法;第4節(jié)通過仿真驗證了該方法的有效性;第5節(jié)給出結論和未來的研究方向。
本節(jié)中,我們將對智能電網(wǎng)狀態(tài)估計與其數(shù)據(jù)完整性問題做一個簡要的介紹。
在智能電網(wǎng)中,感知系統(tǒng)運行狀態(tài)的關鍵在于獲得系統(tǒng)的測量數(shù)據(jù),即電網(wǎng)每個節(jié)點(bus)的穩(wěn)態(tài)電壓(包括相角和幅值)。一旦掌握了電壓信息,就可以使用潮流方程[4,5]計算出對應的其他狀態(tài)變量。但是,并非所有節(jié)點的電壓幅值和相角都可以被輕易獲取,實際中還需要測量一些其他數(shù)據(jù),如某些傳輸線路的有功和無功功率、某些節(jié)點的有功和無功注入功率等,以滿足不同的控制目的(如為緊急情況提供預警)。此外,需要指出的是,由于干擾或網(wǎng)絡攻擊可帶來測量誤差,并非所有測量數(shù)據(jù)都是可靠的。而狀態(tài)估計是一種利用上述可用的測量數(shù)據(jù)以及綜合的冗余信息,通過一定方法估計系統(tǒng)狀態(tài)變量的工具。
通常來說,狀態(tài)估計是智能電網(wǎng)能源管理系統(tǒng)(energy management system, EMS)中一個至關重要的模塊,扮演著在線監(jiān)視、分析和控制的重要角色。除了必要的通信網(wǎng)絡外,與狀態(tài)估計密切相關的模塊主要包括三部分:傳感器(sensor)、狀態(tài)估計器(state estimator)和壞數(shù)據(jù)檢測器(bad data detector)。傳感器以一定的采樣頻率[1]測量系統(tǒng)狀態(tài),如電壓幅值、有功和無功功率等;狀態(tài)估計器使用所有收集的數(shù)據(jù)來估計系統(tǒng)狀態(tài)變量,以獲得穩(wěn)定狀態(tài)下的電力系統(tǒng)概貌;壞數(shù)據(jù)檢測器將檢測并剔除明顯的錯誤數(shù)據(jù)。
狀態(tài)估計過程是一個廣義上的潮流計算模型。如下所示,z表示維度為[m, 1]的由所有測量數(shù)據(jù)組成的向量;x表示維度為[n, 1]的由所有狀態(tài)變量組成的向量,且m > n;h(x)表示測量值和狀態(tài)變量之間的關系函數(shù);e為維度為[m, 1]的噪聲向量。
狀態(tài)估計的目的是從向量z估計出一個向量x^,使其盡可能接近于真實的向量x。常用的是極大似然(maximum likelihood, ML)估計法:
式中,p(z)是z的概率分布密度函數(shù)。
不同的向量z的分布假設,可對應不同的估計器,如加權最小二乘估計(weighted least square, WLS)、加權最小絕對值估計(weighted minimum absolute value,WLAV)、最小平方中值估計(least median of square,LMS)、最小截斷平方估計(least trimmed square, LTS)和非二次估計(non-quadratic estimator)等[5]。一般地,若測量噪聲遵循正態(tài)分布,則WLS將是最優(yōu)選擇。需找到目標函數(shù)J(x)的極值:
式中,R是測量誤差方差的對角矩陣。
數(shù)據(jù)質(zhì)量在任何工業(yè)問題中都是關鍵因素,沒有高質(zhì)量的數(shù)據(jù),解析模型和數(shù)據(jù)驅(qū)動模型的表現(xiàn)都會受到嚴重影響。當使用劣質(zhì)數(shù)據(jù)時,模型結果會遇到不可預測的偏差,進而帶來重大經(jīng)濟損失和安全風險。就現(xiàn)有文獻來看,大多數(shù)數(shù)據(jù)質(zhì)量研究都集中于數(shù)據(jù)庫系統(tǒng)領域[27]。而數(shù)據(jù)完整性是評估數(shù)據(jù)集質(zhì)量的重要指標[27],通常被定義為實際收集的數(shù)據(jù)和預期收集的數(shù)據(jù)之間的差距,即是否存在丟失的數(shù)據(jù)、損壞的數(shù)據(jù)或被篡改的數(shù)據(jù)[28]。
本文認為,控制中心收集到的低頻率測量數(shù)據(jù)是不完整的,而高頻時間序列是期望收集到的數(shù)據(jù),是完整的。以離散序列zk(·)代表向量z的第k行數(shù)據(jù)[即zk(·)代表了第k個表計的測量值],其對應的數(shù)學表達式為:
式中,fk(t)代表第k個表計在時間t的測量值的函數(shù)。
由于傳統(tǒng)表計的采樣頻率低、通信信道的容量限制、通信錯誤甚至網(wǎng)絡攻擊等因素,zk(t)的部分數(shù)據(jù)是缺失的。同樣,我們可以定義另外一個時間序列z~k(t),其時間標注t與zk(t)不同,如公式(5)所示:
式中,gk(t)代表了第k個表計在時間t的測量數(shù)據(jù)的函數(shù)。
以zk(t)表示上述匯總的時間序列,于是有Zk(t) = zk(t)+ z~
k(t),如公式(6)所示:例如,當圖1(a)、(b)分別為時間序列zk(t)和z~k(t)時,匯總的時間序列如圖1(c)所示。
需要指出的是,本文針對狀態(tài)估計的數(shù)據(jù)完整性主要是指在時間維度上的測量向量z的完整性,而數(shù)據(jù)完整性的改進則是指基于可用信息生成更多數(shù)據(jù),從而使其盡可能地接近實際值,即恢復丟失的時間序列z~k(t)。
在本節(jié)中,首先提出了SRP模型及問題;其次,描述了狀態(tài)估計中數(shù)據(jù)完整性改進問題;然后,基于深度神經(jīng)網(wǎng)絡強大的特征提取能力,提出了一種深度學習框架,即SRPNSE;最后,介紹了求解SRPNSE模型參數(shù)的優(yōu)化算法。
忽略系統(tǒng)大小,狀態(tài)估計的輸入是許多表計在特定時間點采集到的測量值形成的向量。在給定向量z的情況下,數(shù)據(jù)完整性改進問題的目標是恢復每一個表計丟失的數(shù)據(jù)。我們可以順序針對該向量對應的各個表計,即恢復每個特定表計的缺失數(shù)據(jù)相當于一個獨立的SRP問題。SRP模型可以表述為:
式中,Lβ為表計實際采集的低頻數(shù)據(jù);H為原始高頻數(shù)據(jù);e為噪聲向量,由表計導致;↓β為下采樣函數(shù),其中β為下采樣因子。例如,假設H是以60 Hz采樣得到的測量值向量,若β為10,則Lβ是基于H的采樣頻率為6 Hz的測量值向量。
本文將SRP問題描述為一個最大后驗(maximum a posteriori , MAP)估計問題。最大后驗估計的目標是估計一個Hβ以最大化后驗概率,如式(8)所示:
圖1. 表計k的離散序列關系。時間序列zk(t)(a)和(b)以及匯總時間序列zk(t)(c)。
式中,p(Lβ, ↓βH)為似然函數(shù);p(↓βH)為↓βH的先驗概率。由此可見,先驗概率主要與表計的原始采樣誤差有關。由于狀態(tài)估計模型假設測量噪聲服從正態(tài)分布,因此,本文假設先驗概率也服從正態(tài)分布。
提高狀態(tài)估計數(shù)據(jù)完整性的問題相當于由低頻數(shù)據(jù)生成高頻數(shù)據(jù)的問題。高頻數(shù)據(jù)可以恢復不完整數(shù)據(jù)中的丟失信息,因此被認為是完整數(shù)據(jù)。SRP問題如圖2所示。給定一組原始數(shù)據(jù)D,兩個下采樣數(shù)據(jù)集Lα和Hβ分別由下采樣因子α和β生成。SRP的目標是以低頻數(shù)據(jù)Lα作為輸入,生成一組盡可能逼近實際下采樣數(shù)據(jù)Hβ的估計高頻數(shù)據(jù)。?2-norm可用于測量Hβ和之間的差異。
本文所提出的SRPNSE方法的網(wǎng)絡結構如圖3所示。SRPNSE網(wǎng)絡直接使用低頻數(shù)據(jù)作為輸入,然后進行信息增強以輸出估計的高頻數(shù)據(jù)。SRPNSE通過以下三個步驟實現(xiàn)數(shù)據(jù)質(zhì)量提升:特征提取、信息補全和數(shù)據(jù)重建。
在特征提取階段,使用三個一維(1D)卷積層[29]從低頻歷史數(shù)據(jù)中提取特征。在獲得抽象特征后,第二階段,即信息補全(information completion)階段,將基于從低頻數(shù)據(jù)和高頻數(shù)據(jù)之間的內(nèi)在聯(lián)系中學習到的信息,提供更高分辨率的特征。信息補全階段由幾個SRPNSE塊組成,這些塊由殘差結構(residual structure)實現(xiàn)。殘差結構由一個大的全局殘差連接(global residual connection)和若干個局部殘差塊(local residual block)組成。全局殘差連接迫使網(wǎng)絡去學習丟失的信息,而不是直接形成信號,而局部殘差塊提供了訓練更深層網(wǎng)絡的可能性[29]。為了獲得更好的性能,本文在信息補全階段共使用了22個局部殘差塊。圖4為本文使用的殘差塊的結構,其中g表示上一層的輸出;修正線性單元(rectified linear unit, ReLU)函數(shù)[29]為激活函數(shù);identity表示恒等映射。然后,在第三階段(數(shù)據(jù)重建),包含更多系統(tǒng)模式細節(jié)的高分辨率特征被用于重建目標高頻數(shù)據(jù),該部分由三個一維卷積層實現(xiàn)。在該部分中,信息補全輸出的特征向量被整合成長度為l的子序列β。然后將子序列β重新排列成長度為β×l的重建的高頻序列。
圖2. SRP問題示意圖。
圖3. SRPNSE網(wǎng)絡結構框架。
在訓練本文提出的SRPNSE網(wǎng)絡時,選取均方誤差(mean squared error, MSE)作為損失函數(shù),如下式所示:
式中,和Hiβ分別是和Hβ的第i項;N是向量大小。
本文以平均絕對百分誤差(mean absolute percentage error, MAPE)[30]和信噪比(signal noise ratio, SNR)[31]作為評價指標。MAPE表示與實際值相比的平均絕對誤差的程度,MAPE值越高,表示實際值與測試值之間相差越大,其計算方法如式(11)所示:
在信號處理領域,SNR是指信號的平均功率與噪聲的平均功率的比值,SNR值越高,說明測試值所包含的噪聲越小。其計算方法如式(12)所示,
圖4. SRPNSE模塊i的網(wǎng)絡結構,其中i = [1, 2, ..., K]。
本文提出了一種新的神經(jīng)網(wǎng)絡——SRPNSE,用于解決SRP問題。它是一種由多個殘差塊組成的深層神經(jīng)網(wǎng)絡,具有很強的表達能力。也就是說,給定一個特定的非線性函數(shù),通過適當調(diào)整其參數(shù),神經(jīng)網(wǎng)絡可以漸近逼近該函數(shù)。然而,由于網(wǎng)絡中存在激活函數(shù)和多個隱藏層,SRPNSE的函數(shù)具有高度的非線性和非凸性。SRPNSE的非線性和非凸性使得其參數(shù)優(yōu)化變得非常困難。本文研究了估計SRPNSE參數(shù)的有效優(yōu)化算法。
在現(xiàn)有文獻中,基于梯度的算法(如算法1所示)仍然是深度神經(jīng)網(wǎng)絡參數(shù)估計的主流方法。典型的例子有批量梯度下降(batch gradient descent, BGD)、隨機梯度下降(stochastic gradient descent, SGD)和小批量梯度下降(mini-batch gradient descent, Mini-BGD)算法[32]。在這些算法中,參數(shù)更新根據(jù)以下公式進行:
式中,W為權重;b為偏差;α1為學習率;dW和db分別為代價函數(shù)相對于變量W和b的偏導數(shù)。
算法1. 梯度下降算法的偽代碼需要:關于參數(shù)θ的目標函數(shù)f(θ)需要:學習率α1需要:初始參數(shù)θ0 = 0,t = 0若{未收斂}則循環(huán):1. 計算目標函數(shù)關于當前參數(shù)的梯度:gt = ?f(θt)2. 計算當前的下降梯度:η = -αlgt 3. 根據(jù)下降梯度更新參數(shù):θt+1 = θt + ηt t = t + 1結束返回θt+1
這些基于梯度的算法的主要區(qū)別在于,當在一次迭代中更新參數(shù)時,BGD基于所有批次的訓練數(shù)據(jù)對網(wǎng)絡進行訓練,SGD只隨機選擇一批數(shù)據(jù)進行訓練,而Mini-BGD則選擇一部分批次數(shù)據(jù)。BGD算法最大的缺點是收斂速度慢,尤其是在批次數(shù)量較大的情況下,因為它通過計算所有批次來求解梯度。此外,由于SGD和Mini-BGD的梯度方向更新依賴于一個或幾個數(shù)據(jù)批次,它們的收斂軌跡非常不穩(wěn)定,會導致連續(xù)振蕩和陷于局部最優(yōu)。鑒于傳統(tǒng)方法的不足,基于等式(13)、(14),許多其他的方法,如動量(Momentum)[32]、自適應梯度算法(adaptive gradient algorithm, Adagrad)[32]、均方根反向傳播算法(root mean square prop, RMSProp)[32,33]和自適應矩估計(adaptive moment estimation,ADAM)[32,34]被提出以改進訓練過程。在本文,我們研究了兩種新算法——RMSProp和ADAM,用于估計SRPNSE參數(shù)的有效性。
3.4.1. 均方根反向傳播法
優(yōu)勢梯度下降法(dominant gradient descent methods)的一個主要缺點是學習率為固定值,而選擇一個合適的學習率是很困難的。如果學習率太小,收斂速度會很慢;如果太大,損失函數(shù)會振蕩,甚至嚴重偏離最小值。RMSProp(如算法2所示)是克服這一缺點的優(yōu)勢梯度下降法的一種變體。與等式(13)、(14)比較,RMSProp通過在相鄰的小批次上添加平方梯度的移動平均值來實現(xiàn)對學習率的極佳適應[34]。對于每個迭代,如等式(17)、(18)所示,給定的學習率由均方根α1動態(tài)調(diào)整。均方根實際上是過去梯度平方的指數(shù)移動平均值的根。根據(jù)等式(15)、(16),RMSProp將更新的依賴性限制在過去的幾個梯度上[34]。RMSProp中的均方根是為了平衡不同維的振蕩幅度。當參數(shù)空間相對平坦時,偏導數(shù)較小,指數(shù)滑動平均值較小,學習速度加快;當參數(shù)空間相對陡峭時,偏導數(shù)較大,指數(shù)滑動平均值較大,學習速度減慢。
算法2. RMSProp算法的偽代碼需要:關于參數(shù)W、b的目標函數(shù)f(W, b)需要:學習率α1需要:梯度平方的指數(shù)衰減平均參數(shù)β2需要:初始參數(shù)值W0、b0、S0(dW)、S0(db)對于每次迭代t,若{未收斂}則循環(huán):1. 計算目標函數(shù)關于當前參數(shù)的梯度:dW, db = ?f(W, b)2. 根據(jù)歷史梯度計算有偏二階矩估計值:SdW := β2SdW + (1-β2)(dW)2,Sdb := β2Sdb + (1-β2)(db)2 3. 計算當前的下降梯度:η α ε=- +dW db W l S,η α ε b l=dW- S+db 4. 根據(jù)下降梯度更新參數(shù):W := W + ηW,b := b + ηb結束返回W、b
式中,(dW)2和(db)2為梯度的平方;β2為指數(shù)衰減率,通常設置為0.9或0.999;SdW和Sdb表示過去梯度平方的指數(shù)移動平均值;ε為一個非常小的數(shù),如10-8,以防止分母為0。
3.4.2. 自適應矩估計
優(yōu)勢梯度下降法的另一個缺點是當前的梯度是決定下降方向的唯一因素。一旦當前梯度指向與先前梯度相反的方向,損失函數(shù)將振蕩甚至偏離最小值。Momentum [32]是克服這一缺點的優(yōu)勢梯度下降法的變體。與等式(13)、(14)比較,Momentum通過累積過去梯度的指數(shù)移動平均值,然后向該方向移動,從而實現(xiàn)穩(wěn)定的更快學習(faster learning)[32]。
ADAM算法(如算法3所示)結合了Momentum和RMSProp算法的思想。梯度的指數(shù)衰減平均值,即Momentum由等式(19)、(20)計算得到,在ADAM中被稱為“一階矩估計”;如等式(21)、(22)所示,平方梯度的指數(shù)衰減平均值,即RMSProp由等式(21)、(22)計算得到,在ADAM中被稱為“二階矩估計”。此外,如等式(23)、(24)所示,ADAM計算偏置校正后的“一階矩估計”和“二階矩估計”,以此來抵消初始化零向量引起的偏差。如等式(25)、(26)所示,ADAM不僅通過梯度的指數(shù)衰減平均值更新下降方向,而且還將學習率除以梯度平方的指數(shù)衰減平均值。結果表明,該算法收斂速度更快,振蕩更小[34]。
算法3. ADAM算法的偽代碼需要:關于參數(shù)W、b的目標函數(shù)f(W, b)需要:學習率α1需要:梯度平方的指數(shù)衰減平均參數(shù)β1、β2需要:初始參數(shù)W0、b0、S0(dW)、S0(db)、v0(dW)、v0(db)對于每次迭代t,若{未收斂}則循環(huán):1. 計算目標函數(shù)關于當前參數(shù)的梯度:dW, db = ?f(W, b)2. 根據(jù)歷史梯度計算有偏一階及二階矩估計值:υdW := β1υdW + (1-β1)(dW)2,υdb := β1υdb + (1-β1)(db)2 SdW := β2SdW + (1-β2)(dW)2,Sdb := β2Sdb + (1-β2)(db)2 3. 計算無偏一階及二階矩估計值:υ υ c =-:1 dW c db S β、υ υ:1=-、c =-:1 SdW S β、c =-:1 Sdb dW tβdb dW t db t 1 tβ122 4. 根據(jù)下降梯度更新參數(shù):W W S:= - +α ε υc W υd d c d W,b : =b -α c b l l c b Sd +ε結束返回W、b
式中,β1表示Momentum的指數(shù)衰減率,通常設置為0.9;偏差校正估計值;的當前時間步t的冪。
本節(jié)基于一個9節(jié)點系統(tǒng)進行算例研究[35]。如圖5所示,在節(jié)點5、7和9上部署了三個表計以記錄負荷的有功功率;在節(jié)點1、2和3上部署了三個表計,以測量發(fā)電機的有功和無功功率;在線路1~4、5~6、6~7、8~2和9~4的起始位置(如線路1~4的起始位置是靠近1節(jié)點處)部署了五個表計,以測量線路有功和無功功率;在線路4~5、3~6、7~8和8~9的終點位置(如線路4~5的終點位置靠近節(jié)點5)部署了四個表計,以測量線路有功和無功功率。
為了更好地模擬狀態(tài)估計時的真實場景,本文假設狀態(tài)估計的輸入值為基于所測負荷的最優(yōu)潮流(OPF)計算結果的一部分。如圖5所示,將記錄負荷有功功率的三只表計的數(shù)據(jù)視為OPF的輸入值;將OPF的輸出結果(即圖5中剩余12只表計包含有功和無功功率,共計24組)作為系統(tǒng)狀態(tài)估計的輸入數(shù)據(jù)。
圖5. 9節(jié)點系統(tǒng)的拓撲結構。G:發(fā)電機。
本文假設每個負荷節(jié)點基本遵循1 MW的電力大約供給200戶家庭的原則。假設每個家庭包含11類家用電器,如空調(diào)、加熱器、洗衣機、微波爐等。設備的波形均來自公開的設備級負荷識別數(shù)據(jù)集(plug-level appliance identification dataset, PLAID)[36],PLAID以3×104Hz的頻率采樣了11類不同類型的設備,本文將其下采到100 Hz。算例分別模擬了900(節(jié)點5)、1000(節(jié)點7)和1250(節(jié)點9)個家庭,然后分別將對應負荷放大100倍?;诖?,形成了本文的超分辨率感知狀態(tài)估計數(shù)據(jù)集(super resolution perception state estimation dataset,SRPSED),其發(fā)布網(wǎng)址為: https://www.zhaojunhua.org/SRP/SRPSE/dataset/。此外,在生成該數(shù)據(jù)集時,假設每個家庭都采用普通上班族的用戶行為,并且具體用戶行為也隨數(shù)據(jù)集一起發(fā)布于以上網(wǎng)址。SRPSED總共包含60天的100 Hz頻率的高頻數(shù)據(jù),其中前45天的數(shù)據(jù)被用于訓練和驗證,后15天的數(shù)據(jù)被用于測試。由于本文中的每個表計的數(shù)據(jù)完整性改進問題是互相獨立的,因此我們所提的SRPNSE方法可以以類似的形式被應用于更大的系統(tǒng)。
如表1所示,本文一共進行了4類共16種不同情況的算例研究。其中,f(Lα)和f(H︵β)代表了以Hz為單位的采樣頻率,且f(H︵β) =ηf(Lα),η為超分辨率因子(SR factor)。下采樣標準基于間隔值而非平均值。算例基于PyTorch 0.4.1,并在具有四個GTX-1080Ti、一個16核CPU和64 GB RAM的GPU集群上實現(xiàn)。
插值法[37]是一種填補空缺或替換異常數(shù)據(jù)的常見方式,本文將線性插值(linear interpolation)和立方插值(cubic interpolation)同所提的SRPNSE方法做性能比較。在本文的9節(jié)點系統(tǒng)中,狀態(tài)估計基于給定的測量數(shù)據(jù)計算系統(tǒng)的狀態(tài)值,即電壓的幅值和相角。并且,狀態(tài)估計會分別基于真實的下采數(shù)據(jù)、SRPNSE數(shù)據(jù)、線性插值數(shù)據(jù)、立方插值數(shù)據(jù)進行運算。如表1所示,本文將計算每一個算例的電壓幅值和相角的MAPE和SNR值,以此對比不同恢復數(shù)據(jù)方法的性能優(yōu)劣。
4.1.1. MAPE指標對比
Appendix A中的Table S1和S2分別顯示了基于SRPNSE、線性插值和立方插值情況下的電壓幅值和相角的MAPE值;圖6和圖7分別給出了對應的對比圖。需要指出,圖6和圖7中每個子圖都包含四種數(shù)據(jù)恢復情況。例如,圖6(a)表示分別從1/60、1/300、1/600和1/900 Hz往上恢復五倍數(shù)據(jù)的算例。
4.1.2. SNR指標對比
Appendix A中的Table S3和S4分別顯示了基于SRPNSE、線性插值和立方插值情況下的電壓幅值和相角的SNR值;圖8和9分別給出了對應的對比圖。
4.2.1. MAPE指標對比
Appendix A中的Table S5、S6和S7分別顯示了負荷5、7和9節(jié)點上基于SRPNSE、線性插值和立方插值情況下的MAPE值。本文以節(jié)點5的情況為代表,如圖10所示。
4.2.2. SNR指標對比
Appendix A中的Table S8、S9和S10分別顯示了負荷5、7和9節(jié)點上基于SRPNSE、線性插值和立方插值情況下的SNR值。本文以節(jié)點5的情況為代表,如圖11所示。
本文中的9節(jié)點系統(tǒng)共有3臺發(fā)電機、9個節(jié)點和9條線路。文中有4類共16種算例,本文中,我們隨機選擇算例4、節(jié)點3和線路5~6作為代表,以詳細顯示狀態(tài)估計的可視化比較。具體來說,我們隨機選擇一個時間段,依次展示節(jié)點3上的電壓幅值和相角、線路5~6上的有功功率以及節(jié)點3上的發(fā)電機出力的波動在η= 5、η= 10、η= 50和η= 100四種情況下的數(shù)據(jù)恢復結果。在每個圖中,我們將真實的下采數(shù)據(jù)、SRPNSE數(shù)據(jù)、線性插值數(shù)據(jù)、立方插值數(shù)據(jù)進行可視化處理以進行比較。
表1 下采樣因子及超分辨率因子
圖6. SRPNSE、線性插值和立方插值的電壓幅值的MAPE對比。(a)η= 5;(b)η = 10;(c)η = 50;(d)η = 100。
圖7. SRPNSE、線性插值和立方插值的電壓相角的MAPE對比。(a)η= 5;(b)η = 10;(c)η = 50;(d)η = 100。
圖8. SRPNSE、線性插值和立方插值的電壓幅值的SNR對比。(a)η =5;(b)η = 10;(c)η = 50;(d)η = 100。
4.3.1. 算例4且η= 5:節(jié)點3的電壓幅值
圖9. SRPNSE、線性插值和立方插值的電壓相角的SNR對比。(a)η =5;(b)η = 10;(c)η = 50;(d)η = 100。
圖10. 負荷節(jié)點5上SRPNSE、線性插值和立方插值的MAPE對比。(a)η = 5;(b)η = 10;(c)η = 50;(d)η = 100。
圖11. 負荷節(jié)點5上SRPNSE、線性插值和立方插值的SNR對比。(a)η = 5;(b)η = 10;(c)η = 50;(d)η = 100。
在這種情況下,α= 90 000、η= 5,即控制中心接收到的低頻數(shù)據(jù)的頻率為1/900 Hz,需要從1/900 Hz的數(shù)據(jù)中恢復出1/180 Hz的數(shù)據(jù),隨后基于恢復的數(shù)據(jù)進行狀態(tài)估計運算。如圖12所示,隨機選取一段節(jié)點3上的電壓幅值,分別對比了實際下采數(shù)據(jù)、基于SRPNSE恢復的數(shù)據(jù)、基于線性插值恢復的數(shù)據(jù)和基于立方插值恢復的數(shù)據(jù)。
4.3.2. 算例4且η= 10:節(jié)點3的電壓相角
在這種情況下,α= 90 000、η= 10,即控制中心接收到的低頻數(shù)據(jù)的頻率為1/900 Hz,需要從1/900 Hz的數(shù)據(jù)中恢復出1/180 Hz的數(shù)據(jù),隨后基于恢復的數(shù)據(jù)進行狀態(tài)估計運算。如圖13所示,隨機選取一段節(jié)點3上的電壓相角,分別對比了實際下采數(shù)據(jù)、基于SRPNSE恢復的數(shù)據(jù)、基于線性插值恢復的數(shù)據(jù)和基于立方插值恢復的數(shù)據(jù)。
4.3.3. 算例4且η= 50:線路5~6的有功功率
在這種情況下,α= 90 000、η= 50,即控制中心接收到的低頻數(shù)據(jù)的頻率為1/900 Hz,需要從1/900 Hz的數(shù)據(jù)中恢復出1/180 Hz的數(shù)據(jù),隨后基于恢復的數(shù)據(jù)進行狀態(tài)估計運算。如圖14所示,隨機選取一段線路5~6上的有功功率,分別對比了實際下采數(shù)據(jù)、基于SRPNSE恢復的數(shù)據(jù)、基于線性插值恢復的數(shù)據(jù)和基于立方插值恢復的數(shù)據(jù)。
圖12. 狀態(tài)估計運算后,節(jié)點3上的電壓幅值從1/900 Hz恢復至1/180 Hz的情況。(a)實際下采數(shù)據(jù);(b)SRPNSE;(c)線性插值;(d)立方插值。p.u.:標幺值。
圖13. 狀態(tài)估計運算后,節(jié)點3上的電壓相角從1/900 Hz恢復至1/180 Hz的情況。(a)實際下采數(shù)據(jù);(b)SRPNSE;(c)線性插值;(d)立方插值。
4.3.4. 算例4且η= 100:節(jié)點3上的發(fā)電機出力
在這種情況下,α= 90 000、η= 100,即控制中心接收到的低頻數(shù)據(jù)的頻率為1/900 Hz,需要從1/900 Hz的數(shù)據(jù)中恢復出1/180 Hz的數(shù)據(jù),隨后基于恢復的數(shù)據(jù)進行狀態(tài)估計運算。如圖15所示,隨機選取一段節(jié)點3上的發(fā)電機出力,分別對比了實際下采數(shù)據(jù)、基于SRPNSE恢復的數(shù)據(jù)、基于線性插值恢復的數(shù)據(jù)和基于立方插值恢復的數(shù)據(jù)。
本文共計4類16種不同情況的算例,本文隨機選取負荷節(jié)點5上的算例1和負荷節(jié)點9上的算例4算例,詳細討論恢復的負荷數(shù)據(jù)情況,并分別對比了實際下采數(shù)據(jù)、基于SRPNSE恢復的數(shù)據(jù)、基于線性插值恢復的數(shù)據(jù)和基于立方插值恢復的數(shù)據(jù)。
4.4.1. 負荷節(jié)點5:從1/60 Hz恢復數(shù)據(jù)
圖14. 狀態(tài)估計運算后,線路5~6上的有功功率從1/900 Hz恢復至1/180 Hz的情況。(a)實際下采數(shù)據(jù);(b)SRPNSE;(c)線性插值;(d)立方插值。
圖15. 狀態(tài)估計運算后,節(jié)點3上發(fā)電機出力從1/900 Hz恢復至1/180 Hz的情況。(a)實際下采數(shù)據(jù);(b)SRPNSE;(c)線性插值;(d)立方插值。
在這種情況下,α= 6000、η= 5、η= 10、η= 50、η= 100,即控制中心接收到的低頻數(shù)據(jù)的頻率為1/60 Hz,需要從1/60 Hz的數(shù)據(jù)中分別恢復出1/12 Hz、1/6 Hz、5/6 Hz、5/3 Hz的數(shù)據(jù)。如圖16至圖19所示,隨機選擇了一個時間段的數(shù)據(jù),分別對比了實際下采數(shù)據(jù)、基于SRPNSE恢復的數(shù)據(jù)、基于線性插值恢復的數(shù)據(jù)和基于立方插值恢復的數(shù)據(jù)。
4.4.2. 負荷節(jié)點9:從1/900 Hz恢復數(shù)據(jù)
圖16. 負荷數(shù)據(jù)從1/60 Hz恢復至1/12 Hz的情況。(a)實際下采數(shù)據(jù);(b)SRPNSE;(c)線性插值;(d)立方插值。
在 這 種 情 況 下,α= 9000、η= 5、η= 10、η=50、η= 100,即控制中心接收到的低頻數(shù)據(jù)的頻率為1/900 Hz,需要從1/900 Hz的數(shù)據(jù)中分別恢復出1/180 Hz、1/90 Hz、1/18 Hz、1/9 Hz的數(shù)據(jù)。如圖20至圖23所示,隨機選擇了一個時間段的數(shù)據(jù),分別對比了實際下采數(shù)據(jù)、基于SRPNSE恢復的數(shù)據(jù)、基于線性插值恢復的數(shù)據(jù)和基于立方插值恢復的數(shù)據(jù)。
Appendix A中的Table S11和S12分別給出了使用SGD、ADAM和RMSProp算法求解所提出的SRPNSE的MAPE和SNR值的對比情況。本文以這三種算法在負荷節(jié)點5上的MAPE值為代表,見圖24。
圖17. 負荷數(shù)據(jù)從1/60 Hz 恢復至1/6 Hz的情況。(a)實際下采數(shù)據(jù);(b)SRPNSE;(c)線性插值;(d)立方插值。
圖18. 負荷數(shù)據(jù)從1/60 Hz 恢復至5/6 Hz的情況。(a)實際下采數(shù)據(jù);(b)SRPNSE;(c)線性插值;(d)立方插值。
圖19. 負荷數(shù)據(jù)從1/60 Hz 恢復至5/3 Hz的情況。(a)實際下采數(shù)據(jù);(b)SRPNSE;(c)線性插值;(d)立方插值。
圖20. 負荷數(shù)據(jù)從1/900 Hz恢復至1/180 Hz的情況。(a)實際下采數(shù)據(jù);(b)SRPNSE;(c)線性插值;(d)立方插值。
圖21. 負荷數(shù)據(jù)從1/900 Hz恢復至1/90 Hz的情況。(a)實際下采數(shù)據(jù);(b)SRPNSE;(c)線性插值;(d)立方插值。
此外,對比了SGD、RMSProp和ADAM算法在每次迭代過程中的損失函數(shù)。本文隨機選取了算例4且η=100的算例作為代表[圖25(a)]。圖25(b)分別給出了前80次迭代和300~380次迭代的放大視圖。
Appendix A中的Tables S1~S4、圖6至圖9和圖12至圖15給出了對于狀態(tài)估計結果的比較;Tables S5~S10、圖10至圖11和圖16至圖23給出了基于負荷節(jié)點數(shù)據(jù)的比較。需要指出的是,后者是表計測量值的SR結果的對比,而前者則是基于表計測量值SR結果的狀態(tài)估計運算的對比。
圖22. 負荷數(shù)據(jù)從1/900 Hz恢復至1/18 Hz的情況。(a)實際下采數(shù)據(jù);(b)SRPNSE;(c)線性插值;(d)立方插值。
圖23. 負荷數(shù)據(jù)從1/900 Hz恢復至1/9 Hz的情況。(a)實際下采數(shù)據(jù);(b)SRPNSE;(c)線性插值;(d)立方插值。
圖24. 基于SGD、RMSProp和ADAM算法的MAPE值對比情況。(a)η = 5;(b)η = 10;(c)η = 50;(d)η = 100。
圖25. 以算例4且η = 100的算例作為代表,基于SGD、RMSProp和ADAM算法的損失函數(shù)對比情況。迭代[1, 500](a)、迭代[1, 80](b)及迭代[300,380](c)中的MSE值。
首先,從Tables S1~S4和Tables S5~S10可以清楚地看出,本文所提出的SRPNSE方法的表現(xiàn)明顯優(yōu)于線性插值法和立方插值法。這表明,通過SRPNSE方法恢復的數(shù)據(jù)可以實現(xiàn)對實際情況的更準確估計,從而有助于獲得更準確的狀態(tài)估計結果。值得一提的是,SRPNSE、線性插值和立方插值方法之間的對比效果非常顯著,如Tables S1~S4和圖6至圖9所示,相應數(shù)據(jù)之間的差距可達一至兩個數(shù)量級。因此,線性插值和立方插值方法在從低頻數(shù)據(jù)中恢復丟失信息方面的能力較弱,而本文所提出的SRPNSE方法表現(xiàn)良好。
其次,從Tables S5~S7可以明顯看出,無論超分辨率因子是多少,當采樣頻率下降時,SRPNSE和插值法的MAPE值都會隨之增加,且采樣頻率越低,SRPNSE和插值法之間的MAPE差異就越大。而在case 1中,SRPNSE和插值方法之間的MAPE差異不大的原因是,采樣頻率較高的數(shù)據(jù)已經(jīng)包含足夠的信息,這恰好有助于提高插值的準確性。
再次,通過比較特定情況下不同超分辨率因子的情況,如算例3,η = 5、η = 10、η = 50和η = 100,從Tables S5~S7和Tables S8~S10可以清楚地看出,較小的超分辨率因子通常會使得SRPNSE和插值法都能有較好的表現(xiàn)。
最后,從圖24和Tables S11~S12中可以明顯看出,基于ADAM算法的MAPE值大多低于基于RMSProp和SGD算法的MAPE值。如圖25(a)所示,SGD算法收斂速度較慢,并且持續(xù)遇到振蕩的情況;如圖25(b)所示,與RMSProp相比,ADAM算法的收斂速度稍慢,但其穩(wěn)定性非常出色。其結果與3.4節(jié)的一致,即ADAM算法不僅使用動態(tài)調(diào)整的學習速率來加快收斂速度,而且使用累積的動量來保持穩(wěn)定。因此,在解決本文提出的SRPNSE框架方面,ADAM算法的表現(xiàn)要優(yōu)于RMSProp和SGD算法。
本文提出了一種新的基于機器學習的SRP方法來提高智能電網(wǎng)狀態(tài)估計的數(shù)據(jù)完整性,算例證明了該方法的有效性和實用價值。
本文所提的SRPNSE方法是一種在解決狀態(tài)估計SRP問題時,獨立恢復表計高頻數(shù)據(jù)而不使用任何來自相鄰表計信息的算法。因此,無論針對多大規(guī)模的系統(tǒng),逐個完成各個表計的數(shù)據(jù)恢復工作即可。需指出,本文基于一個9節(jié)點系統(tǒng)進行算例分析,但是該系統(tǒng)的負荷數(shù)據(jù)量非常大,約為10 GB。更大的測試系統(tǒng)意味著更大的計算資源,即需要在硬件(GPU和內(nèi)存)上進行額外投資。我們將此留作日后的工作去完成。未來,我們將在更高頻率的數(shù)據(jù)上進行測試,如從100 Hz、10 Hz或1 Hz起恢復數(shù)據(jù)。
事實上,SRPNSE方法不僅可以應用于智能電網(wǎng)的狀態(tài)估計,還可以應用于智能電網(wǎng)中的許多重要模塊,甚至其他工業(yè)領域。通過應用SRPNSE方法,可以在不需要進一步投資和系統(tǒng)升級的情況下,克服由表計、通信信道和異常數(shù)據(jù)造成的阻礙和挑戰(zhàn),直接將低質(zhì)量數(shù)據(jù)恢復成高質(zhì)量數(shù)據(jù),從而提高現(xiàn)有工業(yè)系統(tǒng)的效率和安全性。
致謝
本研究得到了國家自然科學基金重大研究計劃(91746118)、深圳市科技創(chuàng)新委員會基礎研究項目(JCYJ20170410172224515)、深圳市人工智能與機器人研究院、中國科學院青年創(chuàng)新促進會的支持。
Compliance with ethics guidelines
Gaoqi Liang, Guolong Liu, Junhua Zhao, Yanli Liu,Jinjin Gu, Guangzhong Sun, and Zhaoyang Dong declare that they have no conflict of interest or financial conflicts to disclose.
Appendix A. Supplementary data
Supplementary data to this article can be found online at https://doi.org/10.1016/j.eng.2020.06.006.