沈泉江 郭乃網(wǎng) 鄭作梁
1(上海市電力科學(xué)研究院 上海 200437) 2(星環(huán)科技(上海)有限公司 上海 200233)
電力需求預(yù)測(cè)是電網(wǎng)系統(tǒng)中的一個(gè)十分重要的問(wèn)題,關(guān)乎國(guó)家的發(fā)展大計(jì)[1]。精確的電力需求預(yù)測(cè)可以有效地指導(dǎo)電力系統(tǒng)有關(guān)部門的合理決策和管理,從而促進(jìn)國(guó)家經(jīng)濟(jì)發(fā)展,以及緩解生態(tài)環(huán)境問(wèn)題。隨著智能電網(wǎng)系統(tǒng)地快速發(fā)展,海量的用電數(shù)據(jù)不斷地產(chǎn)生,其蘊(yùn)含了極大的潛在價(jià)值[2]。由于電力數(shù)據(jù)的規(guī)模極大,種類繁雜,因此如何高效合理地利用這些數(shù)據(jù)是一個(gè)亟待解決的問(wèn)題。
目前,常用的電力需求預(yù)測(cè)模型大多是基于地理層級(jí)結(jié)構(gòu)的[3]。例如,一個(gè)城市的電力需求可以通過(guò)行政區(qū)劃劃分為若干區(qū)域,并再進(jìn)一步劃分為若干街道、街區(qū)。圖1展示了6個(gè)不同城市的代表性的用戶用電時(shí)間序列曲線。
圖1 不同地理區(qū)域的代表性用電時(shí)間序列曲線
本文提出一種基于用電模式聚類的層級(jí)電力時(shí)序預(yù)測(cè)方法。相對(duì)于傳統(tǒng)的用電預(yù)測(cè)模型,該方法能夠自動(dòng)地對(duì)層級(jí)結(jié)構(gòu)的用電數(shù)據(jù)進(jìn)行建模,并且其預(yù)測(cè)精度顯著提升。該方法的主要?jiǎng)?chuàng)新點(diǎn)如下:
1) 使用ST-DBSCAN聚類算法自動(dòng)地對(duì)家庭用電數(shù)據(jù)進(jìn)行聚類,從而構(gòu)建用電模式的層級(jí)結(jié)構(gòu)。2) 基于聚合一致性將層級(jí)預(yù)測(cè)建模為最優(yōu)GLS回歸問(wèn)題,直接通過(guò)梯度下降法求解。3) 加入L1正則化降低模型的復(fù)雜性,防止模型訓(xùn)練陷入過(guò)擬合,從而提高模型的泛化能力,并使得MAPE和RMSE指標(biāo)也得到顯著提高。
層級(jí)電力時(shí)序預(yù)測(cè)是智能電網(wǎng)中一個(gè)十分重要的課題,區(qū)別于傳統(tǒng)的電力預(yù)測(cè),其難點(diǎn)主要體現(xiàn)在如下兩點(diǎn):
1) 時(shí)序性。即對(duì)電力的預(yù)測(cè)不僅要考慮環(huán)境、電費(fèi)、政府政策等外部特征因素,還需要考慮用戶自身的歷史用電曲線,根據(jù)歷史曲線體現(xiàn)出的用電規(guī)律或者用電模式,來(lái)預(yù)測(cè)用戶接下來(lái)用電曲線的變化。
2) 層級(jí)性。用戶的用電量、用電習(xí)慣與用戶的地理區(qū)域分布具有很強(qiáng)的相關(guān)性,例如北方用戶的用電量大多集中在冬季(取暖用電),而南方用戶的用戶量大多集中在夏季(防暑用電)。因此,不同地理區(qū)域的用戶可以根據(jù)其所在街道、城鄉(xiāng)、縣市、省份等層次進(jìn)行逐層歸類與劃分。因此,在層級(jí)預(yù)測(cè)中,我們很關(guān)心同一層級(jí)的用戶之間、父子層級(jí)的用戶之間的用電模式是否存在一些隱含的關(guān)系,這種隱含關(guān)系能夠輔助我們更好地預(yù)測(cè)用電模式。此外,相較于直接對(duì)電力時(shí)序數(shù)據(jù)進(jìn)行預(yù)測(cè),層級(jí)預(yù)測(cè)具有更加良好的可解釋性,并且能夠在一定程度上降低模型的計(jì)算量。
聚合一致性是層級(jí)預(yù)測(cè)中的關(guān)鍵,即分解后的若干時(shí)間序列的加和應(yīng)當(dāng)同高層次聚合后的時(shí)間序列相等。由于在整個(gè)時(shí)間序列的獨(dú)立預(yù)測(cè)中很難保證聚合一致性,因此目前在工業(yè)界中往往采用“自底向上”的方法。然而,當(dāng)分解后的數(shù)據(jù)信噪比較低時(shí),現(xiàn)有的方法往往預(yù)測(cè)精度較差[4]。近年來(lái),各種基于最優(yōu)調(diào)節(jié)的方法逐漸成為了主流,例如Hyndman等[5]提出了一種基于最小二乘協(xié)調(diào)法處理層級(jí)預(yù)測(cè)問(wèn)題的方法。然而,由于調(diào)節(jié)的副作用可能會(huì)擴(kuò)大預(yù)測(cè)誤差,因此通常以犧牲預(yù)測(cè)精度為代價(jià)來(lái)實(shí)現(xiàn)聚合一致性。
為了避免聚合一致性帶來(lái)的預(yù)測(cè)精度降低,本文提出了一種全新的電力需求層級(jí)預(yù)測(cè)方法。該方法不直接對(duì)地理層次結(jié)構(gòu)進(jìn)行處理,而是對(duì)用電模式檢測(cè)進(jìn)行時(shí)間序列的聚類分析。由于個(gè)人家庭用電往往在一定程度上隨時(shí)間穩(wěn)定增長(zhǎng),因此本文基于聚類結(jié)果,構(gòu)建了一個(gè)新的基于用電模式的時(shí)間序列層級(jí)結(jié)構(gòu)。通過(guò)將具有相似模式的時(shí)間序列組合在一起,可以顯著提高聚合時(shí)間序列的信噪比,從而提高聚合時(shí)間序列的預(yù)測(cè)精度。在此基礎(chǔ)之上提出了一種新的優(yōu)化調(diào)節(jié)方法,以提高分解時(shí)間序列的預(yù)測(cè)能力。最后采用“自底向上”的方法對(duì)分解后的預(yù)測(cè)結(jié)果進(jìn)行匯總,形成各種高層級(jí)的聚合預(yù)測(cè),從而實(shí)現(xiàn)了地理層級(jí)結(jié)構(gòu)的聚合一致性。
首先探討一下智能電表數(shù)據(jù)的用電模式。用電模式是利用ST-DBSCAN[6]聚類算法從個(gè)體家庭時(shí)間序列的數(shù)量中提取出來(lái)的。ST-DBSCAN聚類算法是一種基于DBSCAN算法的改進(jìn),本質(zhì)上也是一種基于密度的聚類算法。ST-DBSCAN擁有傳統(tǒng)的DBSCAN具有的優(yōu)勢(shì):基于密度的聚類,即給定密度閾值,如果兩個(gè)點(diǎn)的距離小于這個(gè)閾值,那么將其劃分至同一個(gè)類別。相較于K-means算法,ST-DBSCAN不需要提前定義好類別數(shù)K,其能夠自動(dòng)地學(xué)習(xí)出最適合的類別數(shù)。此外,ST-DBSCAN相較于DBSCAN,其在時(shí)空數(shù)據(jù)上的表現(xiàn)更加優(yōu)異,與用電時(shí)序數(shù)據(jù)的地理區(qū)域分布和時(shí)序特征恰好吻合。
以圖2為例,其展示了將5個(gè)時(shí)間序列進(jìn)行聚類,并抽取出其用電模式的過(guò)程。首先對(duì)于這5個(gè)用電時(shí)間序列,采用ST-DBSCAN將其劃分為兩個(gè)類別,然后通過(guò)時(shí)間序列的聚合算法,將每個(gè)聚類中時(shí)間序列的共性提取出來(lái),從而得到能顯著代表聚類中所有時(shí)間序列的整體趨勢(shì)共性的用電模式。
圖2 基于ST-DBSCAN聚類的用電模式分析過(guò)程
不同層級(jí)的用電消費(fèi)水平大體上是一致的。如果聚合時(shí)間序列的預(yù)測(cè)是準(zhǔn)確的,那么在聚合約束和調(diào)節(jié)的情況下,單個(gè)時(shí)間序列的平均預(yù)測(cè)精度就有可能得到提升。此外,用電時(shí)間序列的模式要比基于地理層級(jí)結(jié)構(gòu)的聚合時(shí)間序列更為規(guī)則。因此,基于用電模式的預(yù)測(cè)誤差應(yīng)當(dāng)要小于基于地理區(qū)域聚合時(shí)間序列的預(yù)測(cè)誤差。
基于這個(gè)想法,本文構(gòu)建了一個(gè)基于用電模式的層級(jí)結(jié)構(gòu),如圖3所示。這種層級(jí)結(jié)構(gòu)由高層的用電模式和低層的單獨(dú)的時(shí)間序列構(gòu)成。最左列的用電模式向右衍生出三個(gè)子用電模式,如中間列所示。這三個(gè)用電模式又分別向右衍生出它們各自的用電模式??梢钥闯?,屬于同一個(gè)父節(jié)點(diǎn)的用電時(shí)間序列曲線,其用電的變化規(guī)律十分相似,只是在變化幅度上有略微的差異。
圖3 基于用電模式聚類的層級(jí)結(jié)構(gòu)
這種層級(jí)結(jié)構(gòu)相較于傳統(tǒng)的用電預(yù)測(cè)方法,其優(yōu)勢(shì)主要體現(xiàn)在它充分利用了地理區(qū)域相近的用戶具有相似的用電模式這一先驗(yàn)特征。并且在理想情況下,層級(jí)結(jié)構(gòu)的深度是Log級(jí)別的,其運(yùn)算復(fù)雜度很小。此外,層級(jí)結(jié)構(gòu)中的每一層有對(duì)應(yīng)的具體含義,例如頂層代表國(guó)家、底層代表街道,這樣,模型的預(yù)測(cè)結(jié)果就具有更好的可解釋性。
(1)
本文目標(biāo)是通過(guò)最小化平方預(yù)測(cè)誤差的期望值來(lái)獲得調(diào)節(jié)后的底層預(yù)測(cè):
(2)
式(2)中的最優(yōu)解可以通過(guò)最佳線性無(wú)偏調(diào)節(jié)預(yù)測(cè)得到:
(3)
式中:Uh表示h時(shí)間段內(nèi)的預(yù)測(cè)誤差的協(xié)方差矩陣。
根據(jù)廣義最小二乘法(GLS)[8],式(3)中的底層預(yù)測(cè)結(jié)果也可以通過(guò)回歸模型來(lái)得到:
(4)
(5)
通過(guò)這種方式,將問(wèn)題建模為一個(gè)關(guān)于預(yù)測(cè)誤差的最優(yōu)GLS回歸問(wèn)題,可以使用梯度下降法[9]求解。
為了使得優(yōu)化更加快速且魯棒,本文使用了Adam算法[10]取代傳統(tǒng)的隨機(jī)梯度下降優(yōu)化算法(Stochastic Gradient Descent)進(jìn)行優(yōu)化。相對(duì)于傳統(tǒng)的隨機(jī)梯度下降法,Adam算法的優(yōu)勢(shì)主要體現(xiàn)在如下兩個(gè)方面:1) Adam算法引入了動(dòng)量(Momentum)機(jī)制,通過(guò)指數(shù)加權(quán)平均(Exponentially Weighted Averages)方法,在每次對(duì)一個(gè)Batch的數(shù)據(jù)做梯度下降時(shí),通過(guò)一個(gè)超參數(shù)來(lái)控制每次的梯度一部分來(lái)自最新計(jì)算的值,另一部分來(lái)自歷史保留的值,從而使得最終得到的梯度為過(guò)去幾個(gè)Batch的平均值。歷史Batch梯度的平均值等效為動(dòng)量,可以加速網(wǎng)絡(luò)向過(guò)去累積更新量最大的方向進(jìn)行更新,顯著地加快模型的收斂速度。2) Adam算法引入了RMSprop機(jī)制,在每個(gè)Batch計(jì)算梯度時(shí),也利用了指數(shù)平均加權(quán)方法,對(duì)梯度的平方根倒數(shù)進(jìn)行累加平均。達(dá)到的效果是:每個(gè)Batch計(jì)算出的梯度能夠根據(jù)歷史梯度的震蕩情況,自動(dòng)消解來(lái)回震蕩幅度大的方法,避免梯度在無(wú)意義的方向上來(lái)回?cái)[動(dòng),從而加速收斂并增加了訓(xùn)練的魯棒性。
此外,我們?cè)谟?xùn)練的過(guò)程中也引入了一些其他防止模型過(guò)擬合的機(jī)制,例如L1正則化、BatchNorm、Dropout等。BatchNorm即在Adam算法每次取一個(gè)Batch的數(shù)據(jù)時(shí),將數(shù)據(jù)在一個(gè)Batch內(nèi)進(jìn)行歸一化,使得特征的均值為0,并且起到了一定的數(shù)據(jù)增強(qiáng)作用(每個(gè)樣本在不同的Batch中的特征值均不同)。Dropout則是在每個(gè)Batch訓(xùn)練的過(guò)程中,隨機(jī)地丟棄若干輸入數(shù)據(jù)的特征,通過(guò)加入一定噪聲增加模型的魯棒性。本文將Dropout的概率設(shè)為0.5。
正則化屬于結(jié)構(gòu)風(fēng)險(xiǎn)最小化策略,能夠有效地防止參數(shù)過(guò)大所導(dǎo)致的過(guò)擬合。L1正則化是一種常見(jiàn)的正則化技術(shù),也稱為L(zhǎng)1范數(shù),其等于模型權(quán)重的絕對(duì)值之和。L1正則化具有以下特點(diǎn):
1) L1正則化可以防止模型的權(quán)重過(guò)大,起到防止過(guò)擬合的作用(但其正則化強(qiáng)度略低于L2正則化)。
2) L1正則化可以使模型得到一組相對(duì)稀疏的權(quán)值,也就是當(dāng)模型收斂后,權(quán)值矩陣中有很多值接近0。
因此,我們?cè)谑?5)所示的優(yōu)化目標(biāo)中加入了L1正則項(xiàng)[11]:
(6)
圖4 理想調(diào)節(jié)下用電絕對(duì)值與用電時(shí)間序列到聚類中心距離的分布對(duì)比
用電時(shí)間序列與其用電模式越相似,也就意味著這個(gè)用電時(shí)間序列是越穩(wěn)定和正規(guī)的,即當(dāng)時(shí)間序列越接近聚類中心時(shí),其預(yù)測(cè)結(jié)果越準(zhǔn)確,因此需要的調(diào)整也就越小。為了確定如何達(dá)到最優(yōu)的調(diào)節(jié),本文引入了正則化項(xiàng)來(lái)懲罰序列調(diào)整分布與其對(duì)應(yīng)模式隸屬度的相關(guān)性。當(dāng)用電時(shí)間序列接近聚類中心時(shí),通過(guò)求解式(6)得到的相應(yīng)的調(diào)整值將較小。
在本文實(shí)驗(yàn)部分,采用了來(lái)自能源需求研究項(xiàng)目的公開(kāi)電力數(shù)據(jù)集:EDRP(Early Smart Meter Trials)[12]。該數(shù)據(jù)集是關(guān)于個(gè)人家庭用電消耗的真實(shí)數(shù)據(jù)集,包含了2 501個(gè)時(shí)間序列,時(shí)間序列的采樣間隔為30分鐘。
在實(shí)驗(yàn)中,利用數(shù)據(jù)集上的歷史消耗觀測(cè)值,來(lái)計(jì)算提前一步滾動(dòng)預(yù)測(cè)[13]。對(duì)于EDRP數(shù)據(jù)集,重復(fù)了48個(gè)預(yù)測(cè)任務(wù),從2009年5月9日至2009年5月20日,預(yù)測(cè)全天的電力需求。此外,使用平均絕對(duì)百分比誤差(Mean Absolute Percentage Error,MAPE)和均方根誤差(Root Mean Square Error,RMSE)來(lái)測(cè)量預(yù)測(cè)誤差,它們分別表示家庭用電量的相對(duì)預(yù)測(cè)誤差和平均預(yù)測(cè)誤差。
在對(duì)比實(shí)驗(yàn)中,將本文方法與目前常用的模型進(jìn)行比較,其中包括BASE、WLS[14]和MinT-Reg[15]。同時(shí),也對(duì)加或不加L1正則化項(xiàng)的本文方法分別進(jìn)行了實(shí)驗(yàn),L1正則化參數(shù)λ的取值為104。
在EDRP數(shù)據(jù)集上的每個(gè)層級(jí)的預(yù)測(cè)精度和平均統(tǒng)計(jì)結(jié)果分別如表1和表2所示。
表1 不同方法的MAPE比較
表2 不同方法的RMSE比較
可以得出,高層的預(yù)測(cè)結(jié)果的誤差往往比低層的預(yù)測(cè)誤差更小。這是因?yàn)楦邔拥念A(yù)測(cè)由于聚合而具有更高的信噪比。也可以觀察到,BASE模型在一些高的層次的預(yù)測(cè)誤差最小,但是其不能夠保證地理聚合的約束。相比之下,在大多數(shù)情況下,本文方法不僅滿足了地理聚合的約束條件,而且實(shí)現(xiàn)了比BASE模型更高的預(yù)測(cè)精度。
此外,在EDRP數(shù)據(jù)集上帶正則化項(xiàng)的本文方法取得了最高的預(yù)測(cè)精度,并且?guī)1正則化項(xiàng)的方法比不帶L1正則化項(xiàng)的方法展示出了更明顯的優(yōu)勢(shì)。這是因?yàn)長(zhǎng)1正則化項(xiàng)遵循結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則,防止模型陷入過(guò)擬合從而影響精度??偟膩?lái)說(shuō),就MAPE和RMSE這兩個(gè)指標(biāo)而言,帶L1正則化項(xiàng)的本文模型在公開(kāi)的真實(shí)場(chǎng)景數(shù)據(jù)集上比對(duì)比模型具有更好的預(yù)測(cè)能力以及更強(qiáng)的魯棒性。
聚合一致性是層級(jí)時(shí)間序列預(yù)測(cè)的關(guān)鍵點(diǎn)之一。在以往的大多數(shù)工作中,預(yù)測(cè)過(guò)程通常受到地理聚集約束的影響,從而造成預(yù)測(cè)精度的損失。在本文的工作中,證明了靈活使用聚集約束可以帶來(lái)用電需求預(yù)測(cè)的改進(jìn)。為了解決預(yù)測(cè)精度損失的問(wèn)題,本文通過(guò)用電模式分析建立了一個(gè)新的數(shù)據(jù)層級(jí)結(jié)構(gòu)。然后基于新的層級(jí)結(jié)構(gòu),提出了L1正則化回歸方法,并使用Adam算法進(jìn)行快速訓(xùn)練,在現(xiàn)實(shí)的用電場(chǎng)景中,顯著地提高了聚合和分解時(shí)間序列的預(yù)測(cè)精度。未來(lái)將在電力需求預(yù)測(cè)及其相關(guān)的其他應(yīng)用領(lǐng)域,探索新的層次構(gòu)建方法和具有聚合一致性的優(yōu)化預(yù)測(cè)方法。