亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于用電模式聚類的層級(jí)電力時(shí)序預(yù)測(cè)方法

2020-11-12 10:38:54沈泉江郭乃網(wǎng)鄭作梁

計(jì)算機(jī)應(yīng)用與軟件 2020年11期

關(guān)鍵詞：方法模型

沈泉江郭乃網(wǎng) 鄭作梁

1(上海市電力科學(xué)研究院上海 200437) 2(星環(huán)科技(上海)有限公司上海 200233)

0 引言

電力需求預(yù)測(cè)是電網(wǎng)系統(tǒng)中的一個(gè)十分重要的問(wèn)題，關(guān)乎國(guó)家的發(fā)展大計(jì)[1]。精確的電力需求預(yù)測(cè)可以有效地指導(dǎo)電力系統(tǒng)有關(guān)部門的合理決策和管理，從而促進(jìn)國(guó)家經(jīng)濟(jì)發(fā)展，以及緩解生態(tài)環(huán)境問(wèn)題。隨著智能電網(wǎng)系統(tǒng)地快速發(fā)展，海量的用電數(shù)據(jù)不斷地產(chǎn)生，其蘊(yùn)含了極大的潛在價(jià)值[2]。由于電力數(shù)據(jù)的規(guī)模極大，種類繁雜，因此如何高效合理地利用這些數(shù)據(jù)是一個(gè)亟待解決的問(wèn)題。

目前，常用的電力需求預(yù)測(cè)模型大多是基于地理層級(jí)結(jié)構(gòu)的[3]。例如，一個(gè)城市的電力需求可以通過(guò)行政區(qū)劃劃分為若干區(qū)域，并再進(jìn)一步劃分為若干街道、街區(qū)。圖1展示了6個(gè)不同城市的代表性的用戶用電時(shí)間序列曲線。

圖1 不同地理區(qū)域的代表性用電時(shí)間序列曲線

本文提出一種基于用電模式聚類的層級(jí)電力時(shí)序預(yù)測(cè)方法。相對(duì)于傳統(tǒng)的用電預(yù)測(cè)模型，該方法能夠自動(dòng)地對(duì)層級(jí)結(jié)構(gòu)的用電數(shù)據(jù)進(jìn)行建模，并且其預(yù)測(cè)精度顯著提升。該方法的主要?jiǎng)?chuàng)新點(diǎn)如下：

1) 使用ST-DBSCAN聚類算法自動(dòng)地對(duì)家庭用電數(shù)據(jù)進(jìn)行聚類，從而構(gòu)建用電模式的層級(jí)結(jié)構(gòu)。2) 基于聚合一致性將層級(jí)預(yù)測(cè)建模為最優(yōu)GLS回歸問(wèn)題，直接通過(guò)梯度下降法求解。3) 加入L1正則化降低模型的復(fù)雜性，防止模型訓(xùn)練陷入過(guò)擬合，從而提高模型的泛化能力，并使得MAPE和RMSE指標(biāo)也得到顯著提高。

1 層級(jí)電力時(shí)序預(yù)測(cè)基本原理

層級(jí)電力時(shí)序預(yù)測(cè)是智能電網(wǎng)中一個(gè)十分重要的課題，區(qū)別于傳統(tǒng)的電力預(yù)測(cè)，其難點(diǎn)主要體現(xiàn)在如下兩點(diǎn)：

1) 時(shí)序性。即對(duì)電力的預(yù)測(cè)不僅要考慮環(huán)境、電費(fèi)、政府政策等外部特征因素，還需要考慮用戶自身的歷史用電曲線，根據(jù)歷史曲線體現(xiàn)出的用電規(guī)律或者用電模式，來(lái)預(yù)測(cè)用戶接下來(lái)用電曲線的變化。

2) 層級(jí)性。用戶的用電量、用電習(xí)慣與用戶的地理區(qū)域分布具有很強(qiáng)的相關(guān)性，例如北方用戶的用電量大多集中在冬季(取暖用電)，而南方用戶的用戶量大多集中在夏季(防暑用電)。因此，不同地理區(qū)域的用戶可以根據(jù)其所在街道、城鄉(xiāng)、縣市、省份等層次進(jìn)行逐層歸類與劃分。因此，在層級(jí)預(yù)測(cè)中，我們很關(guān)心同一層級(jí)的用戶之間、父子層級(jí)的用戶之間的用電模式是否存在一些隱含的關(guān)系，這種隱含關(guān)系能夠輔助我們更好地預(yù)測(cè)用電模式。此外，相較于直接對(duì)電力時(shí)序數(shù)據(jù)進(jìn)行預(yù)測(cè)，層級(jí)預(yù)測(cè)具有更加良好的可解釋性，并且能夠在一定程度上降低模型的計(jì)算量。

聚合一致性是層級(jí)預(yù)測(cè)中的關(guān)鍵，即分解后的若干時(shí)間序列的加和應(yīng)當(dāng)同高層次聚合后的時(shí)間序列相等。由于在整個(gè)時(shí)間序列的獨(dú)立預(yù)測(cè)中很難保證聚合一致性，因此目前在工業(yè)界中往往采用“自底向上”的方法。然而，當(dāng)分解后的數(shù)據(jù)信噪比較低時(shí)，現(xiàn)有的方法往往預(yù)測(cè)精度較差[4]。近年來(lái)，各種基于最優(yōu)調(diào)節(jié)的方法逐漸成為了主流，例如Hyndman等[5]提出了一種基于最小二乘協(xié)調(diào)法處理層級(jí)預(yù)測(cè)問(wèn)題的方法。然而，由于調(diào)節(jié)的副作用可能會(huì)擴(kuò)大預(yù)測(cè)誤差，因此通常以犧牲預(yù)測(cè)精度為代價(jià)來(lái)實(shí)現(xiàn)聚合一致性。

為了避免聚合一致性帶來(lái)的預(yù)測(cè)精度降低，本文提出了一種全新的電力需求層級(jí)預(yù)測(cè)方法。該方法不直接對(duì)地理層次結(jié)構(gòu)進(jìn)行處理，而是對(duì)用電模式檢測(cè)進(jìn)行時(shí)間序列的聚類分析。由于個(gè)人家庭用電往往在一定程度上隨時(shí)間穩(wěn)定增長(zhǎng)，因此本文基于聚類結(jié)果，構(gòu)建了一個(gè)新的基于用電模式的時(shí)間序列層級(jí)結(jié)構(gòu)。通過(guò)將具有相似模式的時(shí)間序列組合在一起，可以顯著提高聚合時(shí)間序列的信噪比，從而提高聚合時(shí)間序列的預(yù)測(cè)精度。在此基礎(chǔ)之上提出了一種新的優(yōu)化調(diào)節(jié)方法，以提高分解時(shí)間序列的預(yù)測(cè)能力。最后采用“自底向上”的方法對(duì)分解后的預(yù)測(cè)結(jié)果進(jìn)行匯總，形成各種高層級(jí)的聚合預(yù)測(cè)，從而實(shí)現(xiàn)了地理層級(jí)結(jié)構(gòu)的聚合一致性。

2 算法設(shè)計(jì)

2.1 用電模式分析

首先探討一下智能電表數(shù)據(jù)的用電模式。用電模式是利用ST-DBSCAN[6]聚類算法從個(gè)體家庭時(shí)間序列的數(shù)量中提取出來(lái)的。ST-DBSCAN聚類算法是一種基于DBSCAN算法的改進(jìn)，本質(zhì)上也是一種基于密度的聚類算法。ST-DBSCAN擁有傳統(tǒng)的DBSCAN具有的優(yōu)勢(shì)：基于密度的聚類，即給定密度閾值，如果兩個(gè)點(diǎn)的距離小于這個(gè)閾值，那么將其劃分至同一個(gè)類別。相較于K-means算法，ST-DBSCAN不需要提前定義好類別數(shù)K，其能夠自動(dòng)地學(xué)習(xí)出最適合的類別數(shù)。此外，ST-DBSCAN相較于DBSCAN，其在時(shí)空數(shù)據(jù)上的表現(xiàn)更加優(yōu)異，與用電時(shí)序數(shù)據(jù)的地理區(qū)域分布和時(shí)序特征恰好吻合。

以圖2為例，其展示了將5個(gè)時(shí)間序列進(jìn)行聚類，并抽取出其用電模式的過(guò)程。首先對(duì)于這5個(gè)用電時(shí)間序列，采用ST-DBSCAN將其劃分為兩個(gè)類別，然后通過(guò)時(shí)間序列的聚合算法，將每個(gè)聚類中時(shí)間序列的共性提取出來(lái)，從而得到能顯著代表聚類中所有時(shí)間序列的整體趨勢(shì)共性的用電模式。

圖2 基于ST-DBSCAN聚類的用電模式分析過(guò)程

2.2 層級(jí)結(jié)構(gòu)構(gòu)建

不同層級(jí)的用電消費(fèi)水平大體上是一致的。如果聚合時(shí)間序列的預(yù)測(cè)是準(zhǔn)確的，那么在聚合約束和調(diào)節(jié)的情況下，單個(gè)時(shí)間序列的平均預(yù)測(cè)精度就有可能得到提升。此外，用電時(shí)間序列的模式要比基于地理層級(jí)結(jié)構(gòu)的聚合時(shí)間序列更為規(guī)則。因此，基于用電模式的預(yù)測(cè)誤差應(yīng)當(dāng)要小于基于地理區(qū)域聚合時(shí)間序列的預(yù)測(cè)誤差。

基于這個(gè)想法，本文構(gòu)建了一個(gè)基于用電模式的層級(jí)結(jié)構(gòu)，如圖3所示。這種層級(jí)結(jié)構(gòu)由高層的用電模式和低層的單獨(dú)的時(shí)間序列構(gòu)成。最左列的用電模式向右衍生出三個(gè)子用電模式，如中間列所示。這三個(gè)用電模式又分別向右衍生出它們各自的用電模式?？梢钥闯?，屬于同一個(gè)父節(jié)點(diǎn)的用電時(shí)間序列曲線，其用電的變化規(guī)律十分相似，只是在變化幅度上有略微的差異。

圖3 基于用電模式聚類的層級(jí)結(jié)構(gòu)

這種層級(jí)結(jié)構(gòu)相較于傳統(tǒng)的用電預(yù)測(cè)方法，其優(yōu)勢(shì)主要體現(xiàn)在它充分利用了地理區(qū)域相近的用戶具有相似的用電模式這一先驗(yàn)特征。并且在理想情況下，層級(jí)結(jié)構(gòu)的深度是Log級(jí)別的，其運(yùn)算復(fù)雜度很小。此外，層級(jí)結(jié)構(gòu)中的每一層有對(duì)應(yīng)的具體含義，例如頂層代表國(guó)家、底層代表街道，這樣，模型的預(yù)測(cè)結(jié)果就具有更好的可解釋性。

2.3 基于聚合一致性的層級(jí)預(yù)測(cè)

(1)

本文目標(biāo)是通過(guò)最小化平方預(yù)測(cè)誤差的期望值來(lái)獲得調(diào)節(jié)后的底層預(yù)測(cè)：

(2)

式(2)中的最優(yōu)解可以通過(guò)最佳線性無(wú)偏調(diào)節(jié)預(yù)測(cè)得到：

(3)

式中：Uh表示h時(shí)間段內(nèi)的預(yù)測(cè)誤差的協(xié)方差矩陣。

根據(jù)廣義最小二乘法(GLS)[8]，式(3)中的底層預(yù)測(cè)結(jié)果也可以通過(guò)回歸模型來(lái)得到：

(4)

(5)

通過(guò)這種方式，將問(wèn)題建模為一個(gè)關(guān)于預(yù)測(cè)誤差的最優(yōu)GLS回歸問(wèn)題，可以使用梯度下降法[9]求解。

為了使得優(yōu)化更加快速且魯棒，本文使用了Adam算法[10]取代傳統(tǒng)的隨機(jī)梯度下降優(yōu)化算法(Stochastic Gradient Descent)進(jìn)行優(yōu)化。相對(duì)于傳統(tǒng)的隨機(jī)梯度下降法，Adam算法的優(yōu)勢(shì)主要體現(xiàn)在如下兩個(gè)方面：1) Adam算法引入了動(dòng)量(Momentum)機(jī)制，通過(guò)指數(shù)加權(quán)平均(Exponentially Weighted Averages)方法，在每次對(duì)一個(gè)Batch的數(shù)據(jù)做梯度下降時(shí)，通過(guò)一個(gè)超參數(shù)來(lái)控制每次的梯度一部分來(lái)自最新計(jì)算的值，另一部分來(lái)自歷史保留的值，從而使得最終得到的梯度為過(guò)去幾個(gè)Batch的平均值。歷史Batch梯度的平均值等效為動(dòng)量，可以加速網(wǎng)絡(luò)向過(guò)去累積更新量最大的方向進(jìn)行更新，顯著地加快模型的收斂速度。2) Adam算法引入了RMSprop機(jī)制，在每個(gè)Batch計(jì)算梯度時(shí)，也利用了指數(shù)平均加權(quán)方法，對(duì)梯度的平方根倒數(shù)進(jìn)行累加平均。達(dá)到的效果是：每個(gè)Batch計(jì)算出的梯度能夠根據(jù)歷史梯度的震蕩情況，自動(dòng)消解來(lái)回震蕩幅度大的方法，避免梯度在無(wú)意義的方向上來(lái)回?cái)[動(dòng)，從而加速收斂并增加了訓(xùn)練的魯棒性。

此外，我們?cè)谟?xùn)練的過(guò)程中也引入了一些其他防止模型過(guò)擬合的機(jī)制，例如L1正則化、BatchNorm、Dropout等。BatchNorm即在Adam算法每次取一個(gè)Batch的數(shù)據(jù)時(shí)，將數(shù)據(jù)在一個(gè)Batch內(nèi)進(jìn)行歸一化，使得特征的均值為0，并且起到了一定的數(shù)據(jù)增強(qiáng)作用(每個(gè)樣本在不同的Batch中的特征值均不同)。Dropout則是在每個(gè)Batch訓(xùn)練的過(guò)程中，隨機(jī)地丟棄若干輸入數(shù)據(jù)的特征，通過(guò)加入一定噪聲增加模型的魯棒性。本文將Dropout的概率設(shè)為0.5。

2.4 L1正則化

正則化屬于結(jié)構(gòu)風(fēng)險(xiǎn)最小化策略，能夠有效地防止參數(shù)過(guò)大所導(dǎo)致的過(guò)擬合。L1正則化是一種常見(jiàn)的正則化技術(shù)，也稱為L(zhǎng)1范數(shù)，其等于模型權(quán)重的絕對(duì)值之和。L1正則化具有以下特點(diǎn)：

1) L1正則化可以防止模型的權(quán)重過(guò)大，起到防止過(guò)擬合的作用(但其正則化強(qiáng)度略低于L2正則化)。

2) L1正則化可以使模型得到一組相對(duì)稀疏的權(quán)值，也就是當(dāng)模型收斂后，權(quán)值矩陣中有很多值接近0。

因此，我們?cè)谑?5)所示的優(yōu)化目標(biāo)中加入了L1正則項(xiàng)[11]：

(6)

圖4 理想調(diào)節(jié)下用電絕對(duì)值與用電時(shí)間序列到聚類中心距離的分布對(duì)比

用電時(shí)間序列與其用電模式越相似，也就意味著這個(gè)用電時(shí)間序列是越穩(wěn)定和正規(guī)的，即當(dāng)時(shí)間序列越接近聚類中心時(shí)，其預(yù)測(cè)結(jié)果越準(zhǔn)確，因此需要的調(diào)整也就越小。為了確定如何達(dá)到最優(yōu)的調(diào)節(jié)，本文引入了正則化項(xiàng)來(lái)懲罰序列調(diào)整分布與其對(duì)應(yīng)模式隸屬度的相關(guān)性。當(dāng)用電時(shí)間序列接近聚類中心時(shí)，通過(guò)求解式(6)得到的相應(yīng)的調(diào)整值將較小。

3 實(shí) 驗(yàn)

3.1 實(shí)驗(yàn)數(shù)據(jù)與設(shè)置

在本文實(shí)驗(yàn)部分，采用了來(lái)自能源需求研究項(xiàng)目的公開(kāi)電力數(shù)據(jù)集：EDRP(Early Smart Meter Trials)[12]。該數(shù)據(jù)集是關(guān)于個(gè)人家庭用電消耗的真實(shí)數(shù)據(jù)集，包含了2 501個(gè)時(shí)間序列，時(shí)間序列的采樣間隔為30分鐘。

在實(shí)驗(yàn)中，利用數(shù)據(jù)集上的歷史消耗觀測(cè)值，來(lái)計(jì)算提前一步滾動(dòng)預(yù)測(cè)[13]。對(duì)于EDRP數(shù)據(jù)集，重復(fù)了48個(gè)預(yù)測(cè)任務(wù)，從2009年5月9日至2009年5月20日，預(yù)測(cè)全天的電力需求。此外，使用平均絕對(duì)百分比誤差(Mean Absolute Percentage Error，MAPE)和均方根誤差(Root Mean Square Error，RMSE)來(lái)測(cè)量預(yù)測(cè)誤差，它們分別表示家庭用電量的相對(duì)預(yù)測(cè)誤差和平均預(yù)測(cè)誤差。

在對(duì)比實(shí)驗(yàn)中，將本文方法與目前常用的模型進(jìn)行比較，其中包括BASE、WLS[14]和MinT-Reg[15]。同時(shí)，也對(duì)加或不加L1正則化項(xiàng)的本文方法分別進(jìn)行了實(shí)驗(yàn)，L1正則化參數(shù)λ的取值為104。

3.2 實(shí)驗(yàn)結(jié)果分析

在EDRP數(shù)據(jù)集上的每個(gè)層級(jí)的預(yù)測(cè)精度和平均統(tǒng)計(jì)結(jié)果分別如表1和表2所示。

表1 不同方法的MAPE比較

表2 不同方法的RMSE比較

可以得出，高層的預(yù)測(cè)結(jié)果的誤差往往比低層的預(yù)測(cè)誤差更小。這是因?yàn)楦邔拥念A(yù)測(cè)由于聚合而具有更高的信噪比。也可以觀察到，BASE模型在一些高的層次的預(yù)測(cè)誤差最小，但是其不能夠保證地理聚合的約束。相比之下，在大多數(shù)情況下，本文方法不僅滿足了地理聚合的約束條件，而且實(shí)現(xiàn)了比BASE模型更高的預(yù)測(cè)精度。

此外，在EDRP數(shù)據(jù)集上帶正則化項(xiàng)的本文方法取得了最高的預(yù)測(cè)精度，并且?guī)1正則化項(xiàng)的方法比不帶L1正則化項(xiàng)的方法展示出了更明顯的優(yōu)勢(shì)。這是因?yàn)長(zhǎng)1正則化項(xiàng)遵循結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則，防止模型陷入過(guò)擬合從而影響精度?？偟膩?lái)說(shuō)，就MAPE和RMSE這兩個(gè)指標(biāo)而言，帶L1正則化項(xiàng)的本文模型在公開(kāi)的真實(shí)場(chǎng)景數(shù)據(jù)集上比對(duì)比模型具有更好的預(yù)測(cè)能力以及更強(qiáng)的魯棒性。

4 結(jié) 語(yǔ)

聚合一致性是層級(jí)時(shí)間序列預(yù)測(cè)的關(guān)鍵點(diǎn)之一。在以往的大多數(shù)工作中，預(yù)測(cè)過(guò)程通常受到地理聚集約束的影響，從而造成預(yù)測(cè)精度的損失。在本文的工作中，證明了靈活使用聚集約束可以帶來(lái)用電需求預(yù)測(cè)的改進(jìn)。為了解決預(yù)測(cè)精度損失的問(wèn)題，本文通過(guò)用電模式分析建立了一個(gè)新的數(shù)據(jù)層級(jí)結(jié)構(gòu)。然后基于新的層級(jí)結(jié)構(gòu)，提出了L1正則化回歸方法，并使用Adam算法進(jìn)行快速訓(xùn)練，在現(xiàn)實(shí)的用電場(chǎng)景中，顯著地提高了聚合和分解時(shí)間序列的預(yù)測(cè)精度。未來(lái)將在電力需求預(yù)測(cè)及其相關(guān)的其他應(yīng)用領(lǐng)域，探索新的層次構(gòu)建方法和具有聚合一致性的優(yōu)化預(yù)測(cè)方法。