亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于用電模式聚類的層級(jí)電力時(shí)序預(yù)測(cè)方法

        2020-11-12 10:38:54沈泉江郭乃網(wǎng)鄭作梁
        關(guān)鍵詞:方法模型

        沈泉江 郭乃網(wǎng) 鄭作梁

        1(上海市電力科學(xué)研究院 上海 200437) 2(星環(huán)科技(上海)有限公司 上海 200233)

        0 引 言

        電力需求預(yù)測(cè)是電網(wǎng)系統(tǒng)中的一個(gè)十分重要的問(wèn)題,關(guān)乎國(guó)家的發(fā)展大計(jì)[1]。精確的電力需求預(yù)測(cè)可以有效地指導(dǎo)電力系統(tǒng)有關(guān)部門的合理決策和管理,從而促進(jìn)國(guó)家經(jīng)濟(jì)發(fā)展,以及緩解生態(tài)環(huán)境問(wèn)題。隨著智能電網(wǎng)系統(tǒng)地快速發(fā)展,海量的用電數(shù)據(jù)不斷地產(chǎn)生,其蘊(yùn)含了極大的潛在價(jià)值[2]。由于電力數(shù)據(jù)的規(guī)模極大,種類繁雜,因此如何高效合理地利用這些數(shù)據(jù)是一個(gè)亟待解決的問(wèn)題。

        目前,常用的電力需求預(yù)測(cè)模型大多是基于地理層級(jí)結(jié)構(gòu)的[3]。例如,一個(gè)城市的電力需求可以通過(guò)行政區(qū)劃劃分為若干區(qū)域,并再進(jìn)一步劃分為若干街道、街區(qū)。圖1展示了6個(gè)不同城市的代表性的用戶用電時(shí)間序列曲線。

        圖1 不同地理區(qū)域的代表性用電時(shí)間序列曲線

        本文提出一種基于用電模式聚類的層級(jí)電力時(shí)序預(yù)測(cè)方法。相對(duì)于傳統(tǒng)的用電預(yù)測(cè)模型,該方法能夠自動(dòng)地對(duì)層級(jí)結(jié)構(gòu)的用電數(shù)據(jù)進(jìn)行建模,并且其預(yù)測(cè)精度顯著提升。該方法的主要?jiǎng)?chuàng)新點(diǎn)如下:

        1) 使用ST-DBSCAN聚類算法自動(dòng)地對(duì)家庭用電數(shù)據(jù)進(jìn)行聚類,從而構(gòu)建用電模式的層級(jí)結(jié)構(gòu)。2) 基于聚合一致性將層級(jí)預(yù)測(cè)建模為最優(yōu)GLS回歸問(wèn)題,直接通過(guò)梯度下降法求解。3) 加入L1正則化降低模型的復(fù)雜性,防止模型訓(xùn)練陷入過(guò)擬合,從而提高模型的泛化能力,并使得MAPE和RMSE指標(biāo)也得到顯著提高。

        1 層級(jí)電力時(shí)序預(yù)測(cè)基本原理

        層級(jí)電力時(shí)序預(yù)測(cè)是智能電網(wǎng)中一個(gè)十分重要的課題,區(qū)別于傳統(tǒng)的電力預(yù)測(cè),其難點(diǎn)主要體現(xiàn)在如下兩點(diǎn):

        1) 時(shí)序性。即對(duì)電力的預(yù)測(cè)不僅要考慮環(huán)境、電費(fèi)、政府政策等外部特征因素,還需要考慮用戶自身的歷史用電曲線,根據(jù)歷史曲線體現(xiàn)出的用電規(guī)律或者用電模式,來(lái)預(yù)測(cè)用戶接下來(lái)用電曲線的變化。

        2) 層級(jí)性。用戶的用電量、用電習(xí)慣與用戶的地理區(qū)域分布具有很強(qiáng)的相關(guān)性,例如北方用戶的用電量大多集中在冬季(取暖用電),而南方用戶的用戶量大多集中在夏季(防暑用電)。因此,不同地理區(qū)域的用戶可以根據(jù)其所在街道、城鄉(xiāng)、縣市、省份等層次進(jìn)行逐層歸類與劃分。因此,在層級(jí)預(yù)測(cè)中,我們很關(guān)心同一層級(jí)的用戶之間、父子層級(jí)的用戶之間的用電模式是否存在一些隱含的關(guān)系,這種隱含關(guān)系能夠輔助我們更好地預(yù)測(cè)用電模式。此外,相較于直接對(duì)電力時(shí)序數(shù)據(jù)進(jìn)行預(yù)測(cè),層級(jí)預(yù)測(cè)具有更加良好的可解釋性,并且能夠在一定程度上降低模型的計(jì)算量。

        聚合一致性是層級(jí)預(yù)測(cè)中的關(guān)鍵,即分解后的若干時(shí)間序列的加和應(yīng)當(dāng)同高層次聚合后的時(shí)間序列相等。由于在整個(gè)時(shí)間序列的獨(dú)立預(yù)測(cè)中很難保證聚合一致性,因此目前在工業(yè)界中往往采用“自底向上”的方法。然而,當(dāng)分解后的數(shù)據(jù)信噪比較低時(shí),現(xiàn)有的方法往往預(yù)測(cè)精度較差[4]。近年來(lái),各種基于最優(yōu)調(diào)節(jié)的方法逐漸成為了主流,例如Hyndman等[5]提出了一種基于最小二乘協(xié)調(diào)法處理層級(jí)預(yù)測(cè)問(wèn)題的方法。然而,由于調(diào)節(jié)的副作用可能會(huì)擴(kuò)大預(yù)測(cè)誤差,因此通常以犧牲預(yù)測(cè)精度為代價(jià)來(lái)實(shí)現(xiàn)聚合一致性。

        為了避免聚合一致性帶來(lái)的預(yù)測(cè)精度降低,本文提出了一種全新的電力需求層級(jí)預(yù)測(cè)方法。該方法不直接對(duì)地理層次結(jié)構(gòu)進(jìn)行處理,而是對(duì)用電模式檢測(cè)進(jìn)行時(shí)間序列的聚類分析。由于個(gè)人家庭用電往往在一定程度上隨時(shí)間穩(wěn)定增長(zhǎng),因此本文基于聚類結(jié)果,構(gòu)建了一個(gè)新的基于用電模式的時(shí)間序列層級(jí)結(jié)構(gòu)。通過(guò)將具有相似模式的時(shí)間序列組合在一起,可以顯著提高聚合時(shí)間序列的信噪比,從而提高聚合時(shí)間序列的預(yù)測(cè)精度。在此基礎(chǔ)之上提出了一種新的優(yōu)化調(diào)節(jié)方法,以提高分解時(shí)間序列的預(yù)測(cè)能力。最后采用“自底向上”的方法對(duì)分解后的預(yù)測(cè)結(jié)果進(jìn)行匯總,形成各種高層級(jí)的聚合預(yù)測(cè),從而實(shí)現(xiàn)了地理層級(jí)結(jié)構(gòu)的聚合一致性。

        2 算法設(shè)計(jì)

        2.1 用電模式分析

        首先探討一下智能電表數(shù)據(jù)的用電模式。用電模式是利用ST-DBSCAN[6]聚類算法從個(gè)體家庭時(shí)間序列的數(shù)量中提取出來(lái)的。ST-DBSCAN聚類算法是一種基于DBSCAN算法的改進(jìn),本質(zhì)上也是一種基于密度的聚類算法。ST-DBSCAN擁有傳統(tǒng)的DBSCAN具有的優(yōu)勢(shì):基于密度的聚類,即給定密度閾值,如果兩個(gè)點(diǎn)的距離小于這個(gè)閾值,那么將其劃分至同一個(gè)類別。相較于K-means算法,ST-DBSCAN不需要提前定義好類別數(shù)K,其能夠自動(dòng)地學(xué)習(xí)出最適合的類別數(shù)。此外,ST-DBSCAN相較于DBSCAN,其在時(shí)空數(shù)據(jù)上的表現(xiàn)更加優(yōu)異,與用電時(shí)序數(shù)據(jù)的地理區(qū)域分布和時(shí)序特征恰好吻合。

        以圖2為例,其展示了將5個(gè)時(shí)間序列進(jìn)行聚類,并抽取出其用電模式的過(guò)程。首先對(duì)于這5個(gè)用電時(shí)間序列,采用ST-DBSCAN將其劃分為兩個(gè)類別,然后通過(guò)時(shí)間序列的聚合算法,將每個(gè)聚類中時(shí)間序列的共性提取出來(lái),從而得到能顯著代表聚類中所有時(shí)間序列的整體趨勢(shì)共性的用電模式。

        圖2 基于ST-DBSCAN聚類的用電模式分析過(guò)程

        2.2 層級(jí)結(jié)構(gòu)構(gòu)建

        不同層級(jí)的用電消費(fèi)水平大體上是一致的。如果聚合時(shí)間序列的預(yù)測(cè)是準(zhǔn)確的,那么在聚合約束和調(diào)節(jié)的情況下,單個(gè)時(shí)間序列的平均預(yù)測(cè)精度就有可能得到提升。此外,用電時(shí)間序列的模式要比基于地理層級(jí)結(jié)構(gòu)的聚合時(shí)間序列更為規(guī)則。因此,基于用電模式的預(yù)測(cè)誤差應(yīng)當(dāng)要小于基于地理區(qū)域聚合時(shí)間序列的預(yù)測(cè)誤差。

        基于這個(gè)想法,本文構(gòu)建了一個(gè)基于用電模式的層級(jí)結(jié)構(gòu),如圖3所示。這種層級(jí)結(jié)構(gòu)由高層的用電模式和低層的單獨(dú)的時(shí)間序列構(gòu)成。最左列的用電模式向右衍生出三個(gè)子用電模式,如中間列所示。這三個(gè)用電模式又分別向右衍生出它們各自的用電模式??梢钥闯?,屬于同一個(gè)父節(jié)點(diǎn)的用電時(shí)間序列曲線,其用電的變化規(guī)律十分相似,只是在變化幅度上有略微的差異。

        圖3 基于用電模式聚類的層級(jí)結(jié)構(gòu)

        這種層級(jí)結(jié)構(gòu)相較于傳統(tǒng)的用電預(yù)測(cè)方法,其優(yōu)勢(shì)主要體現(xiàn)在它充分利用了地理區(qū)域相近的用戶具有相似的用電模式這一先驗(yàn)特征。并且在理想情況下,層級(jí)結(jié)構(gòu)的深度是Log級(jí)別的,其運(yùn)算復(fù)雜度很小。此外,層級(jí)結(jié)構(gòu)中的每一層有對(duì)應(yīng)的具體含義,例如頂層代表國(guó)家、底層代表街道,這樣,模型的預(yù)測(cè)結(jié)果就具有更好的可解釋性。

        2.3 基于聚合一致性的層級(jí)預(yù)測(cè)

        (1)

        本文目標(biāo)是通過(guò)最小化平方預(yù)測(cè)誤差的期望值來(lái)獲得調(diào)節(jié)后的底層預(yù)測(cè):

        (2)

        式(2)中的最優(yōu)解可以通過(guò)最佳線性無(wú)偏調(diào)節(jié)預(yù)測(cè)得到:

        (3)

        式中:Uh表示h時(shí)間段內(nèi)的預(yù)測(cè)誤差的協(xié)方差矩陣。

        根據(jù)廣義最小二乘法(GLS)[8],式(3)中的底層預(yù)測(cè)結(jié)果也可以通過(guò)回歸模型來(lái)得到:

        (4)

        (5)

        通過(guò)這種方式,將問(wèn)題建模為一個(gè)關(guān)于預(yù)測(cè)誤差的最優(yōu)GLS回歸問(wèn)題,可以使用梯度下降法[9]求解。

        為了使得優(yōu)化更加快速且魯棒,本文使用了Adam算法[10]取代傳統(tǒng)的隨機(jī)梯度下降優(yōu)化算法(Stochastic Gradient Descent)進(jìn)行優(yōu)化。相對(duì)于傳統(tǒng)的隨機(jī)梯度下降法,Adam算法的優(yōu)勢(shì)主要體現(xiàn)在如下兩個(gè)方面:1) Adam算法引入了動(dòng)量(Momentum)機(jī)制,通過(guò)指數(shù)加權(quán)平均(Exponentially Weighted Averages)方法,在每次對(duì)一個(gè)Batch的數(shù)據(jù)做梯度下降時(shí),通過(guò)一個(gè)超參數(shù)來(lái)控制每次的梯度一部分來(lái)自最新計(jì)算的值,另一部分來(lái)自歷史保留的值,從而使得最終得到的梯度為過(guò)去幾個(gè)Batch的平均值。歷史Batch梯度的平均值等效為動(dòng)量,可以加速網(wǎng)絡(luò)向過(guò)去累積更新量最大的方向進(jìn)行更新,顯著地加快模型的收斂速度。2) Adam算法引入了RMSprop機(jī)制,在每個(gè)Batch計(jì)算梯度時(shí),也利用了指數(shù)平均加權(quán)方法,對(duì)梯度的平方根倒數(shù)進(jìn)行累加平均。達(dá)到的效果是:每個(gè)Batch計(jì)算出的梯度能夠根據(jù)歷史梯度的震蕩情況,自動(dòng)消解來(lái)回震蕩幅度大的方法,避免梯度在無(wú)意義的方向上來(lái)回?cái)[動(dòng),從而加速收斂并增加了訓(xùn)練的魯棒性。

        此外,我們?cè)谟?xùn)練的過(guò)程中也引入了一些其他防止模型過(guò)擬合的機(jī)制,例如L1正則化、BatchNorm、Dropout等。BatchNorm即在Adam算法每次取一個(gè)Batch的數(shù)據(jù)時(shí),將數(shù)據(jù)在一個(gè)Batch內(nèi)進(jìn)行歸一化,使得特征的均值為0,并且起到了一定的數(shù)據(jù)增強(qiáng)作用(每個(gè)樣本在不同的Batch中的特征值均不同)。Dropout則是在每個(gè)Batch訓(xùn)練的過(guò)程中,隨機(jī)地丟棄若干輸入數(shù)據(jù)的特征,通過(guò)加入一定噪聲增加模型的魯棒性。本文將Dropout的概率設(shè)為0.5。

        2.4 L1正則化

        正則化屬于結(jié)構(gòu)風(fēng)險(xiǎn)最小化策略,能夠有效地防止參數(shù)過(guò)大所導(dǎo)致的過(guò)擬合。L1正則化是一種常見(jiàn)的正則化技術(shù),也稱為L(zhǎng)1范數(shù),其等于模型權(quán)重的絕對(duì)值之和。L1正則化具有以下特點(diǎn):

        1) L1正則化可以防止模型的權(quán)重過(guò)大,起到防止過(guò)擬合的作用(但其正則化強(qiáng)度略低于L2正則化)。

        2) L1正則化可以使模型得到一組相對(duì)稀疏的權(quán)值,也就是當(dāng)模型收斂后,權(quán)值矩陣中有很多值接近0。

        因此,我們?cè)谑?5)所示的優(yōu)化目標(biāo)中加入了L1正則項(xiàng)[11]:

        (6)

        圖4 理想調(diào)節(jié)下用電絕對(duì)值與用電時(shí)間序列到聚類中心距離的分布對(duì)比

        用電時(shí)間序列與其用電模式越相似,也就意味著這個(gè)用電時(shí)間序列是越穩(wěn)定和正規(guī)的,即當(dāng)時(shí)間序列越接近聚類中心時(shí),其預(yù)測(cè)結(jié)果越準(zhǔn)確,因此需要的調(diào)整也就越小。為了確定如何達(dá)到最優(yōu)的調(diào)節(jié),本文引入了正則化項(xiàng)來(lái)懲罰序列調(diào)整分布與其對(duì)應(yīng)模式隸屬度的相關(guān)性。當(dāng)用電時(shí)間序列接近聚類中心時(shí),通過(guò)求解式(6)得到的相應(yīng)的調(diào)整值將較小。

        3 實(shí) 驗(yàn)

        3.1 實(shí)驗(yàn)數(shù)據(jù)與設(shè)置

        在本文實(shí)驗(yàn)部分,采用了來(lái)自能源需求研究項(xiàng)目的公開(kāi)電力數(shù)據(jù)集:EDRP(Early Smart Meter Trials)[12]。該數(shù)據(jù)集是關(guān)于個(gè)人家庭用電消耗的真實(shí)數(shù)據(jù)集,包含了2 501個(gè)時(shí)間序列,時(shí)間序列的采樣間隔為30分鐘。

        在實(shí)驗(yàn)中,利用數(shù)據(jù)集上的歷史消耗觀測(cè)值,來(lái)計(jì)算提前一步滾動(dòng)預(yù)測(cè)[13]。對(duì)于EDRP數(shù)據(jù)集,重復(fù)了48個(gè)預(yù)測(cè)任務(wù),從2009年5月9日至2009年5月20日,預(yù)測(cè)全天的電力需求。此外,使用平均絕對(duì)百分比誤差(Mean Absolute Percentage Error,MAPE)和均方根誤差(Root Mean Square Error,RMSE)來(lái)測(cè)量預(yù)測(cè)誤差,它們分別表示家庭用電量的相對(duì)預(yù)測(cè)誤差和平均預(yù)測(cè)誤差。

        在對(duì)比實(shí)驗(yàn)中,將本文方法與目前常用的模型進(jìn)行比較,其中包括BASE、WLS[14]和MinT-Reg[15]。同時(shí),也對(duì)加或不加L1正則化項(xiàng)的本文方法分別進(jìn)行了實(shí)驗(yàn),L1正則化參數(shù)λ的取值為104。

        3.2 實(shí)驗(yàn)結(jié)果分析

        在EDRP數(shù)據(jù)集上的每個(gè)層級(jí)的預(yù)測(cè)精度和平均統(tǒng)計(jì)結(jié)果分別如表1和表2所示。

        表1 不同方法的MAPE比較

        表2 不同方法的RMSE比較

        可以得出,高層的預(yù)測(cè)結(jié)果的誤差往往比低層的預(yù)測(cè)誤差更小。這是因?yàn)楦邔拥念A(yù)測(cè)由于聚合而具有更高的信噪比。也可以觀察到,BASE模型在一些高的層次的預(yù)測(cè)誤差最小,但是其不能夠保證地理聚合的約束。相比之下,在大多數(shù)情況下,本文方法不僅滿足了地理聚合的約束條件,而且實(shí)現(xiàn)了比BASE模型更高的預(yù)測(cè)精度。

        此外,在EDRP數(shù)據(jù)集上帶正則化項(xiàng)的本文方法取得了最高的預(yù)測(cè)精度,并且?guī)1正則化項(xiàng)的方法比不帶L1正則化項(xiàng)的方法展示出了更明顯的優(yōu)勢(shì)。這是因?yàn)長(zhǎng)1正則化項(xiàng)遵循結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則,防止模型陷入過(guò)擬合從而影響精度??偟膩?lái)說(shuō),就MAPE和RMSE這兩個(gè)指標(biāo)而言,帶L1正則化項(xiàng)的本文模型在公開(kāi)的真實(shí)場(chǎng)景數(shù)據(jù)集上比對(duì)比模型具有更好的預(yù)測(cè)能力以及更強(qiáng)的魯棒性。

        4 結(jié) 語(yǔ)

        聚合一致性是層級(jí)時(shí)間序列預(yù)測(cè)的關(guān)鍵點(diǎn)之一。在以往的大多數(shù)工作中,預(yù)測(cè)過(guò)程通常受到地理聚集約束的影響,從而造成預(yù)測(cè)精度的損失。在本文的工作中,證明了靈活使用聚集約束可以帶來(lái)用電需求預(yù)測(cè)的改進(jìn)。為了解決預(yù)測(cè)精度損失的問(wèn)題,本文通過(guò)用電模式分析建立了一個(gè)新的數(shù)據(jù)層級(jí)結(jié)構(gòu)。然后基于新的層級(jí)結(jié)構(gòu),提出了L1正則化回歸方法,并使用Adam算法進(jìn)行快速訓(xùn)練,在現(xiàn)實(shí)的用電場(chǎng)景中,顯著地提高了聚合和分解時(shí)間序列的預(yù)測(cè)精度。未來(lái)將在電力需求預(yù)測(cè)及其相關(guān)的其他應(yīng)用領(lǐng)域,探索新的層次構(gòu)建方法和具有聚合一致性的優(yōu)化預(yù)測(cè)方法。

        猜你喜歡
        方法模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        學(xué)習(xí)方法
        可能是方法不對(duì)
        3D打印中的模型分割與打包
        用對(duì)方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        賺錢方法
        久久久久九九精品影院| 精品人妻一区二区蜜臀av| 国产精品高清视亚洲一区二区| 性欧美丰满熟妇xxxx性久久久| 欧美黑吊大战白妞| 国产美女在线精品亚洲二区| 五月天亚洲av优女天堂| 亚洲av无一区二区三区| 国色天香精品一卡2卡3卡4| 日韩AV不卡一区二区三区无码| 久久久9色精品国产一区二区三区| 国产一区二区av在线免费观看| 欧美成人精品a∨在线观看| 中文字幕亚洲乱码熟女在线萌芽| 精品国产1区2区3区AV| 国产激情一区二区三区成人| 狂野欧美性猛xxxx乱大交| 爽爽午夜影视窝窝看片| 2022精品久久久久久中文字幕| 国产精品亚洲综合久久系列| 亚洲欧美国产精品久久| 日日摸夜夜添狠狠添欧美| 国产av一区二区凹凸精品| 男女做羞羞事的视频网站| 女女互揉吃奶揉到高潮视频| 四虎影视亚洲精品| 一区二区中文字幕蜜桃| 曰韩内射六十七十老熟女影视| 人禽伦免费交视频播放| 国产一起色一起爱| 午夜亚洲精品视频在线| 一二三四日本中文在线| 午夜高清福利| 亚洲国产av精品一区二| 伊人久久大香线蕉av波多野结衣| 蜜臀久久99精品久久久久久小说| 日韩欧美精品有码在线观看| 黄色影院不卡一区二区| 亚洲中文字幕无码一久久区 | 无套无码孕妇啪啪| 俺来也俺去啦最新在线|