亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于FFT,DC-HC及LSTM的短期負荷預(yù)測方法

        2022-04-12 04:18:36魏震波
        智慧電力 2022年3期

        魏震波,余 雷

        (四川大學(xué)電氣信息學(xué)院,四川成都 610065)

        0 引言

        短期電力負荷預(yù)測是電力系統(tǒng)安排發(fā)電計劃、經(jīng)濟調(diào)度電網(wǎng)、確定備用容量的基礎(chǔ),較高的預(yù)測精度對電網(wǎng)的安全可靠運行有著重要作用[1-3]。隨著智能電表等監(jiān)測設(shè)備的大量安裝,基于大量數(shù)據(jù)分析進行短期負荷預(yù)測成為可能[4-5]。

        多年來,為解決負荷預(yù)測中電力負荷序列因隨機性、非平穩(wěn)、非線性所帶來的困擾,許多學(xué)者一直致力于探索更優(yōu)的短期負荷預(yù)測方法[6-8]。有學(xué)者基于隨機森林算法預(yù)測負荷[9],有學(xué)者基于誤差補償預(yù)測負荷[10],也有學(xué)者提出考慮利用負荷周期性特征即頻率特性,先將電力負荷進行分類后再做預(yù)測,理論上可以提高總負荷預(yù)測精度。如文獻[11-12]分別以變分模態(tài)分解和經(jīng)驗?zāi)B(tài)分解對總負荷進行信號分解,再對各信號分量進行負荷預(yù)測,有效提高了預(yù)測精度,但是模態(tài)分解模糊了單個樣本概念,其運算過程亦可能造成樣本特征的丟失。為保持樣本獨立性,可采用聚類算法對所有樣本進行聚類[13]。

        目前,主流聚類算法大致分為原型聚類、密度聚類、層次聚類3 類。其中,原型聚類是通過“原型”即樣本空間中具有代表性的點進行聚類,Kmeans 算法是其典型代表,它假設(shè)同簇樣本的分布空間為圓形,極大地限制了算法的合理分類,即使是更加優(yōu)越的高斯混合聚類,依然假設(shè)同簇樣本分布于橢圓空間中。并且,Kmeans 算法中初始簇心對最終結(jié)果會產(chǎn)生較大影響,亦無法識別噪音[14],最終的聚類數(shù)目往往也需要人為選定[15]。密度聚類,其代表是DBSCAN 算法,它基于1 組鄰域參數(shù)(ε,MinPts)來進行聚類,其中ε代表半徑閾值,MinPts代表半徑范圍內(nèi)需求的樣本數(shù)。該算法雖然不需要手動設(shè)置聚類數(shù),能自動識別噪音,其簇也不受樣本分布形狀影響[16],但不同簇密度差異較大時性能受較大影響。此外,由于涉及2 個超參數(shù),當(dāng)數(shù)據(jù)規(guī)模較大時,調(diào)參會變得較為困難[17]。層次聚類的代表是自底向上的AGNES 算法,它不像原型聚類依賴于“原型”,不需要調(diào)參,但需要人為設(shè)定聚類數(shù),無法識別噪音,而且聚類結(jié)果受簇間距離衡量方式影響較大[18]。因此,若將密度聚類與層次聚類算法相結(jié)合,則密度層次聚類算法(Density-based Clustering-Hierarchical Clustering,DC-HC)可自適應(yīng)聚類數(shù)、甄別噪音、同簇樣本不受樣本分布形狀限制,并且具備較高自適應(yīng)度,多數(shù)情況下不需要手動調(diào)參。

        綜上成果與問題,本文考慮采用快速傅里葉變換(Fast Fourier Transformation,F(xiàn)FT)計算得到樣本期望頻率,并將其作為聚類特征量,采用DC-HC 算法進行聚類,實現(xiàn)對原始數(shù)據(jù)的預(yù)處理;然后,將處理后的各類樣本按類疊加,分別使用長短時記憶(Long Short Term Memory,LSTM)神經(jīng)網(wǎng)絡(luò)進行負荷預(yù)測,將各分量預(yù)測結(jié)果再次疊加,得到最終負荷預(yù)測值。通過實際算例驗證了本文思路及方法的合理性與有效性。

        1 基于FFT的樣本期望頻率

        1.1 樣本頻率模型

        對有限長離散信號z(n),n=0,1,...,N-1,采用式(1)進行變換,即:

        式中:Z(k)為z(n)的離散傅里葉變換,k=0,1,...,N-1;W為單位向量。

        FFT 將z(n)按照n的奇偶性分解為偶數(shù)序列z1(n1)與奇數(shù)序列z2(n2),其長度都是N/2,即:

        式中:n1為偶數(shù),n2為奇數(shù),且n1,n2?n。

        則有:

        式中:Z1(k)和Z2(k)分別為z1(n1)和z2(n2)的離散傅里葉變換。

        1.2 樣本期望頻率

        總負荷由所有樣本按時序疊加得到,對任一樣本,由采樣定理可知FFT 能求出最大頻率為采樣頻率一半的振幅頻譜,記某樣本的s個對應(yīng)頻率值為w1,w2,…,ws,振幅為A1,A2,…,As,取σ1=1,2,...,s,σ2=1,2,...,s,提出單個樣本的期望頻率w計算方法為:

        2 DC-HC算法

        2.1 算法原理

        首先計算出距離矩陣D,其第i行第j列元素di,j代表第i個樣本與第j個樣本的歐式距離。若數(shù)據(jù)集共有m個樣本,則距離矩陣D為m×m的方陣,其后所有運算均圍繞D展開。

        簇與簇的合并遵循以下3 個原則:

        1)除開自由點,所有簇都能通過內(nèi)部距離運算確定請求與某外部點合簇或是拒絕與該點合簇。

        2)規(guī)定小于等于5 個點的簇不能拒絕來自外部的合簇請求。

        3)大于5 個點的簇可以拒絕來自外部的合簇請求。

        以S表示樣本點,C表示簇。對非自由點Si,其所在簇記為Cp。要考察簇Cp是否請求與其簇外點Sj合并,則需計算閾值T,若di,j≤T,則簇Cp請求與Sj所在簇Cq合并,反之則拒絕,閾值計算方法分為以下兩種情況,分別用T1和T2表示:

        (1)若Si所在簇Cp為初始簇,記Sl為與Si同簇的另一樣本,則:

        式中:y為對數(shù)幾率函數(shù),如式(6)所示:

        式中:x為現(xiàn)有簇數(shù)與初始簇數(shù)的比值,x∈(0,1]。

        (2)若Si所在簇Cp樣本數(shù)目大于2,則通過D矩陣找到簇Cp內(nèi)與樣本Si距離不大于di,j的所有樣本,加上樣本Si本身,構(gòu)成判定團體Gi。進一步在此定義“核心距離”:若判定團體Gi內(nèi)共有a個樣本,由于每2 個樣本間有1 個距離,則共有a(a-1)/2 個距離值,找到其中a-1 個距離值使a個樣本在拓撲結(jié)構(gòu)上能夠完全相連,并保證a-1 個距離值總和最小,則a-1 個距離值叫做判定團體Gi的核心距離,記為d1,d2,…da-1;判定團體的核心距離可以通過最小生成樹算法求得[19]。進一步有:

        式中:λ=1,2,...,a-1;dλ為樣本距離;h1,h2,h3,h4為修正系數(shù),使所有數(shù)值處于一個合適區(qū)間。

        希望T2的判定計算隨簇數(shù)量的減少越來越嚴格,并且其減少速率的變化率也越來越大,即T2相對簇數(shù)的一階導(dǎo)數(shù)為正,二階導(dǎo)數(shù)為負,并且希望在簇數(shù)最多和最少兩種極端情況下T2差別不應(yīng)過大,這部分運算由系數(shù)h2完成,即:

        其中,h2原型函數(shù)為式(6)所表示的對數(shù)幾率函數(shù),式(9)、式(10)分別為其一階導(dǎo)數(shù)y′和二階導(dǎo)數(shù)y″,即:

        觀察式(6)、式(9)、式(10)可知,對數(shù)幾率函數(shù)基本滿足系數(shù)h2控制需求,進一步對對數(shù)幾率函數(shù)分別沿自變量和因變量方向進行圖像的縮放和平移,設(shè):

        式中:g,b,r,f為控制圖像變換的變量。

        由式(9)、式(10)可知,對數(shù)幾率函數(shù)本身就滿足系數(shù)h2對一階導(dǎo)數(shù)和二階導(dǎo)數(shù)的需求,則圖像不需要左右平移,即g=0,并且由于圖像未進行左右平移,b,r,f的值并不影響系數(shù)h2對其低階導(dǎo)數(shù)的需求;對于類似式(6)的函數(shù),一般認為當(dāng)函數(shù)值到達最大值的90%后增長率變緩,為保證系數(shù)變化具有差異性并考慮自變量范圍x∈(0,1],則有:

        求解式(12)得b=ln19≈2.944 4;為避免簇數(shù)最多和最少兩種極端情況下系數(shù)差異過大,考慮如式(13)的約束:

        求解式(13)得0.263 2f-0.684 2r≥0,取r=1,則可取f=2.599 5。

        系數(shù)h3與小團體Gi中樣本個數(shù)a成負相關(guān),即a越大,樣本Sj與小團體Gi相對而言越遠,T2越小。h3計算如式(14):

        參考以標(biāo)準(zhǔn)差判定離群點的方式,取ζ=1,2,...,a-1,則系數(shù)h4為Gi的核心距離標(biāo)準(zhǔn)差為:

        式中:dζ為樣本距離。

        若滿足條件di,j≤t,則簇Cp請求與簇Cq合并,受約束于2.1 節(jié)合簇原則,對稱性地計算簇Cq(Sj)與點Si之間的閾值,并進一步判定簇Cq是否請求與簇Cp合并。

        2.2 算法流程

        DC-HC 算法流程如下:

        1)根據(jù)輸入樣本計算得到距離矩陣D。

        2)由D矩陣找到所有互為彼此最近樣本的2個樣本構(gòu)成初始簇,并在D矩陣中將所有簇內(nèi)距離值位置置為非數(shù)值。

        3)找到D矩陣中的當(dāng)前最小數(shù)值di,j,依照2.1節(jié)方法計算閾值并判定是否合簇,并將di,j和dj,i位置置為非數(shù)值。若不合簇則跳到步驟5)。

        4)將新合簇形成的簇內(nèi)距離值在D矩陣中置為非數(shù)值。

        5)若D矩陣不全為非數(shù)值,則返回步驟3)。

        2.3 算法效果測試

        選取費舍爾鳶尾花數(shù)據(jù)集(iris)、Matlab 內(nèi)置聚類測試數(shù)據(jù)集(kmeansdata)、三角圓數(shù)據(jù)集(data1)、雙月數(shù)據(jù)集(data2)4 個標(biāo)準(zhǔn)數(shù)據(jù)集,分別采用Kmeans,AGNES,DBSCAN,DC-HC 4 種聚類方法對4 個數(shù)據(jù)集進行聚類。

        層次聚類算法AGNES 選用豪斯多夫距離衡量Cp和Cq2 簇間距離distH(Cp,Cq)[14],即:

        其中,

        式中:disth(Cp,Cq)為從Cp到Cq的單方向豪斯多夫距離。

        使用4 組數(shù)據(jù)集和4 種聚類方法,可得到16組聚類結(jié)果,分別采用以下6 種聚類內(nèi)部評估指標(biāo)進行測評:(1)DB 指數(shù)[14];(2)Dunn 指數(shù)[14];(3)輪廓指數(shù)[14];(4)CH 指數(shù)[20];(5)VCV 指數(shù)[21];(6)MST 指數(shù)[21]。

        數(shù)據(jù)集data1 和data2 在4 種聚類算法下的分類情況如圖1 所示。其中,橫、縱坐標(biāo)代表相對位置,無單位,下文同。

        圖1 4種聚類算法對data1和data2的分類直觀圖Fig.1 Visual distribution maps of data1 and data2 clustered by fourclustering algorithms

        以圖1(e),(f)的分類結(jié)果作為外部評估標(biāo)準(zhǔn)數(shù)據(jù),對4 種聚類算法的聚類效果分別采用3 種聚類外部評估指標(biāo)進行測評:(1)Jaccard 系數(shù)[14];(2)FM指數(shù)[14];(3)Rand 指數(shù)[14]。

        參照各指標(biāo)在不同數(shù)據(jù)集下的不同聚類算法最優(yōu)得票進行統(tǒng)計。若不同算法對同一數(shù)據(jù)集有相同分類方案且在某評估指數(shù)下最優(yōu),則均得票,統(tǒng)計結(jié)果如表1 所示。

        表1 各聚類算法最優(yōu)得票統(tǒng)計Table1 Optimal voting statistics of clustering algorithms

        綜合考慮表1 結(jié)果和各算法特性可知:(1)就經(jīng)驗預(yù)期而言,AGNES 算法與Kmeans 算法表現(xiàn)相近,但對比圖1(a)和(c)評估結(jié)果,AGNES 算法在數(shù)據(jù)集data1 下的表現(xiàn)遠不如Kmeans 算法。若排除data1,采用AGNES,Kmeans 兩種算法對剩余3個數(shù)據(jù)集應(yīng)用9 個指標(biāo)進行最優(yōu)得票數(shù)統(tǒng)計,并經(jīng)計算可知Kmeans 算法得11 票,AGNES 算法得10票,與預(yù)期相符,說明豪斯多夫距離不適用于數(shù)據(jù)集data1,進一步說明簇間距離衡量方式將會對類似AGNES 的層次聚類算法產(chǎn)生決定性影響;(2)DCHC 算法由于繼承了密度聚類不受樣本分布形狀的特性,因此其在data1 和data2 兩個特定數(shù)據(jù)集下表現(xiàn)略劣于DBSCAN 算法,但遠優(yōu)于另外2 種算法。由此可以預(yù)見,當(dāng)數(shù)據(jù)呈現(xiàn)高維特性時,樣本點在超空間中的分布形狀會更加趨向于非圓形化,這時DC-HC 算法和DBSCAN 算法將更具優(yōu)越性。在最終得票統(tǒng)計上,DBSCAN 算法略優(yōu)于DC-HC 算法,但DBSCAN 算法存在二維超參數(shù),當(dāng)數(shù)據(jù)量較大時調(diào)參困難;并且DBSCAN 算法無法應(yīng)對不同簇密度差異較大的聚類場景,而密度差異往往在高維數(shù)據(jù)下被擴大。因此面對大量高維數(shù)據(jù)時,DC-HC 算法適用性更強。

        使用data1 和data2 兩個可視數(shù)據(jù)集隨機添加15 個樣本點對DC-HC 算法進行抗噪性測試,噪音點均用黑點表示,測試結(jié)果如圖2 所示。

        圖2 DC-HC算法抗噪性測試Fig.2 Noise resistance testing of DC-HC algorithm

        對比圖2 與圖1(e),(f)可知,藍色方框選中的點為新添加的樣本點,但DC-HC 算法并未將其判定為噪音點,而距離更遠的點才被判定為噪音,可見DC-HC 算法具備良好的抗噪能力。

        3 LSTM網(wǎng)絡(luò)

        循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)被廣泛用于各類時序問題,然而在誤差沿時間反向傳播的過程中,梯度進行多次疊加將會導(dǎo)致梯度消失或梯度爆炸,因此RNN 很難處理長時序問題。進而產(chǎn)生一種改進的循環(huán)網(wǎng)絡(luò):LSTM 網(wǎng)絡(luò)[22-24]。

        為解決梯度難以沿時間長距離反向傳播的問題,LSTM 新增單元狀態(tài)c并引入“門”的概念。其輸入包括μ,β,c3 類,輸出包括β,c2 類。其中μt為t時刻輸入,βt為t時刻網(wǎng)絡(luò)輸出,如圖3 所示。

        圖3 LSTM時序邏輯結(jié)構(gòu)Fig.3 Structure of LSTM sequential logic

        4 算例分析

        4.1 數(shù)據(jù)選取

        本文以愛爾蘭可持續(xù)能源管理局(Sustainable Energy Authority of Ireland,SEAI)于2011 年5 月發(fā)布的愛爾蘭智能電表實測用戶用電數(shù)據(jù)作為實驗數(shù)據(jù)集[25]。

        4.2 數(shù)據(jù)預(yù)處理

        采用FFT 計算每個樣本的振幅頻譜,根據(jù)式(4)計算對應(yīng)期望頻率;再以期望頻率作為特征量使用DC-HC 算法對愛爾蘭電力負荷數(shù)據(jù)集進行聚類,共有10 個樣本被DC-HC 算法歸類為噪音。

        4.3 負荷預(yù)測

        4.3.1 LSTM負荷預(yù)測

        將各類負荷(噪音樣本算作噪音類負荷)按類疊加,以1 h 負荷量為1 個時間節(jié)點,選取1 到120時間節(jié)點劃分為訓(xùn)練集,121 到144 時間節(jié)點作為測試集,使用LSTM 神經(jīng)網(wǎng)絡(luò)進行負荷預(yù)測,預(yù)測結(jié)果如圖4 和圖5 所示。由圖4 可知,6 類實際負荷中的大部分負荷曲線與預(yù)測曲線具有較高的一致性,預(yù)測效果較好。噪音類負荷曲線規(guī)律性較弱,所以預(yù)測效果并不理想,但由于噪音類樣本較少,噪音類總負荷量相對于相同時間內(nèi)負荷總量很少,因此噪音類負荷預(yù)測對最終的總負荷預(yù)測影響很小。

        圖4 6類負荷實際曲線及預(yù)測曲線Fig.4 Actual and predictive curves of six kinds of loads

        圖5 噪音類負荷實際曲線及預(yù)測曲線Fig.5 Actual and predictive curves of noise loads

        使用本文所提FFT-DC-HC-LSTM 算法,將121—144 共24 個節(jié)點所有預(yù)測結(jié)果進行疊加后,得到圖6 曲線。

        圖6 24個節(jié)點總負荷曲線及預(yù)測曲線Fig.6 Total load and forecating load of 24 nodes

        由圖6 可知,采用本文算法進行負荷預(yù)測的結(jié)果與實際負荷的運行規(guī)律基本一致。

        4.3.2 聚類算法對LSTM負荷預(yù)測影響

        為評估各方案預(yù)測精度,進一步采用均方根誤差(Root Mean Square Error,RMSE)和平均絕對百分誤差(Mean Absolute Percentage Error,MAPE)評估預(yù)測效果,數(shù)學(xué)表達為:

        式中:為第θ個時段的實際負荷值;Pθ為第θ個時段的預(yù)測負荷值;υ為預(yù)測時間內(nèi)的節(jié)點數(shù)。

        將4.3.1 節(jié)預(yù)測方案與以下4 種方案進行對比:(1)使用Kmeans 聚類負荷數(shù)據(jù)后進行預(yù)測;(2)使用AGNES 聚類負荷數(shù)據(jù)后進行預(yù)測;(3)使用DBSCAN 聚類負荷數(shù)據(jù)后進行預(yù)測;(4)不使用聚類方法預(yù)處理負荷數(shù)據(jù),直接進行負荷預(yù)測。對比結(jié)果如表2 所示。

        表2 預(yù)測方案誤差值對比Table 2 Comparison of error values between predictive schemes

        由表2 數(shù)據(jù)可知:(1)對原始電力負荷數(shù)據(jù)使用聚類算法進行預(yù)處理后再按類分別進行負荷預(yù)測,可有效降低預(yù)測總誤差;(2)在以負荷預(yù)測為目的負荷數(shù)據(jù)聚類預(yù)處理過程中,DC-HC 算法表現(xiàn)優(yōu)于其它算法。

        4.3.3 不同預(yù)測算法比較

        在均使用DC-HC 算法進行數(shù)據(jù)預(yù)處理的前提下,采用LSTM、門控循環(huán)單元(Gated Recurrent Unit,GRU)、非線性自回 歸(Nonlinear Autoregressive,NAR)、RNN、多層感知機(Multilayer Perceptron,MLP)、支持向量回歸(Support Vector Regression,SVR)及一種集成決策樹(AdaBoost-Decision Tree,AB-DT)作為預(yù)測算法進行預(yù)測誤差及穩(wěn)定性對比,對比結(jié)果如表3 所示:(1)預(yù)測誤差,每個預(yù)測算法均獨立訓(xùn)練20 批次并取多次預(yù)測的平均值作為最終結(jié)果進行誤差計算;(2)穩(wěn)定性,單個預(yù)測算法每批次訓(xùn)練的最終預(yù)測結(jié)果均計算誤差,并以此計算所有誤差值的標(biāo)準(zhǔn)差。

        由表3 數(shù)據(jù)可知:(1)MLP,SVR 和AB-DT 算法雖然輸出穩(wěn)定,但由于并非時序模型,因此在預(yù)測精度上并不理想;(2)綜合預(yù)測精度和算法穩(wěn)定性,在負荷預(yù)測問題中,LSTM 算法應(yīng)被優(yōu)先考慮使用。

        表3 不同預(yù)測算法比較Table 3 Comparison of different predictive algorithms

        5 結(jié)論

        本文提出了一種基于FFT、DC-HC 和LSTM 網(wǎng)絡(luò)的短期負荷預(yù)測方案,借助FFT 得到負荷數(shù)據(jù)期望頻率并以之作為特征量,使用DC-HC 算法聚類負荷,再將聚類結(jié)果按類分別使用LSTM 進行負荷預(yù)測,最終疊加各分量得到預(yù)測總負荷。研究結(jié)論具體如下:

        1)通過FFT 進行特征提取再聚類電力負荷數(shù)據(jù)的按類預(yù)測方法,可有效提高短期負荷預(yù)測精度。

        2)相較其它算法,LSTM 算法應(yīng)用于本文負荷數(shù)據(jù)進行預(yù)測具有更高精度且更加穩(wěn)定。

        3)相較其它聚類算法,DC-HC 算法在負荷預(yù)測中具有更好的數(shù)據(jù)預(yù)處理效果。

        4)DC-HC 算法具有自適應(yīng)聚類數(shù)、抗噪性、簇空間分布自由等優(yōu)點,相較傳統(tǒng)聚類方法具有更大的適用范圍和更強的適用性。

        接下來,研究受外部相關(guān)時序變量影響的時序數(shù)據(jù)預(yù)測模型是今后工作重點。

        天堂aⅴ无码一区二区三区| 99精品电影一区二区免费看| 久久国产亚洲AV无码麻豆| 亚洲国产cao| 久久久人妻丰满熟妇av蜜臀| 亚洲乱码中文字幕在线| 国产精品一卡二卡三卡| 抽插丰满内射高潮视频| 久久久99久久久国产自输拍| 麻豆成年人视频在线观看| 成人日韩熟女高清视频一区| 国产精品三级在线观看无码| 国产人澡人澡澡澡人碰视频| 精品国产97av一区二区三区| 亚洲av五月天一区二区| 国产午夜精品一区二区三区| aaa毛片视频免费观看| 亚洲av永久久无久之码精| 三级日本理论在线观看| 亚洲精品成人网站在线播放| 亚洲综合色丁香婷婷六月图片| 国产三级国产精品三级在专区 | 久久99国产精品久久| 国产在线不卡一区二区三区| 四虎国产精品免费久久麻豆| 一本到亚洲av日韩av在线天堂| 欧美肥婆性猛交xxxx| 国产亚洲视频在线观看网址 | 国产在线视频一区二区三区| 国产乱子伦精品无码专区| 双乳被一左一右吃着动态图| 国产av无码专区亚洲aⅴ| 国产三级精品三级在线专区2| 国产成人无码精品久久久露脸| 色爱区综合激情五月综合小说| 亚洲国产精一区二区三区性色| 中文字幕亚洲一区二区不下| 成熟丰满熟妇高潮xxxxx视频| 一区二区久久不射av| 久久亚洲免费精品视频| 青青国产揄拍视频|