魏翔宇,向 月,沈曉東,楊晶顯,劉俊勇
(四川大學(xué)電氣工程學(xué)院,四川省成都市 610065)
隨著人們環(huán)保意識的提高與化石資源的逐漸減少,新能源技術(shù)在全球范圍內(nèi)快速發(fā)展。由于風(fēng)力發(fā)電具備無污染、運維成本低的優(yōu)勢,其發(fā)展備受矚目[1-3]。然而,隨著風(fēng)能滲透率的不斷提升,風(fēng)力發(fā)電不確定性對電網(wǎng)影響愈加明顯,電網(wǎng)安全運行受到挑戰(zhàn)[4]。此外,對中國東南沿海地區(qū)而言,風(fēng)電調(diào)度運行長期受臺風(fēng)極端天氣威脅[5]。臺風(fēng)影響下的風(fēng)電場風(fēng)速預(yù)測難度極大,由于沒有考慮臺風(fēng)影響的預(yù)測方法,使得中國沿海及海上風(fēng)電機組在臺風(fēng)侵襲狀況下的運行風(fēng)險評估、停機計劃制定難以細化。為此,考慮臺風(fēng)影響的高精度風(fēng)速預(yù)測對于東南沿海地區(qū)風(fēng)電場調(diào)度運行至關(guān)重要[6-7]。
在短期/超短期風(fēng)速預(yù)測研究方面,物理方法在歐洲地區(qū)應(yīng)用廣泛,但對于中國而言,受制于中國所處東亞季風(fēng)帶影響,統(tǒng)計學(xué)方法相對更加重要[8]。統(tǒng)計方法以機器學(xué)習(xí)方法為主,適用于短期風(fēng)速預(yù)測,包含但不限于時間序列法、支持向量機(SVM)、人工神經(jīng)網(wǎng)絡(luò)(ANN)等[9-11]。其中,基于循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的深度學(xué)習(xí)方法由于在處理時序非線性問題上的優(yōu)勢,近年來發(fā)展迅速[12-14]。在當(dāng)前的風(fēng)速預(yù)測研究中,尚未見計及臺風(fēng)影響的風(fēng)速預(yù)測研究。
風(fēng)速時序數(shù)據(jù)具備波動性與非平穩(wěn)性,信號預(yù)處理是風(fēng)速預(yù)測過程中的重要步驟。相較于經(jīng)驗?zāi)B(tài)分解[15]與小波變換[16],經(jīng)驗小波變換(EWT)理論基礎(chǔ)牢靠,具有較好的自適應(yīng)性能且不存在虛假模態(tài)[17],已被證明在某些情況下的風(fēng)速預(yù)測中具有一定的優(yōu)勢[18],具備良好的實用價值。
在考慮臺風(fēng)影響的風(fēng)速預(yù)測中,臺風(fēng)預(yù)報信息至關(guān)重要。中國臺風(fēng)預(yù)報水平在近年來提升顯著,在臺風(fēng)路徑的高精度預(yù)報方面尤為突出[19],但并未充分考慮風(fēng)雨強度[20],對臺風(fēng)影響下具體地點的風(fēng)速預(yù)測也研究較少。臺風(fēng)期間的風(fēng)電機組啟停計劃制定依賴于風(fēng)速的實時預(yù)報更新,現(xiàn)有臺風(fēng)預(yù)報更新間隔長,難以做到實時預(yù)報。多模式集成(ME)技術(shù)結(jié)合臺風(fēng)實時路徑,評測不同預(yù)報產(chǎn)品的可信度,可應(yīng)用于臺風(fēng)預(yù)報信息的實時修訂中[21]。
本文結(jié)合臺風(fēng)預(yù)報信息,提出了一種基于EWT、門控循環(huán)單元(GRU)網(wǎng)絡(luò)、ME 技術(shù)與深度信念網(wǎng)絡(luò)(DBN)的多步風(fēng)速預(yù)測方法。其中,使用EWT 方法剔除風(fēng)速序列信號噪聲擾動,使用ME 技術(shù)整合不同數(shù)值氣象產(chǎn)品的臺風(fēng)數(shù)值預(yù)報信息,完成數(shù)據(jù)預(yù)處理。考慮歷史氣象數(shù)據(jù),構(gòu)建基于GRU神經(jīng)網(wǎng)絡(luò)的風(fēng)速預(yù)測模型,對降噪后的風(fēng)速數(shù)據(jù)進行預(yù)測以獲取基礎(chǔ)風(fēng)速預(yù)測信息。然后結(jié)合臺風(fēng)數(shù)據(jù),構(gòu)建基于DBN 的修正模型,完成臺風(fēng)影響下的風(fēng)速預(yù)測修正,進而得到風(fēng)速最終預(yù)測值。
考慮臺風(fēng)影響的風(fēng)速多步預(yù)測模型總體框架如圖1 所示,主要分為5 個步驟。
步驟1:首先使用EWT 方法將歷史風(fēng)速時間序列數(shù)據(jù)自適應(yīng)地分解為n個獨立模態(tài),然后采用自適應(yīng)閾值分析方法剔除噪聲信號模態(tài),并重構(gòu)風(fēng)速序列信號,獲得去噪后的風(fēng)速序列。
步驟2:構(gòu)建深度GRU 網(wǎng)絡(luò),考慮歷史氣溫、氣壓、相對濕度、風(fēng)向、風(fēng)速及降水?dāng)?shù)據(jù)進行訓(xùn)練,并對重構(gòu)后的風(fēng)速信號進行多步預(yù)測,得到不考慮臺風(fēng)影響下的風(fēng)速預(yù)測結(jié)果。
步驟3:使用ME 技術(shù),基于當(dāng)前時刻臺風(fēng)狀態(tài)信息,篩選并融合中國大陸和香港數(shù)值、美國數(shù)值及日本數(shù)值等臺風(fēng)數(shù)值預(yù)報產(chǎn)品信息[21],得到實時修正的臺風(fēng)預(yù)報信息。
步驟4:提取臺風(fēng)情況下的風(fēng)速預(yù)測誤差,構(gòu)建DBN 模型,將臺風(fēng)相對距離、相對角度、七級風(fēng)圈半徑、臺風(fēng)最大風(fēng)速及臺風(fēng)中心氣壓額外引入DBN 模型訓(xùn)練集,進行臺風(fēng)條件下的風(fēng)速預(yù)測修正。
步驟5:結(jié)合GRU 網(wǎng)絡(luò)預(yù)測結(jié)果與DBN 的修正結(jié)果,得到風(fēng)速預(yù)測最終輸出。
其中步驟1 與步驟3 分別進行原始風(fēng)速數(shù)據(jù)與臺風(fēng)預(yù)報信息的數(shù)據(jù)預(yù)處理,步驟2 與步驟4 分別構(gòu)建神經(jīng)網(wǎng)絡(luò)預(yù)測/修正模型,步驟5 得到最終輸出。
圖1 考慮臺風(fēng)影響的多步風(fēng)速預(yù)測框架Fig.1 Multi-step wind speed forecasting framework considering impact of typhoon
風(fēng)速序列波動性強,包含部分噪聲。而在臺風(fēng)來臨時,該噪聲會進一步加大,進而提升預(yù)測難度。為此,基于EWT 方法重構(gòu)風(fēng)速序列,削減不同分量中的噪聲信號,從而在保留有效風(fēng)速信息的同時減少噪聲的干擾,進而提升后續(xù)預(yù)測精度。
EWT 由Jerome Gilles 在2013 年提出[22],可以實現(xiàn)對輸入信號的自適應(yīng)模態(tài)分解。不同于傳統(tǒng)小波分解,EWT 方法基函數(shù)的構(gòu)造自適應(yīng)完成,且構(gòu)建好的基函數(shù)與原信號相獨立。在風(fēng)速序列f(t)的EWT 分解中,主要步驟如下。
1)獲取待分析風(fēng)速序列f(t)的傅里葉頻譜F(ω),并對f(t)進行快速傅里葉變換。
2)對F(ω)進行分割,確定傅里葉頻譜的邊界Λ={ω0,ω1,…,ωK}。依據(jù)所得邊界,將傅里葉頻譜劃分為K個連續(xù)區(qū)間Θk=[ωk?1,ωk],其中k∈[1,K],ω0=0,ωk=π。
3)確定劃分區(qū)間Θk后,依據(jù)經(jīng)驗小波的定義,利用Littlewood-Paley 與Meyer 小波構(gòu)造經(jīng)驗尺度函數(shù)φk(t)與經(jīng)驗小波函數(shù)ψk(t)。將兩者分別變換至傅里葉空間內(nèi),其傅里葉變換分別記為φFk(ω)與(ω)。4)對一組緊框架的經(jīng)驗小波,分別求取其近似系數(shù)W0(0,t)與經(jīng)驗小波系數(shù)W1(k,t):
式中:F?1(?)表示傅里葉逆變換;-表示對應(yīng)變量的共軛;?表示求取內(nèi)積。
故原始風(fēng)速序列的重構(gòu)信號為:
式中:*表示卷積運算。
原風(fēng)速序列的各模態(tài)分量為:
式中:f0(t)為近似分量;fk(t)為小波分量。
EWT 采用基追蹤法消除截波,可以有效避免各模態(tài)分量出現(xiàn)波形疊加與模態(tài)混疊。
在完成分解后,須對分解所得各系數(shù)進一步處理,以去除原始風(fēng)速序列中的噪聲干擾。為此須設(shè)置閾值函數(shù),對系數(shù)進行閾值分析。傳統(tǒng)閾值函數(shù)包含軟閾值函數(shù)與硬閾值函數(shù),文獻[18]提出了一種自適應(yīng)閾值函數(shù),適用于風(fēng)速數(shù)據(jù)的去噪。
式中:k∈(0,K);W′1(k,t)為修正后的經(jīng)驗小波系數(shù);W1(k,t)為原經(jīng)驗小波系數(shù);η(?)為符號函數(shù);Tk為噪聲方差相關(guān)閾值;a為軟閾值相似系數(shù),其大小決定了與軟閾值函數(shù)的相似度,a∈(0,1)。
采用該方法進行原始數(shù)據(jù)去噪的閾值篩選。完成閾值篩選后,對各系數(shù)進行逆變換,并完成原始風(fēng)速序列的重構(gòu),獲得去噪后的風(fēng)速數(shù)據(jù)。
在得到原始風(fēng)速序列的重構(gòu)序列后,構(gòu)建GRU神經(jīng)網(wǎng)絡(luò)以完成風(fēng)速預(yù)測。
GRU 網(wǎng)絡(luò)由Cho Kyunghyun 在2014 年提出[23],其構(gòu)造以長短期記憶(LSTM)網(wǎng)絡(luò)為基礎(chǔ),通過對LSTM 網(wǎng)絡(luò)中遺忘門與輸入門的整合以及細胞狀態(tài)的改動,優(yōu)化網(wǎng)絡(luò)整體結(jié)構(gòu),使得其在保留LSTM 網(wǎng)絡(luò)優(yōu)勢的同時提升了網(wǎng)絡(luò)求解速度,并優(yōu)化了長時間依賴與梯度爆炸的問題。GRU 網(wǎng)絡(luò)在序列建模上優(yōu)勢顯著,常用于時序預(yù)測問題求解,是常用的RNN 變種。GRU 單元拓撲結(jié)構(gòu)見附錄A圖A1。
GRU 模型中包含了更新門與重置門2 個門控單元。其求解如下:
式中:zt和rt分別為更新門和重置門的輸出;σ(?)表示sigmoid 激活函數(shù);Wz和Wr分別為更新門和重置門的權(quán)重系數(shù)矩陣,由模型訓(xùn)練得到;ht?1為GRU神經(jīng)網(wǎng)絡(luò)中上一個時間步的狀態(tài)信息;xt為當(dāng)前時間步的輸入;?表示內(nèi)積。
式中:Wh為預(yù)輸出的權(quán)重系數(shù)矩陣;×表示復(fù)合關(guān)系。
由于臺風(fēng)數(shù)據(jù)的不足與臺風(fēng)表征關(guān)鍵參數(shù)的復(fù)雜性,在深度GRU 網(wǎng)絡(luò)構(gòu)建中并不考慮臺風(fēng)信息。預(yù)測的輸入層由量測點自身存儲的溫度、相對濕度、氣壓、降水、風(fēng)向、風(fēng)速等歷史氣象數(shù)據(jù)共同構(gòu)成。網(wǎng)絡(luò)的輸出層為觀測點待預(yù)測風(fēng)速。該網(wǎng)絡(luò)用于捕捉預(yù)測風(fēng)速與溫度、濕度等常見氣象要素間的關(guān)系,其拓撲結(jié)構(gòu)見附錄A 圖A2。圖中:N為輸入時序變量所包含的時序數(shù),N′為輸出變量所包含的時序數(shù),xt?N為t?N時刻觀測點存儲的溫度、相對濕度、氣壓、降水、風(fēng)向、風(fēng)速的歷史氣象數(shù)據(jù),輸出集包含待預(yù)測風(fēng)速信息。
在完成不考慮臺風(fēng)情況下的風(fēng)速預(yù)測后,考慮臺風(fēng)的實時信息與預(yù)報信息,引入DBN 方法對臺風(fēng)情況下的預(yù)測結(jié)果進行修正。GRU 網(wǎng)絡(luò)在t時刻的預(yù)測偏差εG,t由式(12)表示。
在考慮臺風(fēng)對風(fēng)速預(yù)測的影響時,從臺風(fēng)實時信息與預(yù)報信息兩方面出發(fā),對其進行分析。
在臺風(fēng)來臨時,從氣象站處可實時得到臺風(fēng)當(dāng)前時刻位置、移速、風(fēng)力等級、臺風(fēng)半徑、最大平均風(fēng)速、臺風(fēng)中心氣壓等關(guān)鍵信息。在臺風(fēng)位置方面,考慮臺風(fēng)與觀測點的相對位置,計算出兩者相對距離lt及方向θt,以此對臺風(fēng)位置進行表征。在臺風(fēng)強度方面,著重考慮臺風(fēng)七級風(fēng)圈半徑rt、中心最低氣壓pt及臺風(fēng)最大平均風(fēng)速vt。其中由于大部分臺風(fēng)并非對稱結(jié)構(gòu),臺風(fēng)半徑在不同位置具有不同數(shù)值。本文采用臺風(fēng)近觀測點方向的半徑,結(jié)合風(fēng)力共同對臺風(fēng)形狀進行表征。除此之外,由于臺風(fēng)登陸后威力衰減,其半徑難以界定,并無有效數(shù)據(jù),因此對登陸后缺失的半徑數(shù)據(jù)采用該等級臺風(fēng)平均半徑進行統(tǒng)一填補,同時在輸入變量中加入“臺風(fēng)是否登陸”這一二元變量信息,以方便界定臺風(fēng)影響范圍。
在預(yù)報信息方面,不同臺風(fēng)數(shù)值產(chǎn)品具備不同的更新頻率、起報時間及預(yù)報時長,而在臺風(fēng)來臨時,預(yù)報的實時性對后續(xù)風(fēng)險評估、調(diào)度運行方案制定至關(guān)重要。因此采用ME 技術(shù)[24],對中國大陸和香港數(shù)值、美國數(shù)值及日本數(shù)值等臺風(fēng)數(shù)值預(yù)報信息進行融合集成,獲取修正的臺風(fēng)預(yù)報位置、中心氣壓及最大風(fēng)速信息。其中由于預(yù)報信息中臺風(fēng)半徑的缺乏,預(yù)報半徑信息由預(yù)報最大風(fēng)速及臺風(fēng)當(dāng)前時刻形狀共同給出。
在臺風(fēng)預(yù)報信息集成時,由于臺風(fēng)路徑預(yù)報信息為散點,因此首先利用3 次樣條插值,完善臺風(fēng)路徑信息。然后利用短時誤差進行篩選,具體操作如下:以臺風(fēng)當(dāng)前位置為中心,所有預(yù)測產(chǎn)品在當(dāng)前時刻預(yù)測誤差的平均值為半徑,劃定有效域。若產(chǎn)品預(yù)測誤差在平均誤差范圍內(nèi),則在該時刻認為其預(yù)報值誤差在可接受范圍內(nèi),接受其預(yù)報值。然后對所有已接受預(yù)報信息取算術(shù)平均值,得到修正后的預(yù)報信息。相對于其他數(shù)值產(chǎn)品,中國香港數(shù)值預(yù)報信息逐時更新預(yù)報信息,故而在預(yù)報產(chǎn)品集成中權(quán)重固定,不參與篩選。如附錄A 圖A3 所示,在一次預(yù)報信息集成中,預(yù)報信息1、預(yù)報信息4 相對當(dāng)前時刻的預(yù)報值在誤差平均值范圍內(nèi),因此接受這兩者對下一時刻的預(yù)報值。
DBN 由Geoffrey Hinton 在2006 年提出[25],是一種多層隱含隨機變量構(gòu)成的概率生成模型。所構(gòu)建臺風(fēng)條件下的風(fēng)速修正模型見附錄A 圖A4。
在結(jié)構(gòu)上,DBN 包含若干層受限玻爾茲曼機(RBM)與一層有監(jiān)督反向傳播網(wǎng)絡(luò),DBN 的訓(xùn)練包含預(yù)訓(xùn)練與微調(diào)兩步。其中預(yù)訓(xùn)練階段DBN 需對RBM 逐層進行無監(jiān)督訓(xùn)練,使得特征向量能夠在映射過程中盡可能多地保留下來。在預(yù)訓(xùn)練過程中,前層RBM 的隱層輸出作為后一層RBM 的顯層輸入,完成特征信息的擴散。此時每層RBM 對權(quán)重的學(xué)習(xí)使得其可保證該層特征信息映射最優(yōu)。在微調(diào)階段中,采用有監(jiān)督學(xué)習(xí)方式對反向傳播層進行訓(xùn)練,將誤差反向逐層傳遞,進而對RBM 網(wǎng)絡(luò)中的權(quán)值進行微調(diào)。RBM 層的訓(xùn)練優(yōu)化了反向傳播(BP)層的初值選取,降低了全局訓(xùn)練中模型陷入局部最優(yōu)解的可能性。
在中國,臺風(fēng)氣象集中出現(xiàn)于夏季。2012—2018 年數(shù)據(jù)表明,中國除臺灣地區(qū)外,近年來的年登陸臺風(fēng)數(shù)約為7~9 個。隨著中國檢測技術(shù)不斷發(fā)展,近年來可獲取的臺風(fēng)數(shù)據(jù)不斷完善,但由于臺風(fēng)過境時間短,臺風(fēng)總體數(shù)據(jù)仍舊較為稀少。而在DBN 模型中,受益于RBM 自身特性及預(yù)訓(xùn)練-微調(diào)的訓(xùn)練策略,網(wǎng)絡(luò)對輸入特征敏感性增加,在數(shù)據(jù)量較少的情況下仍能取得具備可用性的結(jié)果。
基于DBN 模型,得到臺風(fēng)情況下t時刻GRU 網(wǎng)絡(luò)預(yù)測結(jié)果的偏差預(yù)測值。此時考慮臺風(fēng)條件下的最終預(yù)測值表示為:
采用中國南部某地區(qū)數(shù)據(jù)進行建模,對該地區(qū)進行步長為1 h 的6 h 向前多步風(fēng)速預(yù)測。歷史數(shù)據(jù)包含該地區(qū)2012—2018 年內(nèi)的溫度、相對濕度、氣壓、降水、風(fēng)向及風(fēng)速數(shù)據(jù),采樣周期為1 h。
在實際EWT 分解過程中,風(fēng)速序列的傅里葉變換被歸一到[0,π]區(qū)間,因此隨著風(fēng)速序列的增長,時域的延展使得原始風(fēng)速序列不同頻率下的信息被過度挖掘,不同頻率下的分量不斷增加,傅里葉頻譜中出現(xiàn)多個極值點,進而造成分解過程中的模態(tài)爆炸。此時原始風(fēng)速序列被過度分解,模態(tài)數(shù)目大且包含信息混雜,難以用于進一步分析。為此,需將原有風(fēng)速序列分解為多段,并逐段進行數(shù)據(jù)重構(gòu)。經(jīng)測試,針對文中所用數(shù)據(jù)集,在時間序列長度處于[200,750]時,EWT 方法能夠保持分解模態(tài)量適中,便于進行后續(xù)除噪。
截取其中某段EWT 分解后的波形,如附錄B圖B1 所示。其中最上方為原始風(fēng)速波形,f0(t)為濾波后的近似分量,f1(t)?f5(t)為濾波后的5 個小波分量。采用自適應(yīng)濾波后對風(fēng)速序列進行重組。該段風(fēng)速序列的重組風(fēng)速數(shù)據(jù)及原始風(fēng)速數(shù)據(jù)對比見附錄B 圖B1,濾除波形見附錄B 圖B2,重構(gòu)風(fēng)速序列見附錄B 圖B3。
結(jié)合附錄B 圖B2、圖B3 可知,經(jīng)過EWT 重構(gòu)后的風(fēng)速序列整體與原序列整體保持一致,在部分細節(jié)處去除了噪聲,使得原始序列中包含的噪聲信息減少。同時噪聲信號的濾除在多分量中同步進行,風(fēng)速信號在頻域的關(guān)聯(lián)性增強。
為對比EWT 序列重構(gòu)對后續(xù)預(yù)測性能的影響,分別構(gòu)建原始序列與重構(gòu)序列的GRU 預(yù)測模型,進行6 h 逐時向前多步預(yù)測。
為提高預(yù)測精度,對數(shù)據(jù)進行劃分。其中2012—2016 年數(shù)據(jù)作為訓(xùn)練集,2017—2018 年數(shù)據(jù)作為測試集。除少量缺損數(shù)據(jù)外,訓(xùn)練集包含35 040 組數(shù)據(jù),測試集包含17 520 組數(shù)據(jù)。同時在訓(xùn)練開始前進行數(shù)據(jù)的歸一化處理。在風(fēng)速基礎(chǔ)預(yù)測模型中,所構(gòu)建GRU 網(wǎng)絡(luò)的超參數(shù)通過網(wǎng)格搜索法進行優(yōu)化。其隱含層層數(shù)為2 層。從前至后分別具有220 和150 個神經(jīng)元。損失函數(shù)設(shè)置為平方誤差,批尺寸為10 000,最大迭代次數(shù)為150 次。共訓(xùn)練10 次,預(yù)測誤差取10 次平均值。
在預(yù)測結(jié)果分析中,采用均方根誤差(RMSE)、平均相對百分比誤差(MAPE)和平均絕對誤差(MAE)對預(yù)測結(jié)果進行評價。3 項指標均直接表征了誤差的大小,其數(shù)值越小,預(yù)測精度越高。
EWT-GRU 方法與單一GRU 方法在測試集中進行多步預(yù)測的誤差對比如表1 所示。截取其中某段時間預(yù)測結(jié)果進行單步預(yù)測的對比。在該時段的數(shù)據(jù)中,預(yù)測誤差如表1 所示,其中某日預(yù)測結(jié)果如圖2 所示。多步預(yù)測結(jié)果見附錄B 圖B4 和圖B5。
表1 不同預(yù)處理的預(yù)測誤差Table 1 Forecasting errors of different preprocessing conditions
圖2 基于GRU 模型的單步風(fēng)速預(yù)測結(jié)果Fig.2 One-step wind speed forecasting results based on GRU model
結(jié)合圖2 與表1 可以發(fā)現(xiàn),經(jīng)EWT 處理后,由于頻域低表征信號被弱化,EWT-GRU 方法的預(yù)測結(jié)果相較GRU 方法所得預(yù)測結(jié)果在大多數(shù)時候更為優(yōu)秀,在MAPE、RMSE、MAE 這3 項指標上均表現(xiàn)更好。在1 h 向前單步預(yù)測中,EWT-GRU 方法的MAE 較GRU 方法降低2.53%,MAPE 降低1.16%,RMSE 降低9.48%。值得注意的是,2 個預(yù)測模型在MAPE 上相差更小?;厮輸?shù)據(jù),由于原始風(fēng)速數(shù)據(jù)在部分點處異常陡降,陡降點處相對誤差迅速增大,并在最終MAPE 中占據(jù)較大比重。如圖2 中43 h,該時刻實際風(fēng)速為0.09 m/s,而EWTGRU 模型得出風(fēng)速預(yù)測值為1.36 m/s,GRU 模型得出風(fēng)速預(yù)測值為1.39 m/s,均高于實際風(fēng)速值。兩者的絕對風(fēng)速誤差分別為1.27 m/s 與1.30 m/s,相對誤差分別為14.11 與14.44。在MAPE 的計算中權(quán)重較大。由于類似節(jié)點的大量存在,且EWTGRU 方法并非每次預(yù)測結(jié)果都能更優(yōu),因此2 種方法MAPE 差距相較其余二者更小。
受制于原始數(shù)據(jù)的選取,該時段的預(yù)測精度并不理想。該觀測站位置特殊,在風(fēng)速數(shù)據(jù)的平穩(wěn)性上表現(xiàn)欠佳。另一方面,該時段內(nèi)的風(fēng)速數(shù)值較小且波動性極大,進一步加大了該時段內(nèi)的預(yù)測誤差。然而,仍可從圖中看出,EWT 預(yù)處理雖然對原始數(shù)據(jù)改動較小,但大多時候下都具備提升預(yù)測精度的能力。
以2017 年的熱帶風(fēng)暴苗柏(Merbok)為例,進行預(yù)測分析。使用EWT-GRU 模型對該臺風(fēng)進行風(fēng)速預(yù)測,其預(yù)測結(jié)果及誤差如圖3 所示。
圖3 苗柏過境時EWT-GRU 模型風(fēng)速預(yù)測值及誤差Fig.3 Wind speed forecasting results and errors based on EWT-GRU model during Merbok
圖3 中:前27 h 臺風(fēng)生成后,七級風(fēng)圈未將觀測點納入范圍內(nèi);第28~34 h,臺風(fēng)七級風(fēng)圈邊緣部分覆蓋測風(fēng)點;最后6 h,臺風(fēng)已經(jīng)過境,七級風(fēng)圈內(nèi)不包含該觀測點。
從圖3 中可以看出,由于臺風(fēng)的不斷接近,自臺風(fēng)產(chǎn)生后的風(fēng)速預(yù)測精度隨預(yù)測步數(shù)上升迅速下滑,遠低于無臺風(fēng)情況下的預(yù)測精度。同時可以觀察到,在臺風(fēng)影響下,出現(xiàn)持續(xù)的風(fēng)速上升情況時,即使是提前1 h 的預(yù)測,所構(gòu)建模型也總是傾向于認為下一預(yù)測時刻風(fēng)速會降低,即保持風(fēng)速的穩(wěn)定。而在氣壓發(fā)生變化,臺風(fēng)風(fēng)速降低時,預(yù)測模型又傾向于認為風(fēng)速會加速降低,甚至高于臺風(fēng)風(fēng)速實際降低速度。與之對比,該觀測點處在之后無臺風(fēng)天氣中觀測到了一次持續(xù)風(fēng)速劇烈變化天氣,此時并未出現(xiàn)此類狀況,如附錄B 圖B6 所示。從機器學(xué)習(xí)原理角度來說,由于臺風(fēng)情況下風(fēng)速變化具備連續(xù)性,與常態(tài)差異大,再加之訓(xùn)練輸入少,在訓(xùn)練中所占權(quán)重低,因此在以整體誤差最小為核心的學(xué)習(xí)策略中,難以進行有效學(xué)習(xí)。
為此,構(gòu)建DBN 對預(yù)測結(jié)果進行修正。以2012—2016 年全部數(shù)據(jù)及2017 年部分數(shù)據(jù)作為訓(xùn)練集,2017 年部分數(shù)據(jù)與2018 年數(shù)據(jù)作為測試集。訓(xùn)練集包含799 組數(shù)據(jù),共涵蓋17 個臺風(fēng)信息;測試集包含134 組數(shù)據(jù),共涵蓋4 個臺風(fēng)的相關(guān)信息。在訓(xùn)練開始前進行數(shù)據(jù)的歸一化處理。DBN 包含2 層RBM,從前至后分別具有45、30 個神經(jīng)元。RBM 學(xué)習(xí)率設(shè)置為0.000 5,最大迭代次數(shù)為200。誤差修正后的預(yù)測結(jié)果如圖4 所示。
圖4 基于EWT-GRU-DBN 模型的風(fēng)速預(yù)測結(jié)果Fig.4 Wind speed forecasting results based on EWTGRU-DBN model
從圖4 可以看出,對提前1 h 預(yù)測進行的臺風(fēng)情況下修正可有效提升預(yù)報精度。而隨著預(yù)報時間增長,臺風(fēng)本身位置、強度等信息的預(yù)報精度也在逐步降低,此時DBN 網(wǎng)絡(luò)的修正精度隨之降低。但相較于不加額外修正的情況下,所得誤差仍有較大改善,對比如圖5 所示。
圖5 提前6 h 預(yù)測結(jié)果對比Fig.5 Comparison of forecasting results of 6 hours in advance
結(jié)合圖3 至圖5,該模型在臺風(fēng)過境前、過境中、過境后3 個不同時間段內(nèi)具備不同的表現(xiàn)。其中在過境前階段,誤差預(yù)測效果整體平穩(wěn),且隨著臺風(fēng)的接近,誤差修正效果逐漸提高。而在臺風(fēng)過境階段,DBN 預(yù)測模型對風(fēng)速預(yù)測值短期修正效果良好,有效將預(yù)測誤差控制在1 m/s 內(nèi)。但在提前4 h、6 h 預(yù)測中,由于臺風(fēng)在接觸觀測點前2 h 時轉(zhuǎn)向,偏離數(shù)值氣象產(chǎn)品的預(yù)報路徑,致使提前4 h、提前6 h 的預(yù)測出現(xiàn)較大偏差。在臺風(fēng)過境后,由于陸地環(huán)境復(fù)雜,且臺風(fēng)難以繼續(xù)吸收熱能,臺風(fēng)影響范圍迅速衰減。此時,依據(jù)臺風(fēng)信息對風(fēng)速進行的修正效果有限,且穩(wěn)定性降低。在給定臺風(fēng)數(shù)據(jù)集中,DBN 修正前后的預(yù)測誤差如附錄B 表B1 所示。經(jīng)臺風(fēng)信息修正,臺風(fēng)時期的預(yù)測精度顯著提升,驗證了本模型在提升臺風(fēng)情況下風(fēng)速預(yù)測精度的有效性。
除此之外,與使用按月劃分訓(xùn)練集的BP 神經(jīng)網(wǎng)絡(luò)進行對比,以證明本方法的有效性及修正模型的可遷移性。不同方法在臺風(fēng)測試集上的誤差對比如表2 所示。由表2 可知,本文所提EWT-GRU 風(fēng)速預(yù)測模型在精度上相較傳統(tǒng)BP 神經(jīng)網(wǎng)絡(luò)具有一定優(yōu)勢。同時在應(yīng)用至BP 神經(jīng)網(wǎng)絡(luò)時精度的提升表明,所用DBN 修正模型具有一定可遷移性,能夠嵌入其余預(yù)測模型中,改善臺風(fēng)時的預(yù)測結(jié)果。
表2 不同方法預(yù)測性能對比Table 2 Comparison of forecasting performance of different methods
基于深度神經(jīng)網(wǎng)絡(luò),計及臺風(fēng)對風(fēng)速預(yù)測的影響,提出了一種風(fēng)速多步預(yù)測模型,并通過算例驗證了本文所提模型的可行性與有效性,結(jié)論如下。
1)采用EWT 方法對數(shù)據(jù)進行預(yù)處理能夠在不改變數(shù)據(jù)整體趨勢的前提下,消除風(fēng)速序列中的部分噪聲,改善預(yù)測結(jié)果。
2)針對臺風(fēng)對風(fēng)速的影響,整合臺風(fēng)預(yù)報信息,構(gòu)建DBN 模型對臺風(fēng)情況下的預(yù)測結(jié)果進行修正,結(jié)合前述EWT-GRU 模型可有效提高受臺風(fēng)影響時的風(fēng)速預(yù)測精度,為后續(xù)臺風(fēng)影響下的風(fēng)電運行風(fēng)險評估與調(diào)度運行計劃制定提供了參考。
3)所提臺風(fēng)條件下的DBN 修正模型具備一定通用性,可應(yīng)用于其余機器學(xué)習(xí)方法,提升臺風(fēng)情況下的風(fēng)速預(yù)測精度。
后續(xù)隨著臺風(fēng)預(yù)測技術(shù)的提升與臺風(fēng)實時觀測數(shù)據(jù)的逐步開放,該方法可運用至考慮臺風(fēng)影響的15 min 超短期風(fēng)速預(yù)測或短期風(fēng)速預(yù)測中。
附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。