任 碩,閆加寧,羅 嘉,韓 瑩,3
(1. 南京信息工程大學(xué)自動(dòng)化學(xué)院,江蘇 南京 210044; 2. 湖北省公眾氣象服務(wù)中心,湖北 武漢 430074;3. 南京信息工程大學(xué) 江蘇省大氣環(huán)境與裝備技術(shù)協(xié)同創(chuàng)新中心,江蘇 南京 210044)
對(duì)于極端降水事件的處理、洪水災(zāi)害風(fēng)險(xiǎn)等級(jí)分析、區(qū)域水資源管理以及建立完備的防洪減災(zāi)預(yù)警系統(tǒng)而言,降水預(yù)測(cè)的研究具有重要意義[1]。目前,根據(jù)現(xiàn)有資料結(jié)合數(shù)理統(tǒng)計(jì)方法的統(tǒng)計(jì)模型是降水預(yù)測(cè)的一種主要途徑,黃鶴等人[2]將統(tǒng)計(jì)模型中的馬爾可夫模型運(yùn)用于原州區(qū)的降水預(yù)測(cè),根據(jù)已有數(shù)據(jù)驗(yàn)證了預(yù)測(cè)結(jié)果的有效性。由于降水受地理位置,大氣環(huán)流和地形等因素的影響,降水序列呈現(xiàn)出高度的非線(xiàn)性和復(fù)雜的變化趨勢(shì),統(tǒng)計(jì)模型對(duì)其進(jìn)行處理時(shí)存在一定的困難性,模型的預(yù)測(cè)精度也無(wú)法得到進(jìn)一步質(zhì)的提升[3]。
隨著人工智能領(lǐng)域的飛速發(fā)展,更多研究人員將人工智能技術(shù)與機(jī)器學(xué)習(xí)的方法應(yīng)用于對(duì)連續(xù)時(shí)間的降水預(yù)測(cè),彌補(bǔ)統(tǒng)計(jì)模型難以處理非線(xiàn)性序列的不足之處[4]?;跈C(jī)器學(xué)習(xí)的深度學(xué)習(xí)模型,采用多個(gè)不同類(lèi)型的隱藏層作為訓(xùn)練模型的構(gòu)建[5]。長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory Networks,LSTM)是降水預(yù)測(cè)中常用的一種深度學(xué)習(xí)模型,由于其可以有效的學(xué)習(xí)時(shí)間序列中的長(zhǎng)期依賴(lài)關(guān)系,使得模型的預(yù)測(cè)效果得到顯著改善[6]。劉新等人[7]采用LSTM 模型對(duì)青藏高原地區(qū)的月降水量進(jìn)行預(yù)測(cè),結(jié)果顯示在不同預(yù)測(cè)步長(zhǎng)下LSTM 模型的預(yù)測(cè)精度都優(yōu)于傳統(tǒng)模型。然而僅依靠單一預(yù)測(cè)模型容易忽略訓(xùn)練樣本中的隱藏規(guī)律,因此研究人員利用信號(hào)分解算法如變分模態(tài)分解(Variational Mode Decomposition, VMD)、極點(diǎn)對(duì)稱(chēng) 模 態(tài) 分 解(Extreme-point Symmetric Mode Decomposition,ESMD)與神經(jīng)網(wǎng)絡(luò)結(jié)合,采用分解-預(yù)測(cè)-重組的形式進(jìn)行模型構(gòu)建[8]。徐冬梅等人[2]在月降水預(yù)測(cè)的研究中,融入了具有處理非線(xiàn)性序列優(yōu)勢(shì)的VMD算法,取得了良好的預(yù)測(cè)效果。李繼清等人[9]考慮到ESMD 算法可以自適應(yīng)地提取時(shí)間序列的不同尺度信息,利用ESMD 算法將非平穩(wěn)的徑流序列分解為幾個(gè)相對(duì)平穩(wěn)的子序列后,對(duì)各個(gè)子序列分別建模預(yù)測(cè),重構(gòu)結(jié)果后顯示該模型提高了徑流預(yù)測(cè)的準(zhǔn)確率,開(kāi)辟了一種優(yōu)于單一預(yù)測(cè)模型的新思路。由于“端點(diǎn)效應(yīng)”會(huì)干擾序列的分解效果[10],影響信號(hào)分解算法提取時(shí)間序列的趨勢(shì)特性,熊濤證明了“端點(diǎn)效應(yīng)”對(duì)基于分解算法的混合建模框架的預(yù)測(cè)性能有較大的負(fù)面影響[11]。為此,XU 等人[12]創(chuàng)新性的在序列分解時(shí)考慮了邊界修正(Boundary Correction, BC)的方法,以此減少端點(diǎn)效應(yīng)問(wèn)題對(duì)整體預(yù)測(cè)模型的不利因素。
基于上述內(nèi)容,本文提出一種基于邊界修正模塊和二次分解模塊的LSTM 組合月降水預(yù)測(cè)模型。首先采用動(dòng)態(tài)時(shí)間彎曲算法(Dynamic Time Warping, DTW)匹配相似子波后擴(kuò)展原始月降水序列的左右邊界;之后選用ESMD 算法提取擴(kuò)展序列的不同尺度信息,產(chǎn)生頻率依次降低的幾個(gè)模態(tài)分量以及一個(gè)趨勢(shì)分量;切割各個(gè)分量中對(duì)內(nèi)部數(shù)據(jù)“污染”最嚴(yán)重的擴(kuò)展部分;接著運(yùn)用VMD 算法對(duì)高頻分量進(jìn)行平穩(wěn)化處理;最后基于分解的子序列分別建立LSTM 模型進(jìn)行預(yù)測(cè),將所有分量的預(yù)測(cè)結(jié)果重構(gòu)后得到最終月降水預(yù)測(cè)結(jié)果;構(gòu)建一個(gè)考慮邊界修正的ESMD-VMD-LSTM(BC)組合月降水預(yù)測(cè)模型。本文將此模型應(yīng)用于湖北省巴東縣的月降水預(yù)測(cè),采用4 種不同的誤差評(píng)價(jià)指標(biāo)來(lái)評(píng)估模型的優(yōu)劣。通過(guò)7 種模型對(duì)比分析,探究抑制“端點(diǎn)效應(yīng)”對(duì)采用ESMD 算法的組合模型預(yù)測(cè)性能的影響,以及分解算法對(duì)模型預(yù)測(cè)精度的提升效果。
ESMD 算法采用極值點(diǎn)對(duì)稱(chēng)法來(lái)替換經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition ,EMD)所采用的外部包絡(luò)線(xiàn)擬合對(duì)稱(chēng)法[13],有效緩解EMD 存在的模態(tài)混疊問(wèn)題[14]。分解中的關(guān)鍵步驟是確定最佳篩選次數(shù)K0的值,詳細(xì)計(jì)算步驟見(jiàn)文獻(xiàn)[14]。
ESMD 分解序列時(shí), 3 次樣條插值法為端點(diǎn)處插值擬合失去約束從而產(chǎn)生端點(diǎn)處漂移,并逐漸污染內(nèi)部信號(hào)數(shù)據(jù)[15]。為了抑制“端點(diǎn)效應(yīng)”,采用波形特征匹配延拓法對(duì)原始序列進(jìn)行邊界擴(kuò)展,該方法依靠搜尋與邊界處子波擁有最高相似度的內(nèi)部子波完成擴(kuò)展。選定DTW 算法計(jì)算兩段不同長(zhǎng)度序列之間的相似度,如選取兩段長(zhǎng)度分別為m和n的序列A={α1,α2,α3,…,αm}和B={β1,β2,β3,…,βn},構(gòu)建一個(gè)m×n的空間距離矩陣Z。Z(i,j)中的元素d(αi,βi)=(αi-βi)2表示兩點(diǎn)的歐氏距離,之后動(dòng)態(tài)規(guī)劃搜尋Z(1,1)到Z(m,n)的最短路徑,最短路徑越小,代表兩段序列的相似度越高。最短路徑S(m,n)的計(jì)算如式(1)示:
以右端邊界修正為例,步驟如下:
步驟1:PO 為原始序列,紫色子波N M O為選定的研究對(duì)象,包含極大值M和極小值N,見(jiàn)圖1。
圖1 邊界擴(kuò)展示意圖Fig.1 Boundary extension diagram
步驟2:從PO 的左側(cè)開(kāi)始,依次截取包含極大值和極小值的子波。通過(guò)DTW 算法將截取的子波分別與研究對(duì)象匹配計(jì)算相似度。選定出具有最高相似度的紫色子波N1M1O1。
步驟3:從O1點(diǎn)向右截取一定長(zhǎng)度的序列(紅色實(shí)線(xiàn)),將截取序列延長(zhǎng)至右邊界O點(diǎn)的右端(紅色虛線(xiàn))。
步驟4:將邊界擴(kuò)展后的序列進(jìn)行ESMD 分解,根據(jù)PO 序列所占擴(kuò)展序列的位置以及自身長(zhǎng)度信息,將對(duì)應(yīng)的子序列進(jìn)行切割完成邊界修正。
VMD 算法實(shí)質(zhì)是通過(guò)將約束變分問(wèn)題轉(zhuǎn)化為非約束變分問(wèn)題并求解,使原始信號(hào)分解為中心頻率不同的K個(gè)子模態(tài)[16]。約束變分問(wèn)題如式(2)示:
式中:f為給定的原始信號(hào);uk為第k個(gè)模態(tài)分量;K為序列分解數(shù)量;wk為uk的中心頻率;δ(t)為狄拉克分布;?t代表對(duì)時(shí)間變量t求偏導(dǎo)運(yùn)算;?為卷積運(yùn)算;j為虛數(shù)符號(hào);為范數(shù)。
通過(guò)引入二次懲罰項(xiàng)和拉格朗日乘數(shù)轉(zhuǎn)化為非約束變分問(wèn)題,如式(3)示:
式中:α為懲罰系數(shù);λ為拉格朗日乘數(shù);為兩向量的內(nèi)積計(jì)算。
得到一個(gè)非約束模型,并采用交替方向乘子法搜尋迭代計(jì)算最優(yōu){wk}、{uk}和λ的結(jié)果。迭代計(jì)算如式(4)~(6)示:
LSTM內(nèi)部結(jié)構(gòu)主要包含4個(gè)部分:輸入門(mén)、遺忘門(mén)、記憶模塊和輸出門(mén)[17],見(jiàn)圖2。輸入門(mén)限(it)決定了當(dāng)前細(xì)胞狀態(tài)的更新程度,并且控制選擇信息的存入;遺忘門(mén)限(ft)控制過(guò)去信息的丟棄或保留;候選細(xì)胞狀態(tài)存儲(chǔ)之前迭代訓(xùn)練中所學(xué)到的信息,并且對(duì)當(dāng)前輸出的細(xì)胞狀態(tài)(Ct)產(chǎn)生影響;輸出門(mén)限(ot)控制選擇Ct中的信息輸出[18]。LSTM 的數(shù)學(xué)計(jì)算如式(7)~(12)示:
圖2 LSTM 結(jié)構(gòu)示意圖Fig.2 Diagram of the LSTM structure
式中:Wi、Wf、Wo、Wc分別為輸入單元、遺忘單元、輸出單元、候選細(xì)胞狀態(tài)對(duì)應(yīng)的權(quán)重值矩陣;bi、bf、bo、bc分別為其對(duì)應(yīng)的偏差向量;?代表向量元素逐位相乘;σ代表sigmoid 激活函數(shù);tanh 代表雙曲正切函數(shù);xt代表輸入向量;ht-1代表上一時(shí)刻的輸出。
本文提出一種基于邊界修正模塊和二次分解模塊的LSTM組合預(yù)測(cè)模型,整體模型由“修正、分解、預(yù)測(cè)和重構(gòu)”4 個(gè)重要部分構(gòu)建,見(jiàn)圖3。步驟如下。
圖3 ESMD-VMD-LSTM(BC)組合模型框架圖Fig.3 Framework diagram of ESMD-VMD-LSTM(BC) composite model
步驟1:邊界擴(kuò)展。采用波形特征匹配延拓法擴(kuò)展原始月降水序列的左右邊界。
步驟2:一次分解。ESMD算法對(duì)邊界擴(kuò)展后的月降水序列進(jìn)行分解。
步驟3:數(shù)據(jù)切割。根據(jù)原始月降水序列所占擴(kuò)展序列的位置以及自身長(zhǎng)度信息,將對(duì)應(yīng)子序列的擴(kuò)展數(shù)據(jù)切割后,得到有限個(gè)數(shù)模態(tài)分量(E1,E2,E3,…)及殘余分量(R)完成邊界修正。
步驟4:二次分解。VMD 算法對(duì)高頻分量E1進(jìn)行分解,得到有限個(gè)數(shù)模態(tài)(V0,V1,…,Vk)。
步驟5:數(shù)據(jù)處理。將除E1外的各分量(E2,E3,…,R,V0,V1,…,Vk)進(jìn)行歸一化處理后,分別劃分訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集。
步驟6:訓(xùn)練預(yù)測(cè)。基于各分量(E2,E3,…,R,V0,V1,…,Vk)分別建立LSTM 預(yù)測(cè)模型,采用滑動(dòng)窗口作為模型的輸入方式,將各分量的預(yù)測(cè)結(jié)果反歸一化處理后輸出。
步驟7:重構(gòu)結(jié)果。將各分量的輸出結(jié)果重構(gòu),得到原始月降水的預(yù)測(cè)結(jié)果。
為了對(duì)模型的預(yù)測(cè)效果進(jìn)行全面評(píng)價(jià),并與其余模型更好地進(jìn)行量化比較。本文選取4 種不同的評(píng)價(jià)指標(biāo):均方根誤差(Root Mean Square Error,RMSE)、平均絕對(duì)誤差(Mean Absolute Error,MAE)、平均絕對(duì)百分比誤差(Mean Absolute Percentage Error,MAPE)和納什效率系數(shù)(Nash-Sutcliffe Efficiency coefficient,NSE)。計(jì)算如式(13)~(16)示:
式中:m為采樣點(diǎn)數(shù)量;S(t)為t時(shí)刻實(shí)測(cè)值;為t時(shí)刻預(yù)測(cè)值;為樣本平均值。
根據(jù)《水文情報(bào)預(yù)報(bào)規(guī)范》(GB/T 22482-2008)相關(guān)規(guī)定:當(dāng)0.90 ≤NSE時(shí),預(yù)測(cè)精度等級(jí)為甲級(jí);0.70 ≤NSE<0.90 時(shí),預(yù)測(cè)精度等級(jí)為乙級(jí);0.50 ≤NSE<0.70時(shí),預(yù)測(cè)精度等級(jí)為丙級(jí);NSE<0.50時(shí),預(yù)測(cè)結(jié)果不可信。
巴東縣位于中國(guó)湖北省的西南部,身處長(zhǎng)江三峽的中段地區(qū),東經(jīng)110°04′~110°32′,北緯30°28′~31°28′之間,屬于亞熱帶季風(fēng)氣候,濕熱多雨。從表1 可以看出,巴東縣近45 年的年平均降水量在1 020~1 130 mm 之間,因此精準(zhǔn)的月降水預(yù)測(cè)對(duì)該地區(qū)的水資源管理以及經(jīng)濟(jì)可持續(xù)發(fā)展具有重要意義。選取巴東縣1975 年1 月-2020 年10 月的逐月實(shí)測(cè)降水量作為實(shí)驗(yàn)樣本點(diǎn),共計(jì)550個(gè),其逐月實(shí)測(cè)降水的連續(xù)變化曲線(xiàn)見(jiàn)圖4。
表1 巴東縣近45年的年代平均降水量 mmTab.1 Annual average precipitation in Badong County in the past 45 years
圖4 原始月降水序列Fig.4 Original monthly precipitation sequence
(1)邊界擴(kuò)展。為了遏制“端點(diǎn)效應(yīng)”對(duì)內(nèi)部數(shù)據(jù)的“污染”,提升ESMD 算法的特征提取效果,采用波形特征匹配延拓法擴(kuò)展原始月降水序列的左右邊界,擴(kuò)展后的月降水序列S(t)見(jiàn)圖5,紅色曲線(xiàn)為擴(kuò)展數(shù)據(jù)。
圖5 擴(kuò)展后的月降水序列Fig.5 Extended monthly precipitation sequence
(2)ESMD 算法提取不同尺度信息。原始月降水序列的最大值和最小值相差463.3 mm,序列的變化幅度大。采用ESMD算法對(duì)擴(kuò)展后的降水序列S(t)進(jìn)行分解,確定最佳篩選次數(shù)K0為8,得到頻率依次減少的7 個(gè)模態(tài)分量E1~E7和一個(gè)殘余分量R,見(jiàn)圖6。
(3)數(shù)據(jù)切割。根據(jù)原始月降水序列所占擴(kuò)展序列的位置以及自身長(zhǎng)度信息,截去“污染”程度較高的擴(kuò)展數(shù)據(jù),見(jiàn)圖7。
圖7 數(shù)據(jù)切割結(jié)果Fig.7 Data cutting results
從圖7可知,R為最佳自適應(yīng)全局均線(xiàn),代表S(t)的整體變化趨勢(shì):呈現(xiàn)“較快下降-緩慢下降-較快上升”的變化規(guī)律[19]。ESMD 算法充分挖掘序列的趨勢(shì)特性,較好地提取S(t)的不同尺度信息,每個(gè)模態(tài)分量都對(duì)應(yīng)其獨(dú)自的主要波動(dòng)特征,為下一步的降水預(yù)測(cè)奠定基礎(chǔ)。
(4)VMD 算法處理高頻分量。VMD 模塊對(duì)高頻分量E1進(jìn)行平穩(wěn)化處理,根據(jù)經(jīng)驗(yàn)值將分解數(shù)量K設(shè)置成2~6,在K取不同值的情況下確保每個(gè)模態(tài)的中心頻率相差不能過(guò)小,為此本文采用中心頻率對(duì)比法[20]確定最佳分解數(shù)目為5,分解結(jié)果V0~V4見(jiàn)圖8。
由圖8 可知,V0~V3分量的數(shù)值近似對(duì)稱(chēng)分布在零值線(xiàn)的上下區(qū)域,較E1擁有更強(qiáng)的穩(wěn)定性。即使V4分量依舊包含復(fù)雜的頻率信息,但是該分量的絕大部分?jǐn)?shù)據(jù)的波動(dòng)范圍較小,從而減少了此分量的預(yù)測(cè)結(jié)果對(duì)整體模型預(yù)測(cè)精度的影響[8]。VMD 分解模塊充分降低高頻分量的非平穩(wěn)性,便于之后的LSTM神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)。
(5)模型設(shè)定。將分量E2~E7,R,V0~V4根據(jù)式(17)進(jìn)行歸一化處理,分別按照9∶1 劃分訓(xùn)練集和測(cè)試集?;贚STM分別建立各分量的預(yù)測(cè)模型,其中LSTM 的優(yōu)化函數(shù)使用Adma函數(shù),損失函數(shù)的目標(biāo)為均方誤差,激活函數(shù)使用tanh 函數(shù),每個(gè)模型采用兩層LSTM,為了防止過(guò)擬合,將每層LSTM 后添加取值為0.2 的Dropout 層。根據(jù)多次實(shí)驗(yàn)確定LSTM 的超參數(shù),其中時(shí)間步長(zhǎng)為6,批量大小為12,隱藏單元數(shù)為64,學(xué)習(xí)率為0.004,訓(xùn)練次數(shù)為100。采用滑動(dòng)窗口作為模型的輸入方式,本文選用固定大小窗口模式,當(dāng)窗口輸入的數(shù)據(jù)進(jìn)入LSTM 模型完成預(yù)測(cè)后,通過(guò)實(shí)測(cè)值的移入和窗口數(shù)據(jù)的移出完成滑動(dòng)窗口的更新。多次實(shí)驗(yàn)對(duì)比,最終設(shè)定滑動(dòng)窗口的大小為6,模型第一次訓(xùn)練 時(shí)將訓(xùn)練集前6 個(gè)數(shù)據(jù)點(diǎn)xt-5,xt-4,xt-3,xt-2,xt-1,xt作為輸入,預(yù)測(cè)t+ 1時(shí)刻的數(shù)據(jù)點(diǎn)xt+1,通過(guò)滑動(dòng)窗口的更新完成對(duì)模型的多次訓(xùn)練。將預(yù)測(cè)結(jié)果反歸一化處理后重構(gòu)輸出,得到最終的月降水預(yù)測(cè)結(jié)果。
式中:x?為歸一化處理后的數(shù)值;x為原始數(shù)值;xmin和xmax為序列中最小數(shù)值和最大數(shù)值。
選取單一SVM 和LSTM 模型、未進(jìn)行邊界修正的ESMDLSTM、VMD-LSTM 和ESMD-VMD-LSTM 模型、以及采用邊界修正的ESMD-LSTM(BC)模型與本文提出的ESMD-VMDLSTM(BC)模型對(duì)比。各模型預(yù)測(cè)結(jié)果見(jiàn)表2。
表2 各模型預(yù)測(cè)結(jié)果Tab.2 Predicted results of each model
由表2 信息可知:在7 種模型中,本文提出的ESMD-VMDLSTM(BC)模型的預(yù)測(cè)結(jié)果與實(shí)測(cè)數(shù)據(jù)相差最少,預(yù)測(cè)精度最優(yōu),其中RMSE和MAE分別為15.515 6 和12.405 1,MAPE為23.987 5%,且NSE達(dá)到了0.960 0,可信度達(dá)到甲級(jí);單一SVM和LSTM 模型的預(yù)測(cè)結(jié)果相近且較差,其中SVM 模型的RMSE和MAE分別為67.510 4 和56.253 6,MAPE為77.344 5%,NSE低至0.243 3,預(yù)測(cè)結(jié)果不可信,其原因是由于訓(xùn)練集的數(shù)據(jù)量較少,僅依靠單一模型無(wú)法處理非線(xiàn)性的月降水序列;融入信號(hào)分解算法的ESMD-LSTM、VMD-LSTM 和ESMD-LSTM(BC)模型,將非平穩(wěn)的降水序列趨于平穩(wěn)化,減少?gòu)?fù)雜變化趨勢(shì)的月降水序列直接饋送至模型造成的誤差影響,預(yù)測(cè)精度較單一SVM 和LSTM 模型得到一定的提升;對(duì)比ESMD-LSTM 和VMDLSTM 模型的預(yù)測(cè)結(jié)果可知,VMD 算法較ESMD 算法在月降水序列分解中具有更優(yōu)的分解性能;ESMD-LSTM(BC)和ESMDVMD-LSTM(BC)模型的預(yù)測(cè)精度均略微優(yōu)于其各自未考慮邊界修正的模型,表明“端點(diǎn)效應(yīng)”會(huì)影響月降水序列的預(yù)測(cè)結(jié)果;觀察發(fā)現(xiàn)ESMD-VMD-LSTM 和ESMD-VMD-LSTM(BC)模型的預(yù)測(cè)精度顯著優(yōu)于ESMD-LSTM 和ESMD-LSTM(BC)模型,證明VMD 分解模塊對(duì)模型的構(gòu)建具有重要性和有效性,進(jìn)一步將ESMD-LSTM 和ESMD-LSTM(BC)模型的高頻分量E1的測(cè)試集擬合結(jié)果可視化,見(jiàn)圖9,可知一次分解模型存在含有復(fù)雜頻率分量預(yù)測(cè)結(jié)果較差的情況。
圖9 E1的測(cè)試集結(jié)果散點(diǎn)圖Fig.9 Scatter plot of test set results for E1
從指標(biāo)變化的角度分析:由于二次分解算法VMD模塊的引入,較好的避免了高頻分量預(yù)測(cè)效果較差的情況,其中ESMDVMD-LSTM 較ESMD-LSTM 模型的RMSE和MAE降 低 了63.96% 和64.40%,MAPE的指標(biāo)變化較小,但NSE提升了0.302 8;ESMD-VMD-LSTM(BC)較ESMD-LSTM(BC)模型的RMSE、MAE和MAPE分別降低了62.60%、62.06%和29.20%,NSE提升了0.245 8。針對(duì)序列分解的“端點(diǎn)效應(yīng)”問(wèn)題,從而將邊界修正的方法融入到模型中,使得模型的預(yù)測(cè)效果得到改善,其中ESMD-LSTM(BC)較ESMD-LSTM 模型的RMSE、MAE和MAPE分別降低了9.37%、10.62%和14.48%,NSE增加了0.062 2;ESMD-VMD-LSTM(BC)模型的RMSE、MAE和MAPE較ESMD-VMD-LSTM 分別降低了5.95%、4.75%和39.07%,NSE僅提升了0.005 2,然而對(duì)于小樣本數(shù)據(jù)的月降水預(yù)測(cè)研究同樣具有意義。
為了清晰的觀察7種模型的預(yù)測(cè)結(jié)果與實(shí)測(cè)數(shù)據(jù)的擬合效果,將其可視化處理,見(jiàn)圖10。
圖10 各模型預(yù)測(cè)結(jié)果擬合圖Fig.10 Model fit plots for predicted results of each model
由圖10 可知,SVM 和LSTM 模型無(wú)法精準(zhǔn)預(yù)測(cè)實(shí)測(cè)逐月降水量,只能擬合基本的周期變化趨勢(shì)。ESMD-LSTM 與ESMDLSTM(BC)模型較SVM 和LSTM 模型預(yù)測(cè)結(jié)果更加逼近實(shí)測(cè)數(shù)據(jù)點(diǎn),可以擬合基本周期變化趨勢(shì)的同時(shí)精準(zhǔn)預(yù)測(cè)少數(shù)實(shí)測(cè)值;VMD-LSTM 模型的擬合效果提升顯著,在非數(shù)據(jù)極值點(diǎn)上達(dá)到了較好的擬合,然而對(duì)于部分?jǐn)?shù)據(jù)極值點(diǎn)的擬合效果依舊不理想;見(jiàn)圖10 中的局部放大圖,本文提出的ESMD-VMDLSTM(BC)模型較其余6種模型擁有更強(qiáng)的極值擬合能力,進(jìn)一步提升模型預(yù)測(cè)性能的同時(shí)增強(qiáng)了模型在實(shí)際應(yīng)用中的適用性。
針對(duì)月降水?dāng)?shù)據(jù)的小樣本特點(diǎn)和特征變量之間的復(fù)雜性和高冗余性,以及分解算法存在的“端點(diǎn)效應(yīng)”問(wèn)題,本文結(jié)合ESMD 算法可以自適應(yīng)提取時(shí)間序列不同尺度信息的優(yōu)點(diǎn),VMD 算法處理非線(xiàn)性序列的優(yōu)勢(shì),提出一個(gè)考慮邊界修正的ESMD-VMD-LSTM(BC)組合月降水預(yù)測(cè)模型。將該模型應(yīng)用于湖北省巴東縣的月降水預(yù)測(cè),通過(guò)7種模型對(duì)比分析,得出如下結(jié)論。
(1)本文模型的預(yù)測(cè)精度和擬合效果在7種模型中最佳,在巴東縣的月降水預(yù)測(cè)中取得良好表現(xiàn)。未來(lái)可將本文提出的預(yù)測(cè)方法應(yīng)用于其他地區(qū)的月降水預(yù)測(cè),嘗試性的應(yīng)用于日降水的預(yù)測(cè)研究,探究模型是否具有較強(qiáng)的泛化能力。
(2)VMD-LSTM 模型的擬合效果良好,然而其對(duì)數(shù)據(jù)極值點(diǎn)的擬合效果較差,本文模型擁有更強(qiáng)的極值擬合能力,在實(shí)際應(yīng)用中更具適用性。
(3)缺少VMD 模塊的一次分解模型,存在高頻分量預(yù)測(cè)精度較差的情況,從而影響整體模型預(yù)測(cè)的準(zhǔn)確性。
(4)“端點(diǎn)效應(yīng)”會(huì)對(duì)采用ESMD 算法的組合模型的預(yù)測(cè)性能產(chǎn)生一定的負(fù)面影響,降低模型的預(yù)測(cè)精度以及影響模型的擬合效果。
(5)由于高頻分量的預(yù)測(cè)效果是決定模型預(yù)測(cè)精度高低的關(guān)鍵因素,因此通過(guò)加入優(yōu)化算法,對(duì)高頻分量建立更優(yōu)的參數(shù)模型,使得ESMD-VMD-LSTM(BC)模型的預(yù)測(cè)精度仍然可以進(jìn)一步提升,這也是后續(xù)需要進(jìn)一步研究的工作之一。