熊世為,張新民,段春鋒,郁凌華,胡姍姍
(1 滁州市氣象局,安徽 滁州239000;2 安徽省氣候中心,安徽 合肥230031)
氣候變化背景下, 極端強(qiáng)降水和大范圍干旱等氣候事件頻發(fā)[1],若能認(rèn)識(shí)其變化特征并提前做出較準(zhǔn)確的預(yù)測(cè), 就能夠?qū)φ块T防災(zāi)減災(zāi)決策部署提供重要幫助。 氣象“十三五”規(guī)劃中明確指出,要“強(qiáng)化延伸期到月、季氣候預(yù)測(cè)業(yè)務(wù),提升氣候事件預(yù)報(bào)預(yù)測(cè)業(yè)務(wù)能力”[2]。 氣候預(yù)測(cè)是利用氣候動(dòng)力學(xué)和統(tǒng)計(jì)學(xué)等方法, 在研究氣候異常特征的基礎(chǔ)上進(jìn)行預(yù)測(cè)。 國(guó)內(nèi)外學(xué)者在氣候預(yù)測(cè)理論和方法方面開(kāi)展了大量研究[3-17]。我國(guó)氣候變化受青藏高原、東亞季風(fēng)和海洋等諸多因素的共同影響, 氣候異常的成因非常復(fù)雜[4-5],也為氣候預(yù)測(cè)工作帶來(lái)了難度。 經(jīng)過(guò)多年的發(fā)展, 我國(guó)的氣候預(yù)測(cè)方法經(jīng)歷了從簡(jiǎn)單經(jīng)驗(yàn)統(tǒng)計(jì)到動(dòng)力模式的階段[6-8],雖然模式產(chǎn)品釋用已在月尺度氣候預(yù)測(cè)中取得一定成果, 但其準(zhǔn)確率仍達(dá)不到業(yè)務(wù)要求[9],因此研究以數(shù)理統(tǒng)計(jì)為基礎(chǔ)的氣候預(yù)測(cè)方法更適合省級(jí)以下氣象業(yè)務(wù)單位。 前人在這方面開(kāi)展了大量研究[10-17]。 徐炳南[10]利用逐步回歸方法構(gòu)建了基于東亞大槽和北美東岸大槽等環(huán)流指數(shù)的貴州省夏季旱澇預(yù)測(cè)模型, 在實(shí)際檢驗(yàn)中取得了較好的預(yù)測(cè)效果;陳雷等[11]利用卡爾曼濾波方法建立了河西走廊東部月平均氣溫預(yù)測(cè)模型, 模型預(yù)測(cè)精度較高。 BP 人工神經(jīng)網(wǎng)絡(luò)因在非線性函數(shù)逼近方面具有很強(qiáng)的自適應(yīng)能力, 在眾多領(lǐng)域得到了廣泛應(yīng)用[12-13],但該方法在網(wǎng)絡(luò)初始權(quán)值、閾值以及網(wǎng)絡(luò)結(jié)構(gòu)的選擇上是隨機(jī)的, 很難選取具有全局性的初始點(diǎn),為克服這一不足,當(dāng)前主流的方法是采用遺傳算法(Genetic Algorithm,GA)進(jìn)行BP 網(wǎng)絡(luò)初始結(jié)構(gòu)優(yōu)化,效果明顯優(yōu)于無(wú)GA 優(yōu)化處理[13-15]。目前該方法在氣候預(yù)測(cè)方面也得到了應(yīng)用[16-17],效果良好。
本研究以地處江淮分水嶺的安徽省滁州市為例, 在分析該地區(qū)汛期降水多尺度時(shí)間變化特征的基礎(chǔ)上, 利用國(guó)家氣候中心提供的百余項(xiàng)環(huán)流指數(shù)作為預(yù)報(bào)因子, 建立基于GA-BP 神經(jīng)網(wǎng)絡(luò)的汛期降水氣候預(yù)測(cè)模型, 以期為政府部門防汛抗旱決策提供理論依據(jù)。
研究所需降水量數(shù)據(jù)由滁州市氣象局提供,以滁州市所轄的7 個(gè)站(滁州、來(lái)安、全椒、天長(zhǎng)、定遠(yuǎn)、鳳陽(yáng)、明光)汛期(5—9 月)降水量為預(yù)測(cè)對(duì)象,數(shù)據(jù)時(shí)段為1961—2017 年,降水量數(shù)據(jù)質(zhì)量較好,個(gè)別缺測(cè)數(shù)據(jù)利用空間差值訂正。 選擇國(guó)家氣候中心提供的130 項(xiàng)環(huán)流特征量指數(shù)(http://cmdp.ncc-cma.net/Monitoring/cn_index_130.php) 作為預(yù)測(cè)因子,具體包括大氣環(huán)流類(Atm)88 項(xiàng),海溫類(Oce)26 項(xiàng),其它類(Ext)16 項(xiàng),數(shù)據(jù)形式為逐月觀測(cè)值。 由于業(yè)務(wù)上需要年初或汛前預(yù)測(cè)當(dāng)年的汛期雨量, 因此環(huán)流指數(shù)的時(shí)間段選取對(duì)應(yīng)的1960—2016 年。
集合經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition,EEMD) 具有較強(qiáng)的自適應(yīng)性和時(shí)間上的局部性特點(diǎn),適用于非線性非平穩(wěn)序列的時(shí)頻分析,較小波分析等其他方法能夠更好地展示趨勢(shì)變化和周期信號(hào)。該方法主要是對(duì)一個(gè)信號(hào)進(jìn)行平穩(wěn)化處理, 將信號(hào)中存在的不同時(shí)間尺度波動(dòng)逐級(jí)分解開(kāi)來(lái),自動(dòng)產(chǎn)生一系列具有不同時(shí)間尺度的本征模函數(shù)(Intrinsic Mode Function,IMF)。 本文在分解過(guò)程中,根據(jù)Huang 等人的推薦每次加白噪音的振幅為合成序列標(biāo)準(zhǔn)差的20%,集合平均次數(shù)為1000 次[18]。
BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)模型, 該方法無(wú)論在網(wǎng)絡(luò)理論還是在性能方面均比較成熟, 突出優(yōu)點(diǎn)就是具有很強(qiáng)的非線性映射能力和柔性的網(wǎng)絡(luò)結(jié)構(gòu), 但也存在容易陷入局部極小值,網(wǎng)絡(luò)層數(shù)、神經(jīng)元個(gè)數(shù)的選擇沒(méi)有相應(yīng)的理論指導(dǎo)的缺陷。 遺傳算法(GA)是模擬達(dá)爾文生物進(jìn)化論“優(yōu)勝劣汰,適者生存”過(guò)程的計(jì)算方法,具有全局尋優(yōu)的特點(diǎn),能夠較好地彌補(bǔ)BP 神經(jīng)網(wǎng)絡(luò)的缺陷。遺傳算法優(yōu)化BP 人工神經(jīng)網(wǎng)絡(luò)的核心思路為:放棄BP 神經(jīng)網(wǎng)絡(luò)原有的誤差反向傳播來(lái)修正網(wǎng)絡(luò)權(quán)值, 進(jìn)而選擇遺傳算法全局性搜索方法來(lái)確定最優(yōu)的BP 神經(jīng)網(wǎng)絡(luò)連接權(quán)和網(wǎng)絡(luò)結(jié)構(gòu),其具體設(shè)置參照文獻(xiàn)[17]的做法。 本文采用適應(yīng)度函數(shù)作為評(píng)價(jià)GA-BP 模型的訓(xùn)練效果,表達(dá)式為[16]:
式中,F(xiàn)(i)為第i 個(gè)遺傳個(gè)體的適應(yīng)度,n 為訓(xùn)練樣本的個(gè)數(shù), yij為第j 個(gè)訓(xùn)練樣本的期望輸出值(預(yù)測(cè)值),為第j 個(gè)訓(xùn)練樣本的實(shí)際輸出值(觀測(cè)值)。因此,適應(yīng)度函數(shù)與預(yù)測(cè)值和觀測(cè)值的方差成反比,F(xiàn)(i)越大,表示二者之間的方差越小,訓(xùn)練效果越好。
為科學(xué)評(píng)價(jià)預(yù)測(cè)效果, 本文采用交叉驗(yàn)證進(jìn)行預(yù)測(cè)效果檢驗(yàn)。其具體過(guò)程為:假設(shè)數(shù)據(jù)樣本長(zhǎng)度為n,當(dāng)預(yù)測(cè)第i 年的數(shù)據(jù)時(shí),以去除第i 年的n-1 年資料作為訓(xùn)練樣本,第i 年的數(shù)據(jù)作為測(cè)試樣本,依次將該過(guò)程循環(huán),直到i 遍歷了所有年。
采用均方根誤差(RMSE)進(jìn)行模型預(yù)報(bào)精度評(píng)估,表達(dá)式如下:
式中cm、co分別表示預(yù)報(bào)值和實(shí)況值,n 為樣本數(shù)。
基于EEMD 算法將1961—2017 年滁州地區(qū)(以滁州站代表)汛期降水量時(shí)間序列進(jìn)行分解(圖1), 共分解出4 個(gè)從高頻到低頻不同時(shí)間尺度的本征模態(tài)(IMF 分量)和1 個(gè)表示原始數(shù)據(jù)總體隨時(shí)間變化的趨勢(shì)項(xiàng)(Residue 項(xiàng)),并得出各模態(tài)和趨勢(shì)項(xiàng)的方差貢獻(xiàn)率,并對(duì)每個(gè)IMF 分量做頻譜分析以得到每個(gè)模態(tài)的時(shí)間尺度(圖2)。
圖1 滁州站汛期降水量EEMD 分解后的不同模態(tài)
結(jié)合圖1 和圖2 可知,1961—2017 年滁州地區(qū)汛期降水最顯著的周期特征是準(zhǔn)2 a(2.3 a),其方差貢獻(xiàn)率為57.13%, 波動(dòng)頻譜能量峰值超1×105dB,最大振幅在±300 mm 左右;IMF2 表示一個(gè)準(zhǔn)4 a的波動(dòng)周期,其方差貢獻(xiàn)率為21.63%,波動(dòng)頻譜能量峰接近5×104dB, 最大振幅在±200 mm 左右,但2000 年之后振幅很小;IMF3 表示準(zhǔn)11 a(10.7 a)的年代際周期信號(hào),其方差貢獻(xiàn)率為11.15%,波動(dòng)頻譜能量峰值超1×104dB,最大振幅±150 mm 左右;IMF4為一個(gè)準(zhǔn)16 a 的年代際周期信號(hào), 方差貢獻(xiàn)率分別為9.4%,其波動(dòng)頻譜能量峰值接近2×104dB,最大振幅接近±100 mm;趨勢(shì)項(xiàng)的方差貢獻(xiàn)率為0.69%。 從趨勢(shì)項(xiàng)可以看出20 世紀(jì)80 年代之前滁州地區(qū)汛期降水是一個(gè)顯著上升時(shí)期, 趨勢(shì)上升幅度接近100 mm,20 世紀(jì)80 年代—2000 年代是一個(gè)下降時(shí)期,趨勢(shì)下降幅度30 mm 左右,2000 年后又是一個(gè)較明顯的上升趨勢(shì),趨勢(shì)上升幅度接近50 mm。
表1 相關(guān)分析初選預(yù)測(cè)因子
2.2.1 預(yù)測(cè)因子選取
圖2 EEMD 本征模態(tài)的頻譜分析
在提取預(yù)報(bào)模型的輸入因子初選時(shí),通過(guò)對(duì)預(yù)報(bào)對(duì)象與上一年度1—12 月130 項(xiàng)環(huán)流指數(shù)進(jìn)行相關(guān)分析,在1560 個(gè)(130×12)環(huán)流指數(shù)中得到26 個(gè)通過(guò)0.05 的顯著性水平檢驗(yàn)的指數(shù)(表1)。
若直接利用上述初選出的26 個(gè)因子作為模型輸入變量,會(huì)使得模型運(yùn)算量偏大,且26 個(gè)因子之間也存在信息重疊的問(wèn)題。如海溫類指數(shù)第15 項(xiàng)的10 月和5 月值與次年汛期降水量相關(guān)系數(shù)分別為0.34 和0.33,通過(guò)顯著性檢驗(yàn)(表1),但二者同時(shí)作為預(yù)測(cè)模型輸入變量顯然會(huì)信息重疊。鑒于此,本文對(duì)上述26 個(gè)初選因子進(jìn)行主成分分析,選擇累計(jì)貢獻(xiàn)率超過(guò)90%的前13 個(gè)主成分作為預(yù)測(cè)模型的輸入變量(表2),這樣做雖然有接近10%的信息損失,但模型輸入變量大大減少且相互間沒(méi)有重疊信息。
表2 主成分分析結(jié)果
2.2.2 預(yù)測(cè)效果分析
為分析GA-BP 模型預(yù)測(cè)效果及前文選擇預(yù)測(cè)因子時(shí)利用主成分分析處理效果, 本文設(shè)計(jì)2 種方案:方案1,直接利用初選的26 個(gè)因子進(jìn)行GA-BP模型預(yù)測(cè);方案2,利用主成分分析再篩選得到的13個(gè)因子進(jìn)行GA-BP 模型預(yù)測(cè)。 以滁州站為例,利用2 種方案的模型訓(xùn)練效果見(jiàn)圖3。 在GA-BP 模型訓(xùn)練期間, 方案2 的適應(yīng)度在大部分時(shí)段內(nèi)都高于方案1,在進(jìn)化結(jié)束時(shí)方案1 的適應(yīng)度為3.4,而方案2 的適應(yīng)度達(dá)到3.8,說(shuō)明方案2 的訓(xùn)練效果優(yōu)于方案1。
兩種模型的交叉驗(yàn)證結(jié)果見(jiàn)圖4,可以看出2 種方案中大部分散點(diǎn)都在1:1 線附近,預(yù)測(cè)效果良好,其中方案2 的散點(diǎn)較方案1 更聚攏, 且對(duì)極值的預(yù)測(cè)效果也明顯好于方案1。 方案1 的交叉驗(yàn)證均方根誤差RMSE 為139 mm, 預(yù)測(cè)值和實(shí)際值之間的判定系數(shù)R2為0.39,而方案2 的RMSE 為122 mm,判定系數(shù)R2達(dá)0.53,方案2 預(yù)測(cè)精度高于方案1。
表3 給出的是GA-BP 模型兩種方案在滁州地區(qū)7 個(gè)站的預(yù)報(bào)效果對(duì)比。 可以看出,方案1 對(duì)各站預(yù)報(bào)值和實(shí)際值之間的判定系數(shù)R2在0.34~0.42,平均R2為0.37,均方根誤差RMSE 在112~131 mm,平均均方根誤差RMSE 為122 mm;方案2 對(duì)各站預(yù)報(bào)值和實(shí)際值之間的R2在0.48~0.55, 平均R2為0.51,RMSE 在135~151 mm,平均RMSE 為144 mm。
表3 GA-BP 模型的兩種方案在滁州地區(qū)的預(yù)報(bào)效果
本文利用集合經(jīng)驗(yàn)?zāi)B(tài)分解EEMD 方法分析了江淮分水嶺地區(qū)滁州站1961—2017 年汛期降水的多尺度時(shí)間變化特征, 以國(guó)家氣候中心提供的百余項(xiàng)環(huán)流指數(shù)作為預(yù)報(bào)因子, 建立基于GA-BP 神經(jīng)網(wǎng)絡(luò)的汛期降水氣候預(yù)測(cè)模型,主要研究結(jié)論如下:
(1)該地區(qū)1961—2017 年汛期降水存在準(zhǔn)2 a、4 a 的年際尺度周期變化特征以及準(zhǔn)11 a 和16 a的年代際尺度周期變化特征,總體變化趨勢(shì)為在20世紀(jì)80 年代之前、20 世紀(jì)80 年代—21 世紀(jì)及21世紀(jì)以來(lái)分別對(duì)應(yīng)增大—減少—增大的趨勢(shì)。
(2)在選擇預(yù)報(bào)因子時(shí)進(jìn)行兩種試驗(yàn)方案,方案1 是直接利用相關(guān)分析得出的26 項(xiàng)因子進(jìn)行預(yù)測(cè),方案2 是在相關(guān)分析的基礎(chǔ)上再進(jìn)行主成分分析,選擇累計(jì)貢獻(xiàn)率達(dá)到90%的前13 項(xiàng)因子進(jìn)行預(yù)測(cè),預(yù)測(cè)效果良好,對(duì)滁州地區(qū)7 個(gè)站的預(yù)測(cè)誤差分別為122 mm 和144 mm,方案2 優(yōu)于方案1。
人工神經(jīng)網(wǎng)絡(luò)技術(shù)在氣象預(yù)報(bào)和氣候預(yù)測(cè)領(lǐng)域已經(jīng)得到廣泛運(yùn)用, 本研究對(duì)環(huán)流指數(shù)進(jìn)行相關(guān)分析和主成分分析得到預(yù)測(cè)因子, 在此基礎(chǔ)上建立了基于GA-BP 神經(jīng)網(wǎng)絡(luò)模型的站點(diǎn)汛期雨量預(yù)測(cè)方法,在安徽省內(nèi)的預(yù)測(cè)效果良好。我國(guó)幅員遼闊但影響氣候的因素十分復(fù)雜,不同地區(qū)的氣候特點(diǎn)迥異,該方法能否適用于其他地區(qū)值得進(jìn)一步研究。