蔡悅幸 史旭明 陸虹 金龍 羅小莉
(1 廣西壯族自治區(qū)氣候中心,南寧 530022; 2 桂林航天工業(yè)學(xué)院,桂林 541004)
廣西地處亞熱帶季風(fēng)氣候區(qū),南瀕熱帶海洋,受低緯熱帶天氣系統(tǒng)和中高緯大尺度環(huán)流系統(tǒng)的交替影響,降雨時(shí)空分布嚴(yán)重不均,尤其是6月,作為氣候平均月降水量最多的月份[1],常因強(qiáng)降雨的集中發(fā)生,導(dǎo)致河水暴漲、洪水泛濫、城市內(nèi)澇、滑坡泥石流等,造成巨大的經(jīng)濟(jì)損失,甚至危及人民生命。因此,深入研究影響廣西6月降水的大氣環(huán)流演變規(guī)律,分析其影響機(jī)制和主要影響因子,建立氣候預(yù)測(cè)模型,提高6月降水預(yù)測(cè)的準(zhǔn)確率,為政府和各級(jí)部門防御洪澇災(zāi)害減少經(jīng)濟(jì)損失提供科學(xué)決策支撐,具有重要意義。
與短期降水天氣預(yù)報(bào)相比,影響月時(shí)間尺度降水變化的因素更多、更為復(fù)雜,要提高月降水趨勢(shì)預(yù)測(cè)準(zhǔn)確率更為困難。近年來,許多學(xué)者為提高短期氣候預(yù)測(cè)準(zhǔn)確率提出了基于不同原理的動(dòng)力統(tǒng)計(jì)相結(jié)合的預(yù)報(bào)方法,如回溯差分格式預(yù)報(bào)方法[2-4]、動(dòng)力-統(tǒng)計(jì)相似誤差訂正預(yù)報(bào)方法[5-10]、組合統(tǒng)計(jì)降尺度預(yù)測(cè)方法[11-14]等,均取得了較好的預(yù)測(cè)效果[15-17]。然而氣候模式對(duì)同期大尺度環(huán)流的有限可預(yù)報(bào)性,會(huì)在一定程度上影響統(tǒng)計(jì)降尺度模型的預(yù)測(cè)性能[12]。王會(huì)軍等[16]也指出氣候模式所預(yù)測(cè)的各因素間可能存在著復(fù)雜的關(guān)聯(lián),任何動(dòng)力-統(tǒng)計(jì)預(yù)測(cè)模式都不可能把所有因素考慮吸納,并提出了學(xué)者們需要?jiǎng)?chuàng)新研究動(dòng)力-統(tǒng)計(jì)相結(jié)合的預(yù)測(cè)模型。據(jù)此,有不少學(xué)者利用人工智能方法結(jié)合統(tǒng)計(jì)預(yù)測(cè)方法,提出了基于不同機(jī)器學(xué)習(xí)方法的天氣氣候預(yù)測(cè)模型,在一定程度上提高了預(yù)測(cè)準(zhǔn)確率[18-24]。因此,利用機(jī)器學(xué)習(xí)方法預(yù)測(cè)月降水量,有助于為短期氣候預(yù)測(cè)提供一種可能的參考。
目前已有大量研究發(fā)現(xiàn),廣西前汛期降水與前期歐亞中高緯度地區(qū)環(huán)流形勢(shì)[25-27]、高原積雪[28]、各區(qū)域海溫[29-30]以及南半球環(huán)流[26-27,31]等有密切聯(lián)系。以上系統(tǒng)的異常,會(huì)引起大氣環(huán)流形勢(shì)的異常配置[32-33],進(jìn)而造成了天氣氣候的異常[34]。由于各不同因子間的不確定性和復(fù)雜的相互作用過程,以及降水的年際、年代際預(yù)測(cè)信號(hào)的不一致均容易導(dǎo)致預(yù)測(cè)模型誤差增大[35],很多學(xué)者利用年際增量法來放大預(yù)測(cè)因子與預(yù)測(cè)對(duì)象之間的異常信號(hào),同時(shí)減小氣候年際、年代際背景帶來的影響[36],并采用多元線性回歸預(yù)報(bào)方法來建立預(yù)測(cè)模型,均取得了良好的預(yù)測(cè)效果[35-40]。然而,多元回歸預(yù)報(bào)方法容易出現(xiàn)自變量間的多重相關(guān)性,從而影響回歸模型的參數(shù)估計(jì),擴(kuò)大模型預(yù)測(cè)誤差[41-45];另一方面,強(qiáng)降水事件受多尺度天氣系統(tǒng)綜合影響,具有顯著的非線性特征,因此,應(yīng)用非線性方法來進(jìn)行建模更有利于減少模型誤差。近年來,模糊神經(jīng)網(wǎng)絡(luò)方法由于具有較強(qiáng)的處理非線性問題能力,在氣象預(yù)報(bào)領(lǐng)域得到了廣泛應(yīng)用[18-20]。也有研究表明熵度量是信息量大小的度量[46-47],可以用來衡量集成個(gè)體模型對(duì)預(yù)測(cè)模型的影響。因此,本文嘗試采用模糊神經(jīng)網(wǎng)絡(luò)方法與熵度量方法,利用廣西87個(gè)站6月平均月降水量的年際增量序列作為預(yù)報(bào)量,通過普查1960—2021年6月降水年際增量與前期500 hPa位勢(shì)高度場(chǎng)的相關(guān)性,選取影響廣西6月降水異常相關(guān)性較高的前期預(yù)測(cè)因子,構(gòu)建月降水年際增量的集合預(yù)報(bào)模型,探索這種集合預(yù)報(bào)模型的預(yù)報(bào)效果,驗(yàn)證其在短期氣候預(yù)測(cè)中的有效性和適用性。
降水資料為廣西87個(gè)國家氣象觀測(cè)站1959—2021年6月降水觀測(cè)數(shù)據(jù);大氣環(huán)流資料為美國國家環(huán)境預(yù)報(bào)中心和大氣研究中心(NCEP/NCAR)再分析數(shù)據(jù)[48],包括逐月位勢(shì)高度場(chǎng)、風(fēng)場(chǎng),水平分辨率為2.5°×2.5°。
本文參照范可等[35]定義的年際增量法,通過預(yù)測(cè)廣西6月降水年際增量(即當(dāng)年6月降水量減去上一年6月降水量的差值)來預(yù)測(cè)廣西6月的降水量。分析NCEP/NCAR大氣環(huán)流再分析資料中逐月位勢(shì)高度場(chǎng)、風(fēng)場(chǎng),挑選物理意義明確、相關(guān)系數(shù)高的主要影響因子,利用模糊神經(jīng)網(wǎng)絡(luò)方法[49]、熵度量方法[50]來建立廣西6月降水年際增量的預(yù)報(bào)模型。
本文在預(yù)選因子群中挑選預(yù)測(cè)因子時(shí),不僅考慮因子與預(yù)報(bào)量序列相關(guān)系數(shù)的大小以及預(yù)選因子間的相關(guān)性,還根據(jù)近年來對(duì)廣西6月降水機(jī)制的相關(guān)研究成果[1,26-31,51-54],挑選與廣西6月降水有關(guān)的、物理意義較明確且因子間相關(guān)關(guān)系相對(duì)獨(dú)立的因子。
以500 hPa位勢(shì)高度場(chǎng)再分析資料作為基本預(yù)報(bào)因子場(chǎng),計(jì)算6月降水量原始序列、增量序列分別與前期上年1月至當(dāng)年4月逐月、連續(xù)2月滑動(dòng)平均、連續(xù)3月滑動(dòng)平均以及連續(xù)4月滑動(dòng)平均的500 hPa位勢(shì)高度原始場(chǎng)及增量場(chǎng)的相關(guān)關(guān)系,挑選連續(xù)20個(gè)格點(diǎn)以上相關(guān)系數(shù)|r|≥0.25的區(qū)域作為一個(gè)因子區(qū),再對(duì)因子區(qū)內(nèi)最大值附近的9個(gè)格點(diǎn)值進(jìn)行逐年平均,該序列作為代表該區(qū)域一個(gè)預(yù)選因子。陸虹等[20]研究發(fā)現(xiàn),選因子時(shí),將2個(gè)相鄰區(qū)域且符號(hào)相反的因子作為一個(gè)組合因子,其相關(guān)系數(shù)比單一因子高。故本文在挑選因子時(shí),也對(duì)因子進(jìn)行了組合,以提高預(yù)報(bào)因子的高相關(guān)性。按照以上方法,最后共挑選了425個(gè)預(yù)選因子,其中組合預(yù)選因子62個(gè)。
南下冷空氣活動(dòng)是影響廣西前汛期暴雨過程的關(guān)鍵因子之一[36],其中歐亞中高緯地區(qū)的環(huán)流形勢(shì)可決定南下冷空氣對(duì)廣西暴雨的影響程度[26]。陶詩言[51]早在20世紀(jì)80年代初期就已指出,由于中低緯天氣系統(tǒng)相互作用,中高緯度環(huán)流型由緯向環(huán)流轉(zhuǎn)為經(jīng)向環(huán)流,此時(shí)高空槽加深,冷空氣南下。為此,歐亞中高緯的高相關(guān)影響區(qū)是本文的重點(diǎn)關(guān)注區(qū)域之一。經(jīng)普查發(fā)現(xiàn),多個(gè)高相關(guān)因子“負(fù)”中心位于鄂霍次克海附近,“正”中心位于加拿大附近(圖1a),其中上年5—8月平均鄂霍次克海附近組合因子相關(guān)系數(shù)最高,高達(dá)0.63(表1中預(yù)測(cè)因子1)。同時(shí),多個(gè)因子在北半球極地與中高緯地區(qū)呈現(xiàn)“正—負(fù)”相關(guān)位相,類似北極濤動(dòng)負(fù)位相(圖1b),其中前期上年5—7月平均的組合因子相關(guān)系數(shù)高達(dá)0.53(表1中預(yù)測(cè)因子2)。已有研究表明,北極濤動(dòng)可引起持續(xù)多個(gè)月的下墊面(如積雪、海冰和海溫等)異常,再反饋到后續(xù)的大氣環(huán)流,并對(duì)最初北極濤動(dòng)異常進(jìn)行響應(yīng)[52]。在前期1月500 hPa高度場(chǎng)增量序列與廣西6月降水增量序列的相關(guān)分布圖(圖略)上,青藏高原附近地區(qū)存在顯著負(fù)相關(guān)區(qū),高原以南為廣闊的正相關(guān)區(qū),這一組合因子相關(guān)系數(shù)高達(dá)0.54(表1中預(yù)測(cè)因子3)。同期500 hPa回歸風(fēng)場(chǎng)(圖略)上,歐洲和貝加爾湖附近為異常反氣旋性環(huán)流,高原及其以北地區(qū)為異常氣旋性環(huán)流,有利于高原西風(fēng)槽和低渦切變的形成,造成1月高原積雪偏多[39]。這一變化可增強(qiáng)冬春季高原近地面熱源作用,進(jìn)而影響后期環(huán)流變化[39]。另一方面,前期4月北大西洋從低緯到高緯存在“正—負(fù)—正”高相關(guān)中心(圖略),其中北大西洋低緯地區(qū)最大相關(guān)系數(shù)達(dá)0.58(表1中預(yù)測(cè)因子4)。前人的研究指出北大西洋海溫的異常會(huì)激發(fā)沿歐亞大陸向下游傳播的類似于歐亞(EU型)遙相關(guān)波列,從而引起其下游東亞地區(qū)的大氣環(huán)流異常[29-31],進(jìn)而影響華南地區(qū)降水。這4個(gè)因子回歸的當(dāng)年6月環(huán)流均表現(xiàn)為中高緯地區(qū)經(jīng)向環(huán)流偏強(qiáng),有利于冷空氣南下,且熱帶西太平洋地區(qū)出現(xiàn)異常反氣旋性環(huán)流,使得偏南氣流將大量水汽向廣西輸送(圖1c、d),有利于廣西降水的產(chǎn)生[1]。因此,這4個(gè)因子均可作為降水預(yù)測(cè)的因子。
表1 預(yù)測(cè)因子及其與廣西6月降水年際增量的相關(guān)性
圖1 1960—2021年廣西6月降水增量序列與前期上年5—8月(a)、前期上年5—7月(b)500 hPa位勢(shì)高度增量的相關(guān)場(chǎng)及預(yù)測(cè)因子1(c)、預(yù)測(cè)因子2(d)回歸得到的 6月500 hPa 風(fēng)場(chǎng)年際增量(箭頭)(a、b中圓點(diǎn)區(qū)域和c、d中黃色區(qū)域通過α=0.05顯著性檢驗(yàn);c、d中“A”表示反氣旋性環(huán)流,“C”表示氣旋性環(huán)流;預(yù)測(cè)因子釋義見表1,下同)
同時(shí),南半球海溫及大氣環(huán)流異常對(duì)華南前汛期降水過程有指示意義[30-31]。在預(yù)選因子群中,多個(gè)“正—負(fù)” 組合因子位于東南太平洋至澳大利亞東南側(cè),多個(gè)“正”相關(guān)因子位于南半球馬斯克林附近,其中前期上年7—8月在南太平洋地區(qū)的相關(guān)分布最為顯著(圖2a),從東南太平洋—澳大利亞東南側(cè)—澳大利亞和海洋性大陸地區(qū)—華南地區(qū)呈現(xiàn)“正—負(fù)”交替相關(guān)波列,且這一波列在東南太平洋至澳大利亞東南側(cè)的“正—負(fù)”組合因子相關(guān)系數(shù)達(dá)0.62(表1中預(yù)測(cè)因子5)。另外, 前期上年8月南半球馬斯克林附近有一顯著正相關(guān)區(qū)域,其相關(guān)系數(shù)達(dá)0.51(表1中預(yù)測(cè)因子6)。已有研究表明,前期南太平洋海溫異常也可通過引起大氣環(huán)流異常來激發(fā)跨赤道遙相關(guān)信號(hào),進(jìn)而影響東亞天氣氣候變化[30-31]。偏強(qiáng)的馬斯克林高壓有利于印度尼西亞附近的越赤道氣流增強(qiáng),造成西太平洋副高加強(qiáng)西伸[54]。由這2個(gè)因子序列回歸的6月500 hPa風(fēng)場(chǎng)(圖2b)上,澳大利亞地區(qū)為異常氣旋式環(huán)流,赤道東風(fēng)異常明顯,有利于越赤道氣流的增強(qiáng),進(jìn)而增強(qiáng)低層印度洋暖濕水汽向廣西輸送[53-54],利于廣西6月降水偏多。因此,這2個(gè)因子的年際增量也可作為降水預(yù)測(cè)的因子。
圖2 1960—2021年廣西6月降水增量序列與前期上年7—8月500 hPa位勢(shì)高度增量的相關(guān)場(chǎng)(a)及預(yù)測(cè)因子5回歸得到的 6月500 hPa 風(fēng)場(chǎng)年際增量(箭頭)
綜上所述,本文選擇了對(duì)廣西6月降水影響較為明顯的6個(gè)前期物理量因子(表1),作為建立非線性預(yù)報(bào)模型的預(yù)報(bào)因子。
在以往無論是統(tǒng)計(jì)集合預(yù)報(bào)還是數(shù)值預(yù)報(bào)模式的集合預(yù)報(bào)研究過程中均發(fā)現(xiàn),要提高集合預(yù)報(bào)模型的泛化能力,必須要求參與集成的預(yù)報(bào)個(gè)體在準(zhǔn)確性與差異性之間取得平衡。如何保證參與集成的個(gè)體既有一定的預(yù)報(bào)準(zhǔn)確性,又保持他們之間的差異性,對(duì)提高集合預(yù)報(bào)模型的預(yù)報(bào)能力是非常重要的。為此本文嘗試采用有較強(qiáng)處理非線性問題能力的模糊神經(jīng)網(wǎng)絡(luò)與熵度量方法相結(jié)合來構(gòu)建月降水年際增量的集合預(yù)報(bào)模型,并分析模型的預(yù)報(bào)能力。
圖3 熵度量-模糊神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)過程流程
以表1的6個(gè)預(yù)報(bào)因子為基礎(chǔ),利用建立的熵度量與模糊神經(jīng)網(wǎng)絡(luò)的月降水年際增量集合預(yù)報(bào)模型,將1960—2013年54個(gè)6月降水增量序列作為預(yù)報(bào)模型的建模樣本進(jìn)行回算擬合檢驗(yàn),然后依次對(duì)2014—2021年的 8個(gè)獨(dú)立預(yù)報(bào)樣本作預(yù)報(bào)檢驗(yàn),其中趨勢(shì)計(jì)算以54年建模樣本作為歷史同期均值,同號(hào)率計(jì)算為同趨勢(shì)樣本與總樣本的比率。圖4為廣西6月降水年際增量觀測(cè)值與年際增量預(yù)測(cè)值,預(yù)測(cè)模型回報(bào)年份同號(hào)率為87.5%,擬合平均絕對(duì)誤差為26.64 mm,擬合平均相對(duì)誤差為9.06%,其中相對(duì)誤差在±15%以內(nèi)的樣本有6個(gè),模型具有較好的回報(bào)效果。另外,在8年的獨(dú)立樣本回報(bào)預(yù)測(cè)中,相對(duì)誤差大于15%的有2個(gè),分別為降水最大值年份(2017年)和降水最小值年份(2021年),相對(duì)誤差分別為-19.75%和21.86%,對(duì)這種極值年份的預(yù)測(cè),相對(duì)誤差在20%左右,且預(yù)報(bào)其偏多偏少的趨勢(shì)正確(表2)??梢?本文提出的熵度量與模糊神經(jīng)網(wǎng)絡(luò)的月降水年際增量集合預(yù)報(bào)模型具有較好的精度,可用于對(duì)廣西6月降水的預(yù)測(cè)。
表2 2014—2021年熵度量-模糊神經(jīng)網(wǎng)絡(luò)集合預(yù)報(bào)模型獨(dú)立樣本回報(bào)檢驗(yàn)結(jié)果
圖4 1960—2021年廣西6月降水年際增量觀測(cè)值與熵度量-模糊神經(jīng)網(wǎng)絡(luò)集合預(yù)報(bào)模型所獲得的年際增量預(yù)測(cè)值
為了進(jìn)一步對(duì)比采用熵度量與模糊神經(jīng)網(wǎng)絡(luò)的月降水年際增量集合預(yù)報(bào)模型與線性統(tǒng)計(jì)模型的預(yù)報(bào)性能差異,本文同樣以表1的6個(gè)初預(yù)報(bào)因子為因子集,利用同樣的建模樣本和回報(bào)預(yù)測(cè)檢驗(yàn)樣本,采用逐步回歸方法,建立了逐步回歸預(yù)報(bào)方程:
Y=-0.655606 +1.369157X1+0.561213X2+0.883575X3+2.403222X4+0.246096X5+0.555309X6
預(yù)報(bào)結(jié)果見圖5和表3。相比于熵度量-模糊神經(jīng)網(wǎng)絡(luò)集合預(yù)報(bào)模型,逐步回歸獨(dú)立樣本擬合平均絕對(duì)誤差37.68 mm,擬合平均相對(duì)誤差13.23 %,較模糊神經(jīng)網(wǎng)絡(luò)集合預(yù)報(bào)模型的擬合平均相對(duì)誤差(9.06 %)有所增加,其中2015年,2016年,2018年,2019年,2020年的擬合相對(duì)誤差增加明顯。可見,本文提出的熵度量與模糊神經(jīng)網(wǎng)絡(luò)的月降水年際增量集合預(yù)報(bào)模型較逐步回歸方法回報(bào)效果好,模型更穩(wěn)定。
表3 2014—2021年逐步回歸方法獨(dú)立樣本回報(bào)檢驗(yàn)結(jié)果
圖5 1960—2021年廣西6月降水年際增量觀測(cè)值與逐步回歸方法所獲得的年際增量預(yù)測(cè)值
通過普查1960—2021年廣西6月降水年際增量與前期大氣環(huán)流場(chǎng)的相關(guān)性,選取了影響廣西6月降水異常相關(guān)性較高的前期預(yù)測(cè)因子,采用模糊神經(jīng)網(wǎng)絡(luò)與熵度量相結(jié)合的方法構(gòu)建月降水年際增量的集合預(yù)報(bào)模型,通過對(duì)該模型的預(yù)測(cè)效果進(jìn)行分析和檢驗(yàn),得出主要結(jié)論如下:
(1)從本文挑選的影響廣西6月降水的6個(gè)主要前期影響因子來看,廣西6月降水受南北半球大氣環(huán)流系統(tǒng)的共同影響,可以挑選相關(guān)系數(shù)較高、物理意義較明確的影響因子作為建模因子。同時(shí),為得到相關(guān)性更好、更穩(wěn)定的因子,可以使用組合方法對(duì)相鄰近的因子進(jìn)行組合。
(2)基于年際增量法建立的廣西6月降水熵度量-模糊神經(jīng)網(wǎng)絡(luò)集合預(yù)測(cè)模型,能有效結(jié)合熵度量信息增益作用和遺傳算法全局優(yōu)化的能力,表現(xiàn)出較好的預(yù)報(bào)性能。該預(yù)測(cè)模型在對(duì)2014—2021年獨(dú)立樣本回報(bào)檢驗(yàn)中,預(yù)測(cè)模型的回報(bào)年份同號(hào)率為87.5%,擬合平均絕對(duì)誤差為26.64 mm,擬合平均相對(duì)誤差為9.06 %。
(3)通過對(duì)比分析發(fā)現(xiàn),利用非線性的熵度量-模糊神經(jīng)網(wǎng)絡(luò)方法建立的集合預(yù)報(bào)模型,在相同的預(yù)報(bào)因子條件下,預(yù)報(bào)能力和穩(wěn)定性明顯優(yōu)于用逐步回歸方法建立的預(yù)報(bào)模型。
影響廣西6月降水的因素較為復(fù)雜,冬春季海溫、積雪、海冰等因素對(duì)廣西降水也有影響[25-31]。本文在建模挑選影響因子時(shí),著重考慮了500 hPa大氣環(huán)流的影響以及預(yù)選因子與預(yù)報(bào)量序列相關(guān)系數(shù)的大小,但部分影響機(jī)制不是特別清晰,如前期上年5—8月平均鄂霍次克海附近的組合因子通過何種方式調(diào)節(jié)當(dāng)年6月的環(huán)流還不太清楚,有待進(jìn)一步開展分析研究。在今后的研究中,還需進(jìn)一步結(jié)合動(dòng)力模式資料挑選的同期大氣環(huán)流因子或者利用冬春季海溫、積雪、海冰等關(guān)鍵區(qū)作為預(yù)測(cè)因子,利用本研究所使用的模糊神經(jīng)網(wǎng)絡(luò)與熵度量相結(jié)合機(jī)器學(xué)習(xí)方法來建立預(yù)測(cè)模型,并與本研究結(jié)果對(duì)比分析,進(jìn)一步加深對(duì)該模型的理解與應(yīng)用。另外,機(jī)器學(xué)習(xí)方法是以大數(shù)據(jù)為基礎(chǔ)的自適應(yīng)學(xué)習(xí)方法,要盡可能使用最大樣本數(shù)據(jù),建模樣本數(shù)過少可能會(huì)減少預(yù)報(bào)方法的可靠性。而氣候模式(CFS和Derf2.0等)回報(bào)資料多從90年代開始,若使用氣候模式產(chǎn)品,則建模樣本數(shù)過少。因此如何更好地利用現(xiàn)有的更具物理意義的模式產(chǎn)品資料數(shù)據(jù)也是智能計(jì)算機(jī)器學(xué)習(xí)方法需要深入研究的課題。