周海,秦昊,吉璐瑩,肖瑩
準(zhǔn)確的天氣預(yù)報對人民群眾生活、防災(zāi)減災(zāi)至關(guān)重要。隨著計算水平的不斷提高,數(shù)值模式系統(tǒng)已成為天氣預(yù)報的主要支撐。但是大氣運動自身的混沌特性、不完美的數(shù)值模式會影響預(yù)報技巧等諸多不確定性因素,使得單一的確定性預(yù)報不能提供全部預(yù)報信息(Smagorinsky,1969)。因此,建立集合預(yù)報系統(tǒng)(Ensemble Prediction Systems,EPS),將天氣預(yù)報從單一確定性預(yù)報向多值的概率預(yù)報進行轉(zhuǎn)變,已成為目前天氣預(yù)報的發(fā)展趨勢(陳靜等,2002)。
集合預(yù)報利用不同的初始條件對大氣數(shù)值模式分別積分得到一組不同的預(yù)報結(jié)果(Leith,1974),既能提供預(yù)報效果更好的確定性預(yù)報,也能更加準(zhǔn)確地描述未來天氣狀況的多種可能性。但是由于集合預(yù)報在模式設(shè)計、初值擾動、集合大小等方面的不完美,同一模式的不同集合成員仍然具有某些相同的缺陷,例如目前多數(shù)集合預(yù)報系統(tǒng)普遍存在離散度偏小的問題(Buizza,1997;陳超輝等,2020)。對集合預(yù)報結(jié)果進行統(tǒng)計后處理,例如對單個數(shù)值模式進行偏差訂正總體上可以校正預(yù)報偏差以及量化預(yù)報不確定性,是目前進一步提高數(shù)值預(yù)報水平的有效手段(Vannitsem et al.,2021)。在天氣預(yù)報的現(xiàn)狀下,不僅需要逐步完善模式的數(shù)據(jù)同化、物理、分辨率、地表參數(shù)化等方面,還要逐步完善統(tǒng)計后處理方法。
此外,各個模式在動力框架、物理過程、分辨率、地形表征、初始化方案等多個方面存在差異,模式彼此之間的預(yù)報能力也都具有時間、空間上的差異(Bougeault et al.,2010)。為校正集合系統(tǒng)預(yù)報偏差以及充分利用不同模式預(yù)報結(jié)果以提高預(yù)報技巧,近年來多模式集成技術(shù)得到迅速發(fā)展。早在20世紀(jì)60—70年代,Danard et al.(1968)和Thompson(1977)就發(fā)現(xiàn),通過將兩個相互獨立的預(yù)測結(jié)果進行特定的線性組合,其預(yù)測均方根誤差可以小于單個預(yù)測的均方根誤差。如今,多模式集成預(yù)報已經(jīng)在研究中取得了巨大的成功,通過組合多個模式的有效預(yù)報信息,多模式集成提升了預(yù)報可靠性,預(yù)報技巧優(yōu)于單模式(Hagedorn et al.,2005;Zhi et al.,2012)。
常用的多模式集成方案可以分為等權(quán)以及不等權(quán)兩類。等權(quán)多模式集成技術(shù)有簡單集合平均(Ensemble Mean,EM)、消除偏差集合平均(Bias Removed Ensemble Mean,BREM),不等權(quán)多模式集成主要有超級集合(Superensemble,SUP)、貝葉斯模式平均(Bayesian Model Averaging,BMA)、集合模式輸出統(tǒng)計(Ensemble Model Output Statistics,EMOS)等,詳見表1。根據(jù)預(yù)報形式,這些多模式集成方案又可分為確定性預(yù)報和概率預(yù)報,本文將從這兩方面來介紹多模式集成方案在溫度、降水和風(fēng)3個最基本的地面氣象要素中的應(yīng)用。
表1 地面氣象要素多模式集成預(yù)報技術(shù)
集合平均是最簡單的多模式集成技術(shù),即對多個模式預(yù)報結(jié)果進行算數(shù)平均:
(1)
其中:AEM表示多模式集合預(yù)報平均值;Fi為第i(i=1,2,…,Nm)個模式預(yù)報值,Nm為模式總個數(shù)。
該方法計算簡單,預(yù)報結(jié)果通常優(yōu)于單一確定性預(yù)報(Fritsch et al.,2000),但其缺點是賦予預(yù)報技巧較差的模式與預(yù)報技巧最高的模式具有相同的權(quán)重。
隨后,消除偏差集合平均在簡單集合平均的基礎(chǔ)上通過消除預(yù)報偏差進一步提高了預(yù)報質(zhì)量:
(2)
張玲和智協(xié)飛(2013)采用消除偏差集合平均方法預(yù)報2008年中國南方低溫天氣事件,通過降低預(yù)報均方根誤差以提高數(shù)值模式預(yù)報技巧。卞赟等(2015)將消除偏差集合平均應(yīng)用于延伸期降水預(yù)報,研究表明該方法預(yù)報效果優(yōu)于簡單集合平均且可以將晴雨量級的降水預(yù)報時效提高至少5 d。Zhu et al.(2010)研究表明消除偏差集合平均可以有效地提高黃海渤海地區(qū)風(fēng)速和大風(fēng)區(qū)位置的預(yù)報。
然而,訓(xùn)練期內(nèi)的模式偏差并不一定與預(yù)報期內(nèi)的模式偏差保持一致,于是存在消除偏差集合平均預(yù)報技巧不如簡單集合平均的情況。為此,Zhang et al.(2015)提出對訓(xùn)練期內(nèi)樣本誤差進行質(zhì)量控制以剔除誤差異常值,從而更好地估計模式偏差以提高消除偏差集合平均的預(yù)報能力。另外,消除偏差集合平均存在與簡單集合平均類似的缺點,即該方法假設(shè)預(yù)報性能最差的模式在消除偏差后等同于最優(yōu)模式,因此依然存在預(yù)報局限性。
相比于等權(quán)多模式集成,不等權(quán)集成方案充分考慮了各個模式預(yù)報能力存在的差異。分配給多個模式的不同權(quán)重反映了該模式在訓(xùn)練期的相對表現(xiàn)能力,預(yù)報技巧越高的模式將被分配越大的權(quán)重,從而對預(yù)報期的貢獻越大。因此,不等權(quán)集成方案中權(quán)重的合理分配對集成預(yù)報結(jié)果具有重要影響。通常,不等權(quán)多模式集成方案的權(quán)重系數(shù)需要通過在訓(xùn)練期內(nèi)最小化某一檢驗指標(biāo)來計算得到,如均方根誤差(Krishnamurti et al.,1999),連續(xù)等級概率評分(Baran and Nemoda,2016)。
1.2.1 “點對點”誤差分析權(quán)重的多模式集成方案
多模式超級集合的概念最早是由Krishnamurti et al.(1999)提出,該方法通過在訓(xùn)練期中根據(jù)多個模式的預(yù)報性能,基于多元回歸最小二乘法來確定各個模式的權(quán)重,然后將權(quán)重應(yīng)用于預(yù)報期。
(3)
(4)
超級集合理論已被廣泛運用于許多氣象、水文等方面的天氣預(yù)報與氣候預(yù)測中(Taylor et al.,2012;智協(xié)飛等,2015a)。傳統(tǒng)的超級集合預(yù)報將在訓(xùn)練期得到的權(quán)重系數(shù)用于整個預(yù)報期的預(yù)報,但隨著預(yù)報時效的延長,各模式的權(quán)重會逐漸失效,于是超級集合預(yù)報技巧逐漸降低,甚至不如簡單集合平均。為此,智協(xié)飛等(2009)嘗試將訓(xùn)練期設(shè)為滑動窗口而不是傳統(tǒng)的固定某一時段,研究發(fā)現(xiàn)滑動訓(xùn)練期的長度會影響超級集合預(yù)報結(jié)果,且基于滑動訓(xùn)練期構(gòu)建的地面氣溫超級集合模型的預(yù)報技巧更高。如何定義最優(yōu)滑動訓(xùn)練期長度,Zhi and Ji(2018)提出隨著滑動窗口的增大,多個評估指標(biāo)逐漸減小或增大隨后趨于穩(wěn)定,則該時間窗口可作為最優(yōu)滑動訓(xùn)練期。
由于超級集合在訓(xùn)練期內(nèi)消除了模式預(yù)報與觀測之間的偏差并且在預(yù)報期加入了訓(xùn)練期內(nèi)的觀測平均值,因此其有一個重要的特點,即相對于所有參與集成的模式預(yù)報值,超級集合結(jié)果可以是一個更加貼近觀測的“異常值”。如Krishnamurti and Sanjay(2003)對臺風(fēng)降水進行超級集合,在所有單模式都預(yù)報偏弱的情況下,超級集合通過去除單模式的預(yù)報偏差以校正降雨量從而預(yù)報優(yōu)于最優(yōu)單模式。Jayakumar et al.(2013)研究表明超級集合還可以應(yīng)用于預(yù)報季風(fēng)期中的干旱期,超級集合預(yù)報的干旱爆發(fā)日期和持續(xù)時間都優(yōu)于最優(yōu)單模式。智協(xié)飛等(2015b)提出將多模式超級集合應(yīng)用于ENSO預(yù)測的目標(biāo)觀測敏感區(qū),其他區(qū)域則采用消除偏差集合平均,結(jié)果表明該方案表現(xiàn)出較高預(yù)報技巧的同時明顯減小了計算成本。對于降水氣候預(yù)測,Yun et al.,(2003)、Chakraborty and Krishnamurti(2009)提出利用奇異值分解、主成分分析等方法進行超級集合,預(yù)報技巧略高于傳統(tǒng)超級集合。此外,將超級集合與降尺度相結(jié)合,不僅能減小預(yù)報誤差還進一步提高了降水的距平相關(guān)系數(shù),并且對降水極大值具有一定的預(yù)報能力(Krishnamurti et al.,2009;王海霞和智協(xié)飛,2015)。陳超輝等(2010)利用多個有限區(qū)域模式,采用多種回歸方法進行短期超級集合預(yù)報,結(jié)果表明基于支持向量機回歸建立的多模式集成模型對風(fēng)速大小和分布均具有優(yōu)于多元線性回歸模型的預(yù)報能力。
隨著資料同化技術(shù)的發(fā)展,卡爾曼濾波(Kalman Filter,KF)方法得到廣泛運用。由于該方法具有較強的線性擬合能力,近年來已被逐步應(yīng)用到模式后處理中。Shin(2003)首次采用卡爾曼濾波方法進行多模式集成預(yù)報。Lenartz et al.(2010)對海溫進行了卡爾曼濾波多模式集成預(yù)報。Coelho et al.(2015)則將卡爾曼濾波方法應(yīng)用于洋流速度和路徑的多模式集成預(yù)報。研究均表明,卡爾曼濾波多模式集成提高了預(yù)報技巧且預(yù)報結(jié)果更加穩(wěn)定可靠,主要原因在于該方法可以將合理可靠的權(quán)重賦予給參與集成的多個模式,且各模式權(quán)重隨時間而變化。
智協(xié)飛和黃聞(2019)利用卡爾曼濾波、消除偏差集合平均、簡單集合平均等多種方法對中國地面氣象要素進行多模式集成預(yù)報,表明卡爾曼濾波整體對氣溫、降水和風(fēng)的改善效果最好且最穩(wěn)定。智協(xié)飛和趙忱(2020)研究表明基于卡爾曼濾波的超級集合對降水預(yù)報技巧高于基于線性回歸的超級集合和消除偏差集合平均。Zhu et al.(2021)通過基于卡爾曼濾波的超級集合模型顯著提高了次季節(jié)尺度氣溫、降水的預(yù)報技巧。吳柏瑩(2021)在前人的基礎(chǔ)上提出了復(fù)卡爾曼濾波(Augmented Complex Extended Kalman Filter,ACEKF),該方法將水平風(fēng)場分解為緯向風(fēng)(實部)和經(jīng)向風(fēng)(虛部),表明基于復(fù)卡爾曼濾波方法的多模式集成預(yù)報能夠明顯提高風(fēng)速和風(fēng)向的預(yù)報技巧和穩(wěn)定性,優(yōu)于消除偏差集合平均、基于線性回歸的超級集合以及單模式。
整體而言,超級集合的預(yù)報技巧要優(yōu)于消除偏差集合平均、簡單集合平均以及單模式,其高預(yù)報技巧來自逐點均方根誤差的區(qū)域平均最小化。此外,滑動訓(xùn)練期的應(yīng)用以及卡爾曼濾波等新的權(quán)重計算方法代替?zhèn)鹘y(tǒng)的多元回歸最小二乘法進一步提高了超級集合的預(yù)報能力。
1.2.2 基于降水對象的多模式集成
現(xiàn)有的多模式集成方案主要是在訓(xùn)練期階段基于“點對點”檢驗指標(biāo),如均方根誤差來計算各個成員模式的權(quán)重。但是隨著精細化預(yù)報的發(fā)展以及對于降水、風(fēng)這種具有較大時空不確定性的變量,逐點的檢驗評估存在“雙重懲罰”。這意味著即使完美地預(yù)報出雨區(qū)的面積和形狀,但雨區(qū)空間位置差異導(dǎo)致的漏報率和空報率也可能導(dǎo)致較差的“點對點”得分。為了彌補逐點評估存在的不足,基于對象的診斷評估方法(Method for Objected-based Diagnostic Evaluation,MODE)被提出,該技術(shù)基于用戶自主設(shè)定的卷積半徑和降水閾值來識別降水對象,從降水落區(qū)位置、雨團形狀、面積等多個對象屬性來檢驗降水預(yù)報(Davis et al.,2006)。
Ji et al.(2020)借助MODE空間評估方法,提出了基于降水對象(連續(xù)雨區(qū))的多模式集成方案。相比于傳統(tǒng)的“點對點”超級集合和最優(yōu)單模式,基于降水對象的多模式集成方案可以顯著提高雨區(qū)的落區(qū)位置預(yù)報。該方案首先分別識別觀測場和預(yù)報場中的降水對象,計算每個降水對象的屬性(面積、長寬比、軸角以及質(zhì)心位置),然后對比觀測場和預(yù)報場中降水對象之間的質(zhì)心距離以進行對象匹配,并通過模糊邏輯算法來計算匹配對象之間的相似度,從而確定預(yù)報準(zhǔn)確率。預(yù)報準(zhǔn)確率可以通過最大相似中值(Median of Maximum Interest,MMI)和/或基于對象的TS評分(fuzzy Object-based Threat Score,OTS)來量化。最后基于訓(xùn)練期內(nèi)MMI和/或OTS評分來計算各個模式的權(quán)重進行多模式集成。以MMI評分為例,公式如下:
(5)
(6)
基于降水對象的多模式集成方案的提出,在一定程度上彌補了傳統(tǒng)方案對空間不確定性較大的氣象要素的預(yù)報不足。隨著數(shù)值模式分辨率的提高以及空間檢驗方法的廣泛應(yīng)用,以空間檢驗因子為權(quán)重指標(biāo)的多模式集成方案會受到越來越廣泛的關(guān)注與研究。
由于大氣的非線性混沌特性,即使包含多模式信息的多模式集成確定性預(yù)報系統(tǒng)也無法提供所有的不確定性信息。因此,由單一確定性預(yù)報的“非無即有”向“亦有亦無”的多值的概率預(yù)報進行轉(zhuǎn)變已成為目前天氣預(yù)報的發(fā)展趨勢(智協(xié)飛等,2014)。
Johnson and Wang(2012)基于集合成員提出了對雨區(qū)進行概率預(yù)報,并且與邏輯回歸校正相結(jié)合,優(yōu)于基于累積分布函數(shù)(Cumulative Distribution Function,CDF)校正的預(yù)報結(jié)果。吳進等(2016)首先對產(chǎn)生降水的典型天氣影響系統(tǒng)進行分類,然后在不同天氣形勢下以預(yù)報準(zhǔn)確率定級的方式來計算各成員模式的權(quán)重。Vigaud et al.(2017)逐點對單模式預(yù)報結(jié)果進行擴展邏輯回歸,然后通過對多個模式預(yù)報概率等權(quán)平均可以得到可靠性高但銳度較低的概率預(yù)報結(jié)果,并且多模式集成在很大程度上消除了單模式的負面預(yù)報技巧。趙淵明和漆梁波(2021)對上游關(guān)鍵區(qū)域進行實時檢驗以獲得動態(tài)權(quán)重對下游地區(qū)進行多模式短時強降水集成概率預(yù)報,提高了預(yù)報的準(zhǔn)確性和穩(wěn)定性。
擴展邏輯回歸(Roulin and Vannitsem,2012)、分級技術(shù)(Yussouf and Stensrud,2006)、相似分析法(Hamill et al.,2015)、人工神經(jīng)網(wǎng)絡(luò)(Hall et al.,1999)、集合模式輸出統(tǒng)計(Scheuerer and Hamill,2015)、貝葉斯模式平均(Raftery et al.,2005)等方法已被廣泛地應(yīng)用于天氣要素概率預(yù)報中。但是,其中一些方法(如擴展邏輯回歸)并不能充分利用集合預(yù)報的完整信息,只能給出特定事件的概率,并非完整的預(yù)測PDF,另外一些方法則無法提供定量的預(yù)報不確定性。集合模式輸出統(tǒng)計(EMOS)和貝葉斯模式平均(BMA)既可以提供完整的預(yù)測PDF,也可以定量估計預(yù)報的不確定性。因此這兩種方法是目前基于多模式集成的概率預(yù)報中最為常用且有效的偏差訂正方法,本文將重點介紹其具體算法。
BMA最初應(yīng)用于滿足正態(tài)分布的變量如氣溫、海平面氣壓的定量化預(yù)報中,研究表明BMA預(yù)測PDF可以得到更好的校正,且比原始集合預(yù)報更加準(zhǔn)確可靠(Wilson et al.,2007;吉璐瑩等,2017)。
根據(jù)s-BMA原理,令M1,M2,…,MK表示K個不同模式的預(yù)報,在訓(xùn)練期數(shù)據(jù)yT下,預(yù)測變量y基于這K個不同模式的預(yù)測PDF為:
(7)
對于氣溫,gk(y|Mk)是正態(tài)PDF。隨后Sloughter et al.(2007)將BMA方法拓展至降水、風(fēng)等非正態(tài)分布變量的概率預(yù)報中。降水是一個在時間和空間上都高度不連續(xù)的變量,且存在無降水的情況。因此BMA方法分兩步來計算降水的預(yù)測PDF。第一步考慮是否有降水發(fā)生,第二步在降水非零的情況下用gamma分布來擬合開了三次方根后的降水PDF。BMA降水預(yù)測PDF如下:
0)+P(y>0|Mk)gk(y|Mk)I(y>0)〗。
(8)
其中,P(y=0|Mk)是指在預(yù)報Mk的條件下沒有降水的概率,通過邏輯回歸模型來擬合。P(y>0|Mk)是在預(yù)報Mk的條件下有降水的概率,gi(y|Mk)為gamma分布PDF。指示因子函數(shù)I()在滿足括號內(nèi)的情況下等于1,否則等于0。在參數(shù)估算時,F(xiàn)raley et al.(2010)提出來自同一預(yù)報中心的不同集合成員的BMA參數(shù)應(yīng)當(dāng)相同。
BMA多模式集成降水概率預(yù)報技巧普遍優(yōu)于邏輯回歸、原始集合預(yù)報等(Zhao et al.,2019;祁海霞等,2020)。但BMA確定性預(yù)報對中到大雨量級的降水預(yù)報能力有限,這主要是由于大雨樣本較少,影響了偏差訂正,進而影響了BMA模型參數(shù)的估計值。為此,Ji et al.(2019)提出了分級BMA多模式集成方案,將24 h累積降水量分為小雨(<10 mm)、中雨(10~25 mm)和大雨(>25 mm)三個量級,基于訓(xùn)練期內(nèi)多模式集合平均值,挑出各個量級的降水樣本,分別建立各個量級的BMA模型。研究結(jié)果表明,分級BMA的PDF更加集中,概率預(yù)報技巧更高,尤其是在預(yù)報時效較長的時候。Qi et al.(2021)還提出根據(jù)降水集合離散度進行BMA分級,提高了長江中下游降水預(yù)報水平。
對于風(fēng)速,Sloughter et al.(2010)提出可以直接用gamma分布來擬合原始風(fēng)速,即gk(y|Mk)是gamma分布PDF,結(jié)果表明BMA方法可以生成最大風(fēng)速的完整預(yù)測PDF,比原始集合預(yù)報得到了更好的校準(zhǔn)。此外,Sloughter et al.(2013)還提出通過二元正態(tài)分布來擬合二維風(fēng)矢量,預(yù)報結(jié)果優(yōu)于原始集合預(yù)報。需要注意的是,Sloughter et al.(2013)對原始數(shù)據(jù)進行了預(yù)處理,取其4/5次方,但這種特定的轉(zhuǎn)換并不一定是普遍適用的,因此在該方法運用中需要調(diào)試以找到最合適的冪轉(zhuǎn)換。Baran(2014)嘗試將截斷正態(tài)分布與BMA相結(jié)合,同樣提高了風(fēng)速預(yù)報準(zhǔn)確率。
BMA可能存在訂正過度的情況,會降低其對極端災(zāi)害事件的預(yù)報能力。Bishop and Shanley(2008)嘗試將先驗氣候信息加入到BMA集合后處理中,可以提高BMA對極端天氣的預(yù)報能力。Schmeits and Kok(2010)提出使用附加偏差來改進BMA對極端事件的預(yù)報技巧。
Gneiting et al.(2005)最早提出基于正態(tài)分布的集合模式輸出統(tǒng)計模型,應(yīng)用于氣溫和海平面氣壓的預(yù)報,得到了預(yù)報技巧更高的確定性預(yù)報和校準(zhǔn)更好的概率密度函數(shù)。對于氣溫等正態(tài)分布的變量,EMOS預(yù)測PDF可表示為:
p(y|M1,M2,…,MK)~N(a+b1M1+b2M2+…+
bKMK,c+dS2)。
(9)
其中:a+b1M1+…+bKMK表示正態(tài)分布的均值;c+dS2代表方差;S2為集合方差。EMOS模型參數(shù)θ=(a,b,c,d)可以通過在訓(xùn)練期優(yōu)化適當(dāng)?shù)臋z驗指標(biāo)(如連續(xù)等級概率評分、最大似然估計)計算得到。
Scheuerer(2014)將廣義極值(Generalized Extreme Value,GEV)分布與集合模式輸出統(tǒng)計模型相結(jié)合,對2011年德國6 h累積降水進行預(yù)報研究。GEV EMOS可以產(chǎn)生校準(zhǔn)和銳利的概率密度函數(shù)分布,并優(yōu)于擴展邏輯回歸和貝葉斯模式平均。此外,在GEV EMOS模型中加入鄰域信息可以進一步提高概率預(yù)報水平。Baran and Nemoda(2016)提出基于截斷位移gamma(Censored and Shifted Gamma,CSG)分布的集合模式輸出統(tǒng)計(CSG EMOS)方法,通過向左移動gamma分布將零降水量和非零降水的連續(xù)PDF同時考慮在內(nèi):
(10)
其中:αk和βk分別是gamma分布的形狀參數(shù)和尺度參數(shù);ηk<0為位移參數(shù),表示將CDF向左移動,將無降水的情況考慮在內(nèi)。CSG EMOS模型預(yù)報結(jié)果在概率校準(zhǔn)和逐點降水量預(yù)報方面略優(yōu)于GEV EMOS,并且整體優(yōu)于原始集合預(yù)報和BMA模型。
對于風(fēng)速,Thorarinsdottir and Gneiting(2010)提出采用在零處截斷的正態(tài)分布(truncated normal,TN)來解決預(yù)測變量非負的問題。Lerch and Thorarinsdottir(2013)將廣義極值分布(GEV)與EMOS模型相結(jié)合以提高德國逐日最大風(fēng)速預(yù)報水平。但該模型存在將正概率分配給負風(fēng)速的缺點,因此Baran and Lerch(2015)提出了對數(shù)正態(tài)分布(Log-Normal,LN)EMOS預(yù)測風(fēng)速模型。隨后,Baran and Lerch(2016)將截斷正態(tài)分布與對數(shù)正態(tài)分布相結(jié)合,表明TN-LN EMOS組合模型進一步提高了風(fēng)速概率預(yù)報準(zhǔn)確率,并且更好地校準(zhǔn)了原始集合預(yù)報,優(yōu)于TN EMOS和LN EMOS模型。
總體而言,BMA和EMOS模型均可以提高天氣預(yù)報準(zhǔn)確率,優(yōu)于原始集合預(yù)報、氣候預(yù)報等,并且兩個模型在多個天氣要素預(yù)報方面各有長短(Javanshiri et al.,2021;Ji et al.,2021)。尤其是對于降水,相比于將零處正概率與單獨的非負分布組合在一起的BMA模型,EMOS模型對在零處的某個適當(dāng)連續(xù)分布進行左刪使得零降水的概率可以直接從相應(yīng)的CDF中得出。然而,BMA和EMOS兩種方法都特別依賴于參數(shù)預(yù)測分布,這意味著必須提前指定預(yù)測分布并估計其參數(shù)。另外,BMA模型參數(shù)多于EMOS模型,因此需要足夠多的樣本數(shù)據(jù)來訓(xùn)練BMA模型以防止出現(xiàn)過度擬合的情況。目前國內(nèi)對BMA的應(yīng)用研究較多,關(guān)于EMOS模型的應(yīng)用還相對較少。
近年來,各種多模式集成技術(shù)得到快速發(fā)展,已成為國際上領(lǐng)先的氣象服務(wù)機構(gòu)廣泛使用的提高模式預(yù)測準(zhǔn)確率的非常有效的后處理統(tǒng)計方法。多模式集成算法不僅減小了由于模式初始條件、物理參數(shù)化、動力框架等所帶來的預(yù)報誤差,且計算過程相較于模式積分計算更為簡潔高效,提供了巨大的潛在經(jīng)濟效益(Krishnamurti et al.,2016)。本文針對地面氣象要素(氣溫、降水、風(fēng))從確定性預(yù)報和概率預(yù)報兩個角度介紹了多種應(yīng)用范圍較為廣泛的等權(quán)和不等權(quán)的多模式集成方案。
簡單集合平均和消除偏差集合平均計算簡單,但賦予所有模式相同的權(quán)重而忽略了模式之間預(yù)報性能的差異。不等權(quán)的多模式集成如超級集合則充分考慮了模式差異性,預(yù)報技巧較高的模式將被賦予較大的權(quán)重,從而能夠更加充分有效地利用多模式預(yù)報信息。通常,不等權(quán)的多模式集成預(yù)報技巧優(yōu)于等權(quán)多模式集成。
不同多模式集成方案依然存在一些共性問題,需要進一步探索。例如參與多模式集成的模式個數(shù)需要多少才足夠?是否越多越好?若剔除預(yù)報技巧相對較低的模式,能否進一步提高集成預(yù)報技巧?如Johnson et al.(2014)分別用13和11個全球耦合模式對1982—2001年進行季節(jié)氣候超級集合預(yù)測,結(jié)果表明在去除預(yù)報技巧最低的2個模式后,超級集合的預(yù)報評分得到了提升。此外,訓(xùn)練期的長度或是訓(xùn)練期內(nèi)多少樣本才能使權(quán)重穩(wěn)定?如果參與多模式集成的成員模式的動力或物理在訓(xùn)練期和預(yù)報期發(fā)生變化,那么在訓(xùn)練期得到的權(quán)重則不能充分地代表模式行為,也許會導(dǎo)致多模式集成預(yù)報技巧不如單模式?;瑒佑?xùn)練期的應(yīng)用在一定程度上能夠減小此類負面影響,是否還有別的更好的選擇也值得研究。
基于降水對象的多模式集成確定性預(yù)報模型,著重考慮了面積、長寬比、軸角和質(zhì)心位置這四個對象屬性。但隨著分辨率的增加,降水結(jié)構(gòu)變得越來越復(fù)雜,降水對象的形狀等特征很難在高分辨率下定義,或者長寬比、軸角這兩個屬性不足以描述降水對象的形狀。在今后的研究工作中,可以嘗試將更多的對象屬性考慮其中。并且,除MODE空間檢驗外,也可以嘗試使用基于模糊檢驗的分?jǐn)?shù)技巧評分(Fraction Skill Score,FSS;Roberts and Lean,2008)作為多模式集成模型計算權(quán)重的指標(biāo)。此外,如何構(gòu)建基于要素對象的多模式集成概率預(yù)報模型,以概率的形式預(yù)報高溫、強降水、大風(fēng)區(qū)的位置、范圍等對氣象防災(zāi)減災(zāi)具有重要意義。
已有研究對降水進行雨量分級多模式集成預(yù)報(Ji et al.,2019;Qi et al.,2021),同樣也可以研究風(fēng)速的分級預(yù)報,有利于對流性大風(fēng)、氣旋性大風(fēng)等災(zāi)害性大風(fēng)的預(yù)報預(yù)警。在分級預(yù)報中,通常強降水或強風(fēng)的樣本有限,可以通過空間窗口增加格點/站點來擴大目標(biāo)格點/站點的樣本量(Hamill et al.,2017;Lyu et al.,2021)。同時,也可以根據(jù)不同區(qū)域的氣候特征,將研究范圍劃分成多個子區(qū)域。同一區(qū)域內(nèi)的所有格點/站點的預(yù)報信息共同組成訓(xùn)練樣本以擴充樣本量,則同一域內(nèi)不同格點/站點具有相同的模型參數(shù),而不同區(qū)域模型參數(shù)則不同(Zhu et al.,2010)。
近年來,計算機技術(shù)的發(fā)展促進了機器學(xué)習(xí)相關(guān)理論的發(fā)展和完善。其中,神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)模型的一種,受到廣泛關(guān)注。大氣是非線性的,而神經(jīng)網(wǎng)絡(luò)對于數(shù)據(jù)間非線性的關(guān)系具有較好的擬合效果。研究表明,隨機森林、長短期記憶神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)、U-Net等機器學(xué)習(xí)模型比頻率匹配、集合偽偏差校正等傳統(tǒng)方法能更好地對溫壓風(fēng)濕等氣象要素進行訂正(Li et al.,2019;Han et al.,2021)。隨著機器學(xué)習(xí)的發(fā)展,可以嘗試將神經(jīng)網(wǎng)絡(luò)、支持向量機等方法與多模式集成技術(shù)相結(jié)合,以進一步提高天氣預(yù)報技巧。雷彥森等(2018)研究發(fā)現(xiàn)基于遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)的多模式集成對地面氣溫的預(yù)報比超級集合等線性集成預(yù)報更加準(zhǔn)確。智協(xié)飛等(2020)采用LSTM對中國地區(qū)2 m氣溫進行多模式集成預(yù)報,試驗表明LSTM顯著提升了我國多數(shù)地區(qū)的氣溫預(yù)報水平,優(yōu)于消除偏差集合平均和超級集合預(yù)報。目前,基于機器學(xué)習(xí)的多模式集成技術(shù)研究較少。并且現(xiàn)有的方法主要是針對溫度等連續(xù)變量的確定性集成預(yù)報,對降水、風(fēng)等非連續(xù)變量以及概率預(yù)報方面需要進一步研究。