亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        集合預報統(tǒng)計學后處理技術(shù)研究進展

        2020-06-03 03:43:58蘇翔袁慧玲
        關鍵詞:后處理方法模型

        蘇翔 袁慧玲

        (1 江蘇省氣象臺,南京 210008;2 中國氣象局交通氣象重點開放實驗室,南京 210009; 3 南京大學大氣科學學院中尺度災害性天氣教育部重點實驗室,南京 210023)

        0 引言

        集合預報是表達預報不確定性的重要手段[1-2],在天氣預報、氣候預測和水文預報等方面具有重要應用[3-6]。大量研究表明,集合預報相比于單一的確定性預報具有更高的經(jīng)濟價值[7-10]。然而集合預報系統(tǒng)由于同化方案、初值擾動、模式設計、集合成員數(shù)等方面的不完美,常存在一階系統(tǒng)偏差和二階離散度偏差[11-14]。因此,模式原始輸出的集合預報需要進行統(tǒng)計學后處理,糾正系統(tǒng)偏差、調(diào)整離散度,以提升集合預報的可靠性(reliability)和準確率(accuracy)。

        數(shù)值預報的統(tǒng)計學后處理方法已有較長的研究歷史。例如早期的完美預報法(perfect prog,PP)[15]和后來的模式輸出統(tǒng)計法(model output statistics,MOS)[16],都是針對單一確定性的原始預報,糾正一階系統(tǒng)偏差,輸出單一的確定性預報。此外,集合預報的統(tǒng)計學后處理還可根據(jù)需要調(diào)整二階離散度偏差,產(chǎn)生連續(xù)的概率分布或者代表連續(xù)分布抽樣的離散集合成員,方法更加新穎和復雜。由于數(shù)值模式版本的不斷更新,集合預報的系統(tǒng)偏差可能會發(fā)生改變。回算預報(reforecast)[17-18]數(shù)據(jù)采用與實時模式相同的模式版本對過去幾十年的預報進行回算,可為集合預報統(tǒng)計學后處理提供誤差特征一致性較好的大樣本訓練數(shù)據(jù)。

        畢寶貴等[19]和代刊等[20]系統(tǒng)介紹了定量降水集合預報的統(tǒng)計學后處理技術(shù);Li等[21]詳細介紹了水文集合預報中的統(tǒng)計學后處理方法;Duan等[22]在最新的水文集合預報的參考手冊中回顧了氣象集合預報和針對水文應用的常用集合天氣預報后處理技術(shù),以及水文集合預報的后處理方法。本文將從更寬的視角整理和歸納現(xiàn)有重要的集合預報統(tǒng)計學后處理技術(shù)方法,首先對單變量集合預報統(tǒng)計后處理方法進行全面系統(tǒng)的整理歸納,然后拓展到須考慮變量依賴性結(jié)構(gòu)的多變量集合預報統(tǒng)計后處理方法,之后再介紹多模式集合預報和機器學習方法,最后是全文總結(jié),并討論了常用的集合預報統(tǒng)計后處理方法以及需要注意的問題。

        1 單變量集合預報統(tǒng)計后處理

        表1和表2分別整理和歸納了部分參數(shù)化和非參數(shù)化的單變量集合預報統(tǒng)計后處理方法。下面選取常用的單變量集合預報的統(tǒng)計后處理方法進行介紹。

        1.1 邏輯回歸

        邏輯回歸(logistic regression,LR)是一種廣義線性回歸模型,常用于二分類預測問題。Hamill等[23]利用歷史回算數(shù)據(jù)集將LR方法應用于地面氣溫和降水的中期集合概率預報中。由于LR僅能得到有限個數(shù)閾值的概率預報而非完整的概率分布,Wilks[24]將因變量的閾值引入回歸方程中作為自變量來獲得完整的概率分布預報,提出擴展邏輯回歸(extended logistic regression,ExLR)。Ben Bouallègue[25]認為ExLR中固定模型預報因子系數(shù)的做法過于刻板,限制了模型的靈活性,因此引入交互項對ExLR進行修改,提出了第二代擴展邏輯回歸(ExLR2)。此外,還有有序邏輯回歸(ordered LR)和刪失邏輯回歸(censored LR)[26]等類似的集合預報后處理方法。

        1.2 非均勻回歸

        非均勻回歸(nonhomogeneous regression,NR)也叫集合模式輸出統(tǒng)計(ensemble model output statistics,EMOS)方法,預先假定預報物理量服從某種數(shù)學分布,然后建立集合預報自變量與分布之間的函數(shù)關系,進而求解連續(xù)概率預報分布函數(shù)。NR模型的概率分布函數(shù)可根據(jù)集合預報的離散度大小反映預報的不確定性。

        1.2.1 高斯分布的非均勻回歸

        Gneiting等[27]提出了應用于高斯分布型物理量(溫 度或氣壓等)的非均勻高斯回歸(nonhomogeneous Gaussian regression,NGR)方法。Messner等[28]通過估計回歸系數(shù)的方法自動選擇合適的輸入變量,建立了最高和最低溫度的集合預報NGR模型。Sansom等[29]在全球氣候變暖背景下,考慮到系統(tǒng)偏差隨時間的變化,加入時間變化項,將NGR集合預報統(tǒng)計后處理拓展到季節(jié)預報中。M?ller等[30]在NGR模型中考慮誤差的自相關性,提出自回歸集合模式輸出統(tǒng)計方法(Autoregressive EMOS,AR-EMOS),改善了原始NGR模型欠離散的問題。Siegert等[31]使用bootstrap方法(自展法,即一種有放回的增廣統(tǒng)計樣本的抽樣法)考慮NGR模型參數(shù)估計的不確定性。

        1.2.2 非高斯分布的非均勻回歸

        一些非負物理量(如風速、降水量等)不滿足高斯分布,如果在零值處的連續(xù)性較好(如風速),可通過合適的數(shù)學變換(如冪變換或?qū)?shù)變換等)將物理量先轉(zhuǎn)換為準高斯分布,再使用NGR模型進行統(tǒng)計后處理;若非負物理量在零值處具有顯著的不連續(xù)性,例如降水量,有時其概率分布在零值處呈現(xiàn)明顯的“概率長釘”,會導致準高斯變換以及常規(guī)的連續(xù)分布函數(shù)不適用,需要結(jié)合“截斷”(truncation)或“刪失”(censoring)技術(shù)進行NR建模。

        對于風速集合預報,Thorarinsdottir等[32]采用零值截斷的正態(tài)分布(truncated normal,TN)模型,Lerch等[33]對TN分布模型、廣義極值(generalized extreme value,GEV)分布模型以及TN-GEV轉(zhuǎn)換混合模型進行了對比。Baran等[34]提出了對數(shù)正態(tài)(lognormal,LN)分布模型以及TN-LN轉(zhuǎn)換混合模型,并與TN分布模型、GEV分布模型以及TN-GEV轉(zhuǎn)換混合模型進行對比。之后,Baran等[35]又進一步提出了TN-LN加權(quán)混合模型。

        對于降水集合預報,Bentzien和Friederichs[36]使用混合模型進行模擬,零降水概率采用LR分布,非零降水分布函數(shù)分別采用LN、gamma和逆高斯分布,并提出對于極端降水采用廣義帕雷托分布(generalized Pareto distribution,GPD)可以更好地擬合高值降水的尾端部分。此外,降水集合預報的NR模型分布還包括左刪失GEV分布[37]和刪失偏移gamma(censored shifted gamma,CSG)分布[38-39]等。

        表2 單變量非參數(shù)化集合預報統(tǒng)計后處理技術(shù)列表 Table 2 List of univariate nonparametric ensemble statistical postprocessing methods

        1.2.3 基于標準化距平的非均勻回歸

        Dabernig等[40]研究發(fā)現(xiàn):如果將不同時間不同站點的變量做標準化距平處理,可去除誤差的季節(jié)和地域性差異,從而可以用所有樣本建立統(tǒng)一的模型;提出了基于標準化距平的非均勻回歸方法,也叫“標準化距平模式輸出統(tǒng)計法”(standardized anomaly model output statistics,SAMOS)。SAMOS的優(yōu)點在于全場只需建一個模型,可用于無觀測區(qū)域的預報訂正,且不需要頻繁滾動更新模型參數(shù)。而從變量標準化距平還原到變量本身,還需要計算氣候背景場的均值和標準差。Dabernig等[40]采用基于位置、尺度和形狀的廣義可加模型(generalized additive model for location, scale and shape,GAMLSS)[41-42]對所有站點同時擬合氣候均值和標準差。Stauffer等[43]進一步結(jié)合歐洲中期天氣預報中心(ECMWF)回算預報數(shù)據(jù),使用左刪失冪變換的邏輯分布將SAMOS應用于復雜地形條件下的降水集合預報訂正。Dabernig等[44]也采用SAMOS方法對同一起報時間不同預報時效的溫度集合預報統(tǒng)一建模,大大加快了模型的計算速度同時獲得了與傳統(tǒng)方法相當?shù)念A報技巧。

        1.3 貝葉斯模型平均

        貝葉斯模型平均(Bayesian model averaging,BMA)是多個概率分布的加權(quán)組合,每個概率分布都以偏差訂正后的集合成員為中心。

        1.3.1 高斯分布的貝葉斯模型平均

        Raftery等[45]最早將BMA方法用于溫度和海平面氣壓這類高斯分布型變量的統(tǒng)計后處理中。Wilson等[46]應用BMA來訂正加拿大集合預報系統(tǒng)的溫度預報。Kleiber等[47]將BMA拓展為空間可變模型參數(shù)并用于溫度集合預報的后處理,提出了地理統(tǒng)計模型平均(geostatistical model averaging,GMA)方法。

        1.3.2 非高斯分布的貝葉斯模型平均

        Sloughter等[48]采用混合分布將高斯分布型變量的BMA模型拓展到降水變量中,結(jié)合冪變換,對零降水部分采用LR模型,非零降水部分采用gamma分布構(gòu)造降水的分布函數(shù),并通過gamma分布的均值和方差搭建分布參數(shù)與預報之間的關系。Schmeits等[49]考慮集合成員的可交換性,將零降水概率中的成員系數(shù)設為相等,并將gamma分布方差中的系數(shù)也設為不隨集合成員變化。Kleiber等[50]將基于地理統(tǒng)計信息的GMA方法用于降水概率預報。

        與降水分布相比,風速的分布也屬于非高斯分布,但不需要將零值部分的概率單獨處理。Sloughter等[51]采用gamma分布對風速集合預報進行了BMA統(tǒng)計后處理。Bao等[52]采用常用于模擬角度數(shù)據(jù)的Von Mises分布將BMA用于地面風向集合預報訂正。Chmieleck等[53]采用β分布將BMA用于能見度概率預報。Baran[54]參考Thorarinsdottir等[32]采用TN分布將BMA用于風速集合預報訂正。

        1.4 集合敷料法

        集合敷料法(ensemble dressing)最初由Roulston等[55]提出,考慮每個集合成員預報誤差的概率分布,以偏差訂正后的集合成員為中心估計單個集合成員的概率分布(核密度,kernel density),再對所有集合成員的核密度進行平均得到集合預報整體的概率分布。Roulston等[55]提出了“最優(yōu)成員集合敷料法”,Wang等[56]則對其改進加入二階矩約束條件,但不適用于集合預報過離散的情況。Fortin等[57]對此做了進一步改進,基于β分布使用不同核密度、不等權(quán)重的集合敷料法,對集合預報過離散和欠離散的情況均適用。Br?cker等[58]基于高斯分布提出“仿射核密度敷料法”(affine kernel dressing,AKD),考慮將氣候分布加入集合成員以增加概率預報的健壯性。Glahn等[59]提出的集合核密度模式輸出統(tǒng)計法(ensemble kernel density MOS,EKDMOS)需通過經(jīng)驗公式調(diào)整集合離散度,而Veenhuis[60]則根據(jù)不同站點之間的差異以及離散度與集合平均誤差的關系(spread-skill relationship)調(diào)整EKDMOS中的集合離散度。

        1.5 非參數(shù)化統(tǒng)計后處理方法

        1.5.1 排序直方圖訂正

        早期Hamill等[61]基于排序直方圖檢驗對降水集合預報進行訂正以提升概率預報的可靠性。首先根據(jù)集合平均和對應觀測對集合成員做去偏差處理(負降水處理為0值),并從小到大排序得到偏差訂正后的集合成員。對不超過最大集合成員的分位值采用線性插值計算概率,對超過最大集合成員的分位值則采用Gumbel分布進行擬合。

        1.5.2 可靠性曲線訂正

        Flowerdew[62]根據(jù)可靠性曲線對溫度、氣壓、風速和降水等地面變量集合預報進行了訂正。為保證充足的統(tǒng)計樣本僅使用5個概率區(qū)間,將區(qū)間內(nèi)平均預報概率訂正為相應的觀測頻率,并結(jié)合線性插值構(gòu)建訂正后的累積分布函數(shù)(cumulative distribution function,CDF)曲線,最后再通過等概率切割從CDF曲線還原到集合成員。

        1.5.3 杜-周排序法

        杜-周排序法(Du-Zhou Ranking)[63]根據(jù)集合平均判斷集合成員的相對優(yōu)劣,從而進行排序加權(quán)以改進集合預報。此法的優(yōu)點是不需要觀測資料,在數(shù)值模式?jīng)]有太大偏差時效果較好。

        1.5.4 衰減平均偏差訂正

        Cui等[64]介紹了一種衰減平均偏差訂正(decaying average bias correction)方法用于北美集合預報系統(tǒng)(North American ensemble forecast system,NAEFS)的35個高斯分布型變量的偏差訂正。該方法的思路是首先計算每一個格點和每一個預報時效的偏差,然后采用自適應卡爾曼濾波型的衰減平均方法估計平均系統(tǒng)偏差,訂正后的預報值為原始預報減去平均系統(tǒng)偏差。

        1.5.5 概率匹配和頻率匹配

        E b e r t[65]最早提出概率匹配(p r o b a b i l i t y matching,PM)的思想。假定集合平均預報具有較好的空間分布,而集合成員預報在量級上有更高的準確度,PM方法將全場所有N個格點的集合平均預報與N×M個集合成員預報(M為集合成員數(shù))分別排序后進行概率密度函數(shù)(probability density function,PDF)匹配,然后將每個格點對應的集合平均值替換為排序?qū)腗個集合成員預報值的平均。PM方法多用于中小尺度降水集合預報用于產(chǎn)生確定性預報產(chǎn)品[66-70]。需要注意的是,PM方法采用集合成員進行匹配,并沒有使用觀測數(shù)據(jù),如果采用觀測資料對不同閾值下的降水進行匹配就變成了頻率匹配法(frequency matching method,F(xiàn)MM)[71-73],該方法在國內(nèi)也得到了廣泛的推廣和應用[74-75]。李俊等[72]進一步指出,若對降水預報先做簡單的集合平均,再應用FMM方法對集合平均進行偏差訂正,效果會更好,因為這樣既可以訂正雨區(qū)位置,又訂正了降雨量。

        1.5.6 分位數(shù)映射

        分位數(shù)映射(quantile mapping,QM)與FMM具有一定相似之處,通過估計預報和觀測的CDF分布,然后對不同的分位數(shù)進行頻率匹配。QM在天氣、水文和氣候集合預報的偏差訂正方面應用廣泛[38,76-81]。

        1.5.7 分位數(shù)回歸

        分位數(shù)回歸(quantile regression,QR)方法最早由Koenker和Bassett[82]提出。Bremnes[83]將QR引入降水集合預報的后處理中,Bentzien和Friederichs[84]也將QR方法應用于降水集合預報的訂正,此外QR在風能概率預測[85-86]和全球輻射集合預報[87]的后處理等方面也有應用。

        1.5.8 最優(yōu)百分位和最優(yōu)評分法

        最優(yōu)百分位[20,88]是中國氣象局國家氣象中心根據(jù)預報員經(jīng)驗發(fā)展起來的降水集合預報客觀訂正技術(shù),對不同的降水閾值尋找評分最優(yōu)的集合百分位進行映射,參考了PM方法的思想。2013—2015年夏季降水的TS(Threat Score)評分表明,該方法不亞于預報員的主觀預報[88]。吳啟樹等[89]設計的最優(yōu)評分法也用到了評分最優(yōu)的思想,對不同降水閾值尋找評分最優(yōu)的預報訂正值進行映射。

        1.5.9 逐成員訂正

        逐成員訂正(member-by-member,MBM)的名稱由Van Schaeybroeck等[90]提出,考慮先通過平移訂正集合預報的一階偏差,再以平移后的集合平均為中心進行拉伸以訂正二階離散度偏差。該思想與方差膨脹法(variance inflation,INFL)[91-93]、平移拉伸法(shift-and-stretch)[94]、變量誤差回歸方法(errorin-variables regression或error-in-variables MOS,EVMOS)[95-97]都有類似之處,故上述三種方法也可與MBM方法歸為一類。

        1.5.10 相似法

        相似法(analog)首先尋找與當前預報場特征最相似的歷史樣本,然后用相似樣本對應的觀測組成新的集合預報,常用回算預報數(shù)據(jù)作為訓練樣本。Hamill等[98]建立了基于相似法的集合預報后處理理論并用于降水概率預報后處理。Hamill等[99]在相似法中加入了補充位置訓練樣本,有效提升了降水集合預報性能。Delle Monache等[100-101]定義了多物理量相似度指標來尋找相似樣本。Junk等[102-103]提出了一種基于CRPS(continuous ranked probability score)評分最小化的蠻力法(a brute-force CRPS minimization)計算最優(yōu)的預報因子權(quán)重。Junk等[102]在風能集合預報的后處理中增加了潛在有用的預報因子數(shù)量,并通過主成分分析進行因子降維。Junk等[103]提出了一種基于相似法的EMOS方法(analog-based EMOS)用于訂正100 m風能集合預報,并與相似法、EMOS方法和Pinson[104]的自適應風矢量訂正(adaptive wind vector calibration,AUV)進行對比。Yang等[105]采用雙預報因子組合(dual-predictor combinations)的方法將兩個模式的多個預報因子進行加權(quán)組合。Scheuerer等[106]則將非參數(shù)化的相似方法與參數(shù)化的CSG NR方法相結(jié)合進行了降雪概率預報。杜鈞和李俊[107]指出,回算預報相似法在中期暴雨預報中也有特殊效果,顯著優(yōu)于多模式中期集合預報。Du等[108]提出的regime dependent偏差訂正法也是基于相似法的同一思想,即用過去相似天氣形勢下的預報誤差來訂正當前的預報。此外,相似法在臺風路徑和強度的集合預報后處理方面也有較多應用[109-111]。

        1.5.11 鄰域法

        隨著計算資源的不斷提升,對流允許(convection allowing)模式可在強天氣模擬中產(chǎn)生更加精細的物理量(如大風、強降水)結(jié)構(gòu)特征,同時也帶來了更多位置和時間上的不確定性。Theis等[112]提出了一種利用確定性模式格點的時空鄰域預報生成概率預報的方法,隨后Schwartz等[113]將該鄰域法拓展到集合預報的后處理中,提升了原始集合預報的可靠性。Blake等[114]根據(jù)集合成員在不同尺度下的離散度[115-116]提出自適應鄰域半徑法,用于對流尺度集合預報的后處理,提升了概率預報性能。鄰域法的特點是簡單易用且節(jié)省計算資源,鄰域半徑的選取通常取決于假定模式在何種尺度上預報準確。Ben Bouallègue等[117]將這種進行格點平滑卻不改變預報格距的鄰域法稱為模糊(fuzzy)概率預報,并提出了另一種增大預報格距的升尺度(upscaling)鄰域法。

        1.5.12 基于對象的概率預報方法

        傳統(tǒng)的點對點檢驗評估已不能適應逐步發(fā)展的高分辨率對流允許模式,Davis等[118-119]提出基于對象的診斷評估方法(method for object-based diagnostic evaluation,MODE),通過識別預報場和觀測場中的目標對象,對兩場中不同對象的不同屬性進行分析,并計算表征兩對象總體相似度的“總體興趣值”(total interest)用于對象之間的匹配。Johnson等[120]將MODE方法用于對流允許集合預報的后處理,對從不同集合成員中提取的對象進行匹配和歸類,從而獲取不同預報對象的概率值。

        1.5.13 虛擬降水法

        Yuan等[121]基于大氣整層可降水量分別構(gòu)造了模式預報和分析場的“虛擬降水場”,通過集合預報的“虛擬降水場”來訂正降水預報偏差。該方法針對降水量在零值處的不連續(xù)性問題,可對一般統(tǒng)計方法難以訂正的降水干偏差(模式降水為0)進行一定程度上的改進。

        2 多變量集合預報統(tǒng)計后處理

        使用上一章介紹的單變量集合預報統(tǒng)計后處理方法分別訂正不同變量僅能得到相互獨立的集合預報,而在實際應用中常需要獲得在時間和空間上具有依賴性結(jié)構(gòu)的多變量集合預報[122]。一種后處理方法是對單變量集合預報參數(shù)化后處理方法進行拓展,獲得多變量的聯(lián)合概率分布,而在這過程中需要估計較多參數(shù),因此適用于變量維數(shù)較低的情況;另一種方法是采用非參數(shù)化方法,無須獲得模型完整的聯(lián)合概率分布,而是基于特定預報或觀測排序結(jié)構(gòu)的依賴模板(dependence template)對單變量概率分布進行抽樣和重新排序,適用于變量維數(shù)較高的情況。表3整理和歸納了部分需要考慮依賴性結(jié)構(gòu)的多變量集合預報統(tǒng)計后處理方法。

        表3 多變量集合預報統(tǒng)計后處理技術(shù)列表 Table 3 List of multivariate ensemble statistical postprocessing methods

        2.1 多變量參數(shù)化統(tǒng)計后處理方法

        對于特定預報時效和特定的單個變量,我們可以先通過單變量集合預報統(tǒng)計后處理方法得到單變量的邊緣分布函數(shù),再通過參數(shù)化方法選擇合適的連接函數(shù)(copula),就可得到具有依賴性結(jié)構(gòu)的多變量聯(lián)合分布函數(shù)。

        Schuhen等[123]基于雙正態(tài)概率分布提出了一種適用于二維風矢量的NR模型,Sloughter等[124]采用類似的方法提出了一種適用于二維風場的BMA模型。M?ller等[125]利用高斯連接函數(shù)將5種天氣變量的BMA邊緣分布有機結(jié)合。Baran 等[126]、Baran等[127]分別采用BMA和NR模型對風速和溫度集合預報進行了聯(lián)合后處理。

        多變量參數(shù)化后處理方法除了可用于產(chǎn)生不同天氣變量之間的聯(lián)合分布以外,還可用于生成具有空間相關性的預報。地理統(tǒng)計輸出擾動(geostatistical output perturbation,GOP)方法是一種將單一確定性預報結(jié)合模擬誤差場生成具有空間相關性的集合預報的方法[128]。Berrocal等[129]將BMA方法與GOP相結(jié)合,提出了一種可同時產(chǎn)生全場溫度概率預報的空間BMA方法,顯著降低了計算量,在保留集合預報流依賴信息的同時考慮了觀測場的空間結(jié)構(gòu)特征。Feldmann等[130]則將GOP與NR方法相結(jié)合用于溫度概率預報。

        此外,還有一些考慮時間相關性的多變量參數(shù)化后處理方法研究。Sch?lzel 和Hense[131]將高斯核函數(shù)集合敷料法拓展到雙變量用于估計集合預報系統(tǒng)在時間上的自協(xié)方差,獲得區(qū)域氣候模擬的溫度平均和趨勢的聯(lián)合概率分布。Hemri等[132]使用高斯連接將不同預報時效的NR后處理徑流集合預報相結(jié)合,獲得具有多時效一致性的聯(lián)合概率分布。

        2.2 多變量非參數(shù)化統(tǒng)計后處理方法

        當變量維數(shù)較高,參數(shù)化后處理方法需要處理復雜的模型和參數(shù)擬合,可能變得難以實施,而非參數(shù)化方法則有著計算簡便的優(yōu)勢,通過經(jīng)驗連接(empirical copula)對單變量集合預報統(tǒng)計后處理得到的邊緣分布函數(shù)的離散型隨機抽樣進行轉(zhuǎn)換,獲得具有時間、空間或多變量一致性的集合預報。

        2.2.1 集合連接耦合

        集合連接耦合(ensemble copula coupling,ECC)采用原始集合預報數(shù)據(jù)作為依賴模板對集合預報進行經(jīng)驗連接后處理,考慮了流依賴信息[133]。ECC假定集合成員之間是可交換的并且模式是完美的,即認為集合預報能夠充分反映實際的空間、時間和變量之間的相依性。Ben Bouallègue等[134]指出當集合預報的后處理不加區(qū)分地擴大集合離散度時,ECC會產(chǎn)生偏離實際的情形,這是因為原始集合預報對相關性結(jié)構(gòu)的歪曲在后處理之后被進一步放大,將ECC用于可靠性差的集合預報反而會進一步惡化集合預報信息。為了克服該問題,Ben Bouallègue等[134]提出了一種雙重ECC(dual-ECC)方法,假定預報誤差具有平穩(wěn)性,將連續(xù)預報時效的預報誤差的自相關部分加入ECC。

        2.2.2 Schaake 洗牌法

        Clark等[135]提出了Schaake洗牌法(Schaake shuffle,SS),采用歷史觀測數(shù)據(jù)作為依賴模板。Clark等[135]指出這里的SS方法由于使用固定的依賴模板,對于不同的大氣狀態(tài)無法區(qū)別對待,建議選用與當前預報的大氣狀態(tài)相似的歷史記錄日期作為依賴模板。受此啟發(fā),Schefzik[136]結(jié)合了Hamill等[98]和Delle Monache等[100]的相似集合預報概念提出了SimSchaake方法,解決了原始SS方法不包含流依賴信息的問題。SimSchaake方法選取歷史上與當前集合預報相似的集合預報對應的日期構(gòu)建依賴模板。而Scheuerer等[137]指出SimSchaake方法雖然優(yōu)于標準的SS方法[135],但存在兩個問題:一是若相似建立在集合預報上則應采用歷史回算預報數(shù)據(jù)尋找相似日期,而且即使如此也無法保證所選的相似回算預報與相應的觀測具有一致的依賴結(jié)構(gòu);二是在較長預報時效時由于預報技巧的下滑,預報場與觀測場偏離較大而失去意義。因此Scheuerer等[137]改為直接尋找歷史觀測數(shù)據(jù)子集使其與后處理之后的集合預報盡可能的相似,這里采用Br?cker[138]定義的兩個分布之間的散度反向衡量相似程度,提出最小散度SS法(minimum divergence Schaake shuラe,MDSS)。

        3 多模式集合與機器學習

        以上方法主要針對單模式集合預報系統(tǒng),而業(yè)務應用和實際預報中經(jīng)常使用多模式集合來預報天氣要素。第一節(jié)和第二節(jié)中的后處理方法均可以不同程度地應用到多模式集合。此外,隨著高性能計算機和并行計算方法的發(fā)展,近年來機器學習的方法也逐漸在集合預報統(tǒng)計后處理中有著越來越多的應用。表4列出了常見的多模式集合和機器學習方法。

        表4 多模式集合與機器學習方法列表 Table 4 List of multi-model ensemble and machine learning methods

        3.1 多模式集合

        Matsueda等[139]基于北半球500 hPa位勢高度場的研究發(fā)現(xiàn)簡單的等權(quán)重多模式超級集合優(yōu)于單一最優(yōu)集合預報。Yamaguchi等[140]研究了多模式超級集合在熱帶氣旋路徑預報方面相比于單個集合預報系統(tǒng)的優(yōu)勢。Zhou等[141]應用多模式區(qū)域集合預報使霧的預報得到了明顯的改善。Hagedorn等[142]指出多模式集合預報相比于單一集合預報的優(yōu)勢不僅僅在于誤差的相互抵消,還在于多模式集合預報具有更好的一致性和可靠性。Weigel等[143]也指出,多模式集合通過增加模式的不確定性,提升了集合離散度和概率預報的可靠性。智協(xié)飛等[144]基于TIGGE資料進行了地面氣溫和降水的多模式集合預報,提升了集合預報性能。

        也有學者指出,并非所有情況下多模式集合都顯著優(yōu)于單個集合預報。例如,Park等[12]也采用等權(quán)重的方法進行多模式集成,并與最優(yōu)的單個集合預報系統(tǒng)ECMWF進行比較,發(fā)現(xiàn)當ECMWF的集合離散度調(diào)整較好時,性能差異不大,而當ECMWF明顯欠離散時(例如在熱帶地區(qū)),多模式集合的優(yōu)勢凸顯;Johnson等[145]對ECMWF、NCEP和英國氣象局(United Kingdom Met Office,UKMO)的集合預報系統(tǒng)進行了偏差訂正、模式誤差權(quán)重集成以及離散度調(diào)整的后處理,并與單個集合預報系統(tǒng)進行對比,發(fā)現(xiàn)當單個集合預報系統(tǒng)之間的性能相似時多模式集成的優(yōu)勢并不明顯;Weigel等[146]的多模式季節(jié)溫度預測研究也證實了多模式集合優(yōu)于單個最優(yōu)集合預報系統(tǒng)是有條件的。

        在研究對比了多模式集合與單個模式集合之后,研究關注點開始轉(zhuǎn)向多模式集合與統(tǒng)計訂正后的單個模式的性能對比。Weigel等[143]發(fā)現(xiàn)氣候守恒校準后的單個集合預報系統(tǒng)與多模式集合預報性能相當。Hagedorn等[17]發(fā)現(xiàn)采用部分優(yōu)質(zhì)集合預報系統(tǒng)組成的多模式集合要好于采用全部集合預報系統(tǒng)組成的多模式集合,且采用回算預報資料對ECMWF集合預報系統(tǒng)進行訂正可消除系統(tǒng)偏差和離散度誤差,從而達到與優(yōu)質(zhì)多模式集合相媲美的效果。Hamill[147]則對24 h累積降水進行研究,也發(fā)現(xiàn)采用回算預報資料訂正后的ECMWF與多模式集成的效果相當,進而說明多中心數(shù)據(jù)共享和回算預報資料的應用均可有效提升集合預報性能。

        3.2 機器學習

        機器學習是人工智能(artificial intelligence,AI)的一個分支,通過數(shù)據(jù)驅(qū)動建立預報量與預報因子之間的非線性關系模型。隨著計算機資源的不斷提升以及海量氣象資料的不斷涌現(xiàn),機器學習在大氣科學領域得到蓬勃發(fā)展,并在集合預報后處理應用中廣泛應用。下面就一些常見的機器學習方法進行介紹。

        3.2.1 人工神經(jīng)網(wǎng)絡

        人工神經(jīng)網(wǎng)絡(artificial neural networks,ANN)是深度學習方法的基礎,通過可調(diào)節(jié)的權(quán)重將不同節(jié)點的非線性函數(shù)相互連接,模仿神經(jīng)系統(tǒng)形成多層網(wǎng)絡。通過學習訓練,ANN可以靈活地表示任意非線性函數(shù)。Yuan等[148]、Krasnopolsky等[149]使用ANN對降水集合預報進行后處理,Rasp等[150]則將ANN用于地面溫度集合預報的訂正,Manzato[151]使用ANN進行了冰雹集合預報。

        3.2.2 支持向量機

        支持向量機(support vector machines,SVM)是一種用于分類和回歸的監(jiān)督學習模型,可通過核函數(shù)將低維空間的非線性問題轉(zhuǎn)化為高維空間的線性問題進行回歸估計。陳超輝等[152]使用SVM進行了多模式降水和700 hPa流場的回歸預報取得了不錯的效果。黃威等[153]和孔慶燕等[154]也將SVM方法應用于降水集合預報中。Herman等[155]使用SVM方法進行了云頂和能見度的概率預報。

        3.2.3 隨機森林

        隨機森林(random forecasts,RF)是一種包含多個決策樹的分類和回歸模型,可糾正單個決策樹可能存在的過度擬合問題。RF方法在降水[156-158]、氣溫[159]、中尺度對流系統(tǒng)初生[160]和冰雹[161]的概率預報方面都有廣泛的應用。

        4 總結(jié)與討論

        本文全面系統(tǒng)地介紹了現(xiàn)有重要集合預報統(tǒng)計后處理技術(shù)的研究進展,為廣大集合預報相關的科研和業(yè)務工作者提供參考。下面就集合預報統(tǒng)計后處理中需要注意的幾點問題進行討論。

        1)不同的集合預報統(tǒng)計學后處理方法適用性不同且各有優(yōu)缺點。參數(shù)化后處理方法的優(yōu)點在于模型對訓練樣本量的要求不是很高,模型函數(shù)對歷史上未發(fā)生的事件具有一定的推演能力,模型占用存儲空間較小,只需存儲模型的若干參數(shù)值即可;缺點在于模型的準確性取決于預先假設的數(shù)學分布,可能會導致擬合的失真。非參數(shù)化后處理方法的優(yōu)點在于可以靈活地反映歷史訓練樣本中預報和觀測數(shù)據(jù)的統(tǒng)計關系,但缺點是對歷史上未發(fā)生過的事件缺乏外推能力,且為了獲得穩(wěn)定的統(tǒng)計模型需要較多的訓練樣本,模型所占的存儲空間相對較大。

        2)合理采集訓練樣本數(shù)據(jù)對集合預報后處理結(jié)果至關重要。集合預報偏差的統(tǒng)計學特征可能存在地域、季節(jié)、年份、不同預報時效等方面的差異,采集訓練數(shù)據(jù)時應盡量考慮樣本的時空代表性。此外,集合預報的偏差特征也可能隨模式版本的更新發(fā)生變化。使用回算預報數(shù)據(jù)作為訓練樣本則可以較好地解決樣本代表性以及模式版本更新的問題,可以獲得誤差特征一致性較好的大樣本訓練數(shù)據(jù)。許多研究表明,回算預報數(shù)據(jù)集可顯著提升集合預報的統(tǒng)計后處理性能,尤其是對極端事件的集合預報后處理效果明顯[17-18, 162-165]。

        3)全面客觀的檢驗評估才能科學地反映集合預報統(tǒng)計后處理效果。Wilks[166]指出在集合預報參數(shù)化后處理中常常通過最優(yōu)化某個特定評分(例如連續(xù)分級概率評分,CRPS)來估計參數(shù),然而這樣并不能保證提升集合預報的其他重要屬性,例如可靠性。一個好的集合預報系統(tǒng)應該是各方面綜合性能優(yōu)異,而不是僅僅在某些單一檢驗指標方面表現(xiàn)突出,因此在集合預報后處理性能評估方面應該對不同屬性加以考察以獲得綜合客觀的結(jié)論。

        4)統(tǒng)計后處理對于集合預報性能的提升有限。統(tǒng)計后處理本質(zhì)上是找出集合預報系統(tǒng)誤差(包括一階系統(tǒng)偏差和二階離散度偏差)的統(tǒng)計學規(guī)律并加以修正。如果集合預報系統(tǒng)本身可預報性差,系統(tǒng)誤差不具有穩(wěn)定的規(guī)律,統(tǒng)計后處理方法很難發(fā)揮作用,這時需要從動力上對集合預報系統(tǒng)本身加以改進。

        5)對于未來發(fā)展方向的展望。一是加強不同集合預報統(tǒng)計后處理方法的對比研究,總結(jié)不同方法的適用性和優(yōu)缺點,在此基礎上進行新方法的研發(fā);二是基于人工智能技術(shù)的不斷進步,使用機器學習挖掘海量氣象數(shù)據(jù)以提升集合預報性能;三是面向高分辨率模式的空間檢驗新技術(shù)正日益普及(MODE[118-119]),未來的集合預報后處理技術(shù)也會隨著檢驗技術(shù)的發(fā)展而發(fā)生變革;四是考慮時間、空間以及變量之間依賴結(jié)構(gòu)的多變量集合預報統(tǒng)計后處理技術(shù)將在水文、風能和天氣預報等領域得到廣泛應用。

        猜你喜歡
        后處理方法模型
        一半模型
        果樹防凍措施及凍后處理
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        乏燃料后處理的大廠夢
        能源(2018年10期)2018-12-08 08:02:48
        可能是方法不對
        3D打印中的模型分割與打包
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        乏燃料后處理困局
        能源(2016年10期)2016-02-28 11:33:30
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        日韩无套内射视频6| 日本女优在线一区二区三区| 国产成人无码综合亚洲日韩| 男女性高爱潮免费观看| 亚洲人成网站久久久综合| 久久精品国产亚洲不卡| 久久久久av综合网成人| 欧美精品人人做人人爱视频| 久草国产视频| 精品视频一区二区在线观看 | 综合图区亚洲另类偷窥| 无码日韩精品一区二区三区免费 | 国产av无码专区亚洲av| 亚洲成AV人在线观看网址| 在线观看的a站免费完整版| 成人一区二区免费中文字幕视频| √天堂中文官网8在线| 国产精品久久久久久久久久影院| 亚洲精品国产av日韩专区| 摸进她的内裤里疯狂揉她动图视频 | 国产主播福利一区二区| 亚洲色图在线视频观看| 日韩a级精品一区二区| 最近最新中文字幕| 国产美女高潮流白浆在线观看| 在线观看亚洲视频一区二区| 色综合久久久无码中文字幕| 亚洲精品久久久久中文字幕二区| 无遮挡很爽视频在线观看 | 亚洲中文字幕av天堂自拍| 成人区人妻精品一熟女| 久久亚洲成a人片| 国产精品一区二区三区在线观看| 亚洲成av人的天堂在线观看| 热99精品| 日韩视频午夜在线观看| 成人免费无码大片a毛片抽搐色欲 日本动漫瀑乳h动漫啪啪免费 | aa日韩免费精品视频一| 亚洲男同gay在线观看| 麻豆国产高清精品国在线| 一区二区三区日本在线|