羅聰,時洋,吳乃庚,張華龍,黃曉瑩,蘇冉
(1.廣東省氣象臺,廣東廣州510641;2. 廣東省生態(tài)氣象中心,廣東廣州510641;3.中國氣象局廣州熱帶海洋氣象研究所/區(qū)域數值天氣預報重點實驗室,廣東廣州510641;4.廣州市氣象臺,廣東廣州511430)
數字網格預報是現代天氣預報的核心業(yè)務,為精細的氣象服務提供了高時空分辨率的預報產品支撐。隨著人們對災害性天氣預報服務需求不斷增加,逐小時、對流尺度天氣預報的重要性日益凸顯,為了進一步提升時空無縫隙的網格降水預報能力,高分辨率數值模式的解釋應用是關鍵。童文雪等[1]針對對流降水預報發(fā)展了1 h更新循環(huán)的分步同化方案,有效提升了模式在12 h 時效內的降水預報能力;陳子通等[2-3]持續(xù)優(yōu)化熱帶區(qū)域數值天氣預報模式,進一步提升了強天氣過程預報能力和氣象要素預報精度。然而,由于中小尺度對流天氣系統的時空尺度小,其動力和物理過程也尚未被完全認識清楚,模式對降水預報的時空不確定性可能導致高空報率和低命中率[4]。
氣象學者發(fā)展了一系列基于數值預報的客觀釋用方法。這些方法總體上可分兩類,一類是直接針對定量降水進行統計訂正,例如,李俊等[5]應用頻率匹配法對集合降水預報進行訂正,改善了強降水預報效果;代刊等[6]總結了最優(yōu)百分位、概率匹配平均等系列集合定量降水釋用方法在業(yè)務中的應用;智協飛等[7-8]開展基于頻率匹配的降水多模式預報訂正,在減小降水量預報誤差的同時,也提升了降雨雨區(qū)面積預報與實況的吻合度。另一類則是將定量降水預報轉換為概率預報,以應對模式降水預報的時空不確定性,例如,Theis 等[9]采用鄰域概率法的思路,利用鄰域格點的定量預報計算得到中心格點的概率預報;潘柳杰等[10]利用鄰域法評估了ECMWF、JMA 和T639 三家模式在不同空間尺度上的預報能力;馬申佳等[11]同樣利用鄰域法檢驗了對流尺度集合預報在降水預報上的時空不確定性,并得到與其時空尺度相匹配的降水概率預報結果,提高了對流降水預報的技巧;劉雪晴等[12]開展了降水鄰域集合概率的尺度敏感性試驗,指出恰當的鄰域概率半徑可以得到更合理的降水概率預報;牛若蕓[13]則提出了基于最優(yōu)概率的降水量分級訂正預報方法,實現概率預報和降水量級預報的融合。
總體而言,以往研究大多圍繞集合預報開展日累積降水釋用和評估,對快速更新的高分辨率模式的降水訂正研究和業(yè)務應用并不多見。本文在前人研究工作的基礎上,針對華南區(qū)域GRAPES 快速更新循環(huán)同化預報系統(GRAPES_GZ_R 3 km)降水預報的時空不確定性,采用鄰域降水概率的思路,通過引入空間鄰域、時間滯后因子進行了GRAPES_GZ_R 3 km 預報產品訂正參數的確定,提出基于鄰域最優(yōu)概率閾值的逐時降雨分級訂正方法,并進行檢驗評估,旨在提高區(qū)域快速同化更新模式對降水的預報可參考性。
(1)華南區(qū)域GRAPES 快速更新循環(huán)同化預報模式資料。逐小時循環(huán)同化更新的24小時逐時降水預報(其中2019 年8 月起預報時效延長至30小時),空間分辨率為3 km,資料時長為2019—2020年,每年的4月1日—9月30日。
(2)實況資料。2019—2020 年,每年的4 月1日—9月30日,包括廣東省86個國家級自動氣象站和約3 000個區(qū)域自動氣象站的逐小時降水數據。
強降水是預報業(yè)務中的關注重點,因此本文選取2019年汛期(4—9月)廣東區(qū)域性暴雨過程[14]的資料用于建模訓練。利用空間鄰域概率和時間滯后集合的方法,將鄰域格點的確定性預報轉變?yōu)橹行母顸c的概率預報,并基于歷史訓練期的分級降水最優(yōu)概率實現定量降水訂正預報,選取2020年4—9月的資料用于檢驗。
由于中小尺度對流性降水具有明顯的空間分布非均勻性,高分辨率數值模式的降水預報通常也會出現較大的預報偏差,以往研究表明,鄰域法在訂正預報空間誤差上是一種較為有效的方法,因此,引入該方法對GRAPES_GZ_R 模式預報結果進行后處理,綜合格點鄰域范圍內的降水值,進而得到更優(yōu)化的降水預報結果。
首先,將小時雨量分為4 個等級,其取值記為Gk(k=1,2,3,4),依次對應0.1 mm、2 mm、10 mm、20 mm。
其次,對模式的降水場進行“0/1”二分類處理,即超過降水閾值Gk的格點記為1,反之為0,從而得到降水閾值Gk對應的二進制降水概率場BP(i,j),選擇適當的鄰域范圍對概率場BP(i,j)進行平均,即可得到中心格點的鄰域概率:
式中,i為經向格點,j為緯向格點,n為鄰域范圍內格點數,P(i,j)為Gk對應的鄰域概率場。
不難看出,鄰域窗大小的選擇將直接影響鄰域法得到的鄰域概率場的分布,即在多大空間尺度上模式預報性能最優(yōu),這是模式應用的關鍵問題。以往學者對鄰域窗的選擇通常采用圓形或正方形兩種類型,但Ebert[15]的研究表明,鄰域窗的形狀對鄰域概率的結果沒有明顯影響??紤]到方形的鄰域窗可以和數值模式的經緯格點相匹配,且計算相對簡便,因此,本文選擇正方形鄰域窗來計算降水的鄰域概率。
為了確定最優(yōu)的鄰域窗大小,需對不同鄰域半徑的鄰域概率進行檢驗。對于二分類事件的概率預報檢驗,存在很多標量準確性的量度標準,Brier 評分(BS)就是其中一種。BS 評分本質上是概率預報的均方誤差,且是一個負向評分,結果越接近0越好。BS及其斜率的計算公式如下:
式中,Pk為預報概率;Ok為實況概率,當實況事件發(fā)生則觀測為1,不發(fā)生則為0;rd為不同的領域半徑,SLP為BS隨鄰域半徑變化的斜率。
圖1為不同等級降水的BS評分隨鄰域半徑的變化。以小時雨量超過20 mm、6 h 預報時效為例(圖1a),鄰域半徑為3 km 的BS評分為0.021 3,而鄰域半徑為60 km 的BS 評分快速下降至0.009 3,但隨著鄰域半徑繼續(xù)增加,BS 評分下降幅度已經十分微弱,鄰域半徑為150 km 的BS 評分為0.007 9,僅僅比鄰域半徑為60 km 時下降了0.001 4,BS 斜率接近于0。對于10 mm、2 mm 和0.1 mm 以上的小時雨量,鄰域半徑分別在90 km、120 km、150 km 處,BS 斜率接近于 0,但當鄰域半徑達到60 km 時,各個等級降水的BS 下降均已成明顯變緩的趨勢,其余時效也表現出類似的變化趨勢。因此,綜合考慮BS 評分和計算效率,在實際業(yè)務中把60 km 作為鄰域窗半徑是較優(yōu)的選擇。
圖1 降水超過0.1(a)、2(b)、10(c)、20(d)mm/h的鄰域概率BS評分隨鄰域半徑的演變
為了進一步考慮模式不同時間起報的不確定性,引入時間滯后因子,以t0為當前起報時刻,選取t0-H~t0時刻內所有時次起報的模式預報場數據,分析不同時間滯后參數H對應的鄰域概率變化,以確定合理的時間滯后窗。
由于2019 年的GRAPES_GZ_R 模式預報時效僅為24 h,因此,圖2 僅給出了6 h、12 h、18 h 對應的鄰域概率BS 評分隨時間滯后的演變。以小時雨量超過20 mm、6 h 預報時效為例(圖2a),對比未考慮時間滯后(0 h)與時間滯后4 h 的鄰域概率場,BS 評分從 0.009 3 下降至 0.008 0,下降幅度為14.4%,但當滯后窗從4 h增加到5 h時,BS評分僅下降1.3%;隨著預報時效增加,BS 隨時間滯后窗擴展而下降的趨勢更加緩慢,在實際業(yè)務中將時間滯后窗定為4 h是較合理的選擇。
圖2 降水超過0.1(a)、2(b)、10(c)、20(d)mm/h的鄰域概率BS評分隨時間滯后的演變
鄰域法提供的是降水概率預報場,為了得到確定性降水訂正場,采用基于鄰域最優(yōu)概率閾值的降雨分級訂正方法,將降水量概率預報轉換為定量降水預報,具體步驟如下。
(1)利用2019 年4—9 月的資料用于建模,訓練所有氣象站點在不同降水等級Gk對應的鄰域概率Pk。
(2)從0~1每隔0.01設定一個概率閾值Pj,計算降水等級Gk在每個概率閾值下的TS評分TSkj。
(3)提取TSkj中最大值對應的概率閾值Pj(Max),作為降水等級Gk的最優(yōu)概率閾值OPk。
(4)對于任意格點,計算實時預報的鄰域概率場,由高到低逐級比較該點各預報等級的Pk和OPk,若Pk≥OPk,則停止判別,并賦值Gk為該點的逐時降水預報等級值,記為PGk;然后選取其鄰域范圍內的格點降雨預報結果fk,以及降水等級同為PGk的格點概率Pk,利用式(6)計算基于最優(yōu)概率的定量降水F(i,j),訂正流程見圖3。
圖3 逐時降水訂正流程圖
利用2019年的區(qū)域性暴雨過程資料統計分析(圖4,見下頁),以12 h預報時效為例,對于20 mm以上的小時雨量,最優(yōu)鄰域概率為10%,TS評分達到0.034,隨著概率閾值的增加,TS 評分迅速降低(圖4a),10 mm、2 mm 以上降水以及晴雨預報的最優(yōu)鄰域概率閾值分別為15%、25%和65%,相應的 TS 評分為 0.058、0.170 和 0.747??傮w而言,降雨越強,對應的最優(yōu)鄰域概率閾值越小。
圖4 12 h時效的不同鄰域概率下逐時降水TS評分
為了評估基于鄰域最優(yōu)概率的逐時降水訂正效果,本研究對2020年4月1日—9月30日的所有逐時起報時次的模型訂正結果進行檢驗,主要檢驗對象為晴雨準確率、強降水準確率和偏差(BIAS)。特別注意的是,2020 年 3 月 1 日起,GRAPES_GZ_R 的預報時效從24 h 延長至30 h,但由于無法利用2019 年的歷史數據對30 h 預報時效進行建模,因此只能將24 h 預報時效的參數應用于2020年的30 h預報時效。結果分析如下。
本方法采用的晴雨預報TS(TS_s)計算公式如下:
式中,NA 為有降水預報正確站(次)數,NB 為空報站(次)數、NC為漏報站(次)數,ND 為無降水預報正確的站(次)數。
圖5給出的是2020年汛期(4—9月)晴雨預報檢驗。GRAPES_GZ_R 的晴雨預報TS 并非簡單地隨預報時效增加而下降,而是呈現先降后升的變化:1 h 的TS 評分最高,達到0.900,1~6 h 內 TS呈下降趨勢,6 h的TS為0.823,在6~12 h內TS逐漸上升,12 h的TS達到0.853,隨后TS維持相對穩(wěn)定,介于0.85~0.86之間。
圖5 2020年汛期的晴雨預報檢驗
經過鄰域最優(yōu)概率訂正的晴雨TS 在1 h 預報時效達到 0.920,2~30 h 的 TS 維持在 0.89~0.90 之間,基本不隨預報時效增加而降低。與原始的GRAPES_GZ_R 模式預報相比,鄰域最優(yōu)概率訂正后的晴雨預報全部為正技巧,其中1 h 提升了2.2%,6 h 提升了8.4%,總體提升了約5.3%。上述結果表明,鄰域最優(yōu)概率法可以提升逐時降水的晴雨預報準確率,且訂正后的預報效果更為穩(wěn)定。
本研究定義的強降水標準為小時雨量超過20 mm,采用的檢驗標準包括強降水預報TS(TS_r,式(8))和預報偏差BIAS(式(9)),計算公式如下:
其中,NA 為強降水預報正確站(次)數,NB 為空報站(次)數,NC為漏報站(次)數。
圖6給出的是2020年汛期4—9月強降水預報檢驗。GRAPES_GZ_R 的強降水預報TS 隨時效有較明顯的變化:最高出現在2 h 時效,達到0.016,而3~6 h 的強降水TS 同樣處于較低水平,約0.007~0.009,與晴雨預報類似,其余時次強降水預報TS 介于0.008~0.012 之間,所有時效的強降水預報TS 平均約為0.01。經過鄰域最優(yōu)概率訂正后,強降水預報TS 均表現為正技巧,TS 較低的時次出現在 3~6 h 時效,從 6 h 時效起,TS 逐漸升高,12 h 時效的TS 最高達到0.022,隨后又逐漸降低,所有時效的TS 平均約0.014,高于原始模式預報。
圖6 2020年汛期的強降水預報檢驗
預報偏差BIAS 是天氣事件的預報次數與實際發(fā)生次數的比率,理想狀況為1,而BIAS>1表示預報高于實況頻率,BIAS<1則相反。然而在實際業(yè)務中,尤其是在面對可能致災的天氣時,由于存在空報和漏報的情況,TS 和BIAS 通常不能同時達到最優(yōu),BIAS=1 也未必是最優(yōu)選擇。GRAPES_GZ_R 模式在 1 h 時效的 BIAS 為 0.758,也反映開始階段模式的強降水預報偏弱,2~5 h 時效 BIAS 突增至4 左右,空報明顯增多,6 h 開始逐漸降低,12 h 后維持在1 左右,空報和漏報基本相當。訂正后,1~4 h 時效的BIAS 普遍高于模式預報,5 h 起 BIAS 逐漸降低,12 h 后同樣維持在 1 左右,與模式大致持平。
綜合強降水TS 和BIAS 表現可知,模式對強降水的預報能力并非單純隨預報時效增加而下降,而是在3~6 h 通常表現有所下降,6 h 后逐漸上升,在12 h前后表現較優(yōu),隨后又逐漸下降。訂正后的預報也表現出類似的變化特征,12 h 前后的訂正效果最為明顯。從BIAS 分析表明,對于模式前期預報能力較弱的時次,本方法主要是以更多的空報為代價來提升預報評分,后續(xù)可以考慮結合其他算法進行消空訂正以進一步提高TS 評分;而本方法對于模式12 h預報時效后的訂正,在空報和漏報上達到較好的平衡,BIAS接近1。
鋒面降水個例:2020 年 5 月 20 日下午到 22 日中午(北京時間,下同),廣東出現年內第一場“龍舟水”(每年5 月21 日—6 月20 日)強降水,其中21日夜間至22日早晨,受強雷雨云團影響,珠江三角洲出現大范圍的強降水,廣州黃埔區(qū)錄得最大1 h雨量167.8 mm,東莞東城區(qū)錄得最大3 h 雨量351 mm,均突破廣東“龍舟水”期間歷史極值。
5 月21 日20 時起,粵北的韶關和河源的南部有雷雨云團逐漸發(fā)展,并緩慢向西南方向移動,23時前后,云團移動至珠江三角洲的廣州和惠州一帶,強度不斷增強,同時移速變慢,在當地形成持續(xù)性強降水。以降水最為強烈的22 日03 時為例:21 日 14 時( 北 京 時 間 ,下 同 )起 報 的GRAPES_GZ_R模式第13 h時效(圖7b)盡管預報了22 日03 時廣州有強降水,但是范圍明顯偏小,位置偏西;進一步分析更早的模式預報(圖7c~7f)發(fā)現,10~13時起報的GRAPES_GZ_R模式普遍預測22 日03 時珠江三角洲地區(qū)將有強降水,但不同時次起報的位置和強度、范圍均有不同的偏差,表明模式預報的時空不確定性較大。采用空間鄰域和時間滯后訂正后的概率產品較準確地預報了廣州、東莞一帶為高概率的強降水中心(圖7g),并超過歷史統計的強降水最優(yōu)概率閾值(10%),表明該地區(qū)出現強降水可能性很大。訂正后的定量降水預報中心的時雨量超過50 mm(圖7h),盡管極值中心與實況仍有一定偏差。然而,由于模式多個時次均在粵東沿海預報有強降水,訂正后的結果也在該地區(qū)出現了空報,這也是本方法僅對降水采取時滯集成訂正存在的不足,后續(xù)或可加入風場等要素進行協同判斷以提升訂正效果。總體而言,訂正后的強降水落區(qū)和范圍與實況較為吻合,強降水TS 達到0.271,明顯高于同時次模式的強降水TS(0.155),也體現了本訂正方法對于具備一定范圍的鋒面降水訂正能力較好。
圖7 2020年5月22日03時降水實況(a),GRAPES_GZ_R模式不同時次起報的降水(b~f),領域概率法2020年5月21日14時起報的強降水概率(g)和小時降水量(h)
暖區(qū)降水個例:2020年6月5—9日,廣東出現了一次典型的暖區(qū)降水過程,其中6 月7 日凌晨起,受西南季風影響,珠江口東側沿海地區(qū)出現強降水云團并不斷發(fā)展,緩慢向東北方向移動,造成持續(xù)性強降水。
以7 日06 時為例:強降水主要位于廣東南部的汕尾和惠州、肇慶北部(圖8a),6 日20 時起報的GRAPES_GZ_R 模式10 h 時效(圖8b)對汕尾、惠州中部的強降水預報明顯偏弱,同時在廣州、韶關和河源交界地區(qū)出現了明顯的強降水空報,分析更早的16—19時起報的模式預報(圖8c~8f)發(fā)現,GRAPES_GZ_R 模式大部分預報了汕尾地區(qū)的強降水,但普遍沒有預報廣州、韶關和河源交界地區(qū)的強降水,同樣也漏報了惠州中部的強降水。經過空間鄰域和時間滯后訂正后的概率產品保留了汕尾的強降水中心預報(圖8g),并擴大了20 mm以上的降水預報范圍(圖8h),同時也對廣東中東部的強降水空報有一定的抑制作用。訂正后的強降水TS 達到0.164,高于同時次的模式強降水TS(0.058)。因此,對于一些模式能較穩(wěn)定預測的暖區(qū)降水個例,基于時滯集成的概率和定量訂正預報也能提供一定的分析參考,可作為快速循環(huán)同化模式業(yè)務應用的支撐技術。
圖8 2020年6月7日06時降水實況(a),GRAPES_GZ_R模式不同時次起報的降水(b~f),領域概率法6日20時起報的強降水概率(g)和小時降水量(h)
高分辨率數值預報的時空不確定性問題已經得到廣泛的關注,本文利用鄰域最優(yōu)概率方法對華南區(qū)域GRAPES 快速更新循環(huán)同化預報模式進行逐時降水訂正,提升了模式的晴雨和強降水客觀預報能力。
(1)采用鄰域法對GRAPES_GZ_R 模式降水概率計算時,其最優(yōu)鄰域半徑隨降水等級增加而減小,晴雨預報的最優(yōu)鄰域半徑可達150 km,而強降水的最優(yōu)鄰域半徑為60 km。
(2)通過引入時間滯后因子能進一步改善模式不同時間起報的不確定性。BS 評分隨著時間滯后窗的增加而進一步改善,但是預報時效越長,改善效果越不明顯,結合BS 評分確定了時間滯后窗為4 h。
(3)利用鄰域最優(yōu)概率法對2020 年的GRAPES_GZ_R 模式預報進行訂正,檢驗表明:晴雨預報和強降水預報均為正技巧。晴雨TS 評分達到0.89以上,與模式預報相比提升約5.3%,且預報效果更為穩(wěn)定,基本不隨預報時效增加而降低。強降水TS 評分呈先降后升趨勢,在12 h 時效前后預報效果最優(yōu),TS 評分達到0.022,隨后又逐漸降低,所有時效的TS 平均約0.014,高于原始模式預報。
綜上可見,采用鄰域最優(yōu)概率法對提高GRAPES_GZ_R 模式預報性能具有較為明顯的效果。不過,由于數據樣本的限制,本文重點討論了該方法對GRAPES_GZ_R 模式24 h 的改善效果,對于更長預報時效、以及該方法對其它業(yè)務數值模式的可適性還未進行分析。另外,盡管該方法能提高降水預報的TS 評分,但如何更好地消除空報和漏報仍然需要更多的后續(xù)研究。