張弛 陳國(guó)興 楊洪濤
摘要 現(xiàn)階段降水預(yù)報(bào)主要依靠數(shù)值天氣預(yù)報(bào)模式。但受物理參數(shù)化、計(jì)算資源等因素的影響,基于數(shù)值模式的降水預(yù)報(bào)還存在非常大的不確定性。近年來,深度學(xué)習(xí)在天氣預(yù)報(bào)領(lǐng)域顯示出巨大優(yōu)勢(shì)和潛力。本文通過構(gòu)建神經(jīng)網(wǎng)絡(luò)預(yù)報(bào)美國(guó)東北部日降水分布,探討神經(jīng)網(wǎng)絡(luò)模型基于低分辨率氣象場(chǎng)(ERA-Interim,0.7°)預(yù)報(bào)高分辨率降水(CPC,0.25°)的能力,并比較3種主流網(wǎng)絡(luò)框架(VGG,ResNet,GoogleNet)在該任務(wù)中的表現(xiàn)。結(jié)果表明,3種網(wǎng)絡(luò)框架都對(duì)美國(guó)東北部日降水分布具有一定的預(yù)報(bào)能力(VGG框架表現(xiàn)最優(yōu)),但三者的均方根誤差(RMSE)均高于ERA-Interim 24-h(ERA24)的降水預(yù)報(bào)。3種神經(jīng)網(wǎng)絡(luò)的集合預(yù)報(bào)結(jié)果優(yōu)于ERA24預(yù)報(bào),且這三者與ERA24預(yù)報(bào)結(jié)果的集合平均能夠顯著提高ERA24對(duì)不同季節(jié)、不同強(qiáng)度降水的預(yù)報(bào)。
關(guān)鍵詞降水預(yù)報(bào);深度學(xué)習(xí);神經(jīng)網(wǎng)絡(luò)框架;模式評(píng)估;美國(guó)東北部
天氣影響著人類的生產(chǎn)生活。自古以來,天氣事件中的降水事件都備受人們的關(guān)注,特別是極端降水事件對(duì)人民群眾的生命和財(cái)產(chǎn)安全會(huì)造成重大損失。而且人們普遍認(rèn)為,隨著全球氣候變暖,極端降水事件的出現(xiàn)頻率會(huì)增加(Dai and Soden,2020;袁宇鋒和翟盤茂,2022)。例如,2021年7月21日河南鄭州特大暴雨事件嚴(yán)重?fù)p害了人民群眾的生命安全(張霞等,2021;栗晗等,2022)。
在氣象研究中,對(duì)各種天氣現(xiàn)象進(jìn)行預(yù)報(bào)的傳統(tǒng)方法一般是根據(jù)大氣的物理和化學(xué)規(guī)律,對(duì)大氣運(yùn)動(dòng)過程進(jìn)行物理參數(shù)化模擬,最終開發(fā)出數(shù)值模式,并利用計(jì)算機(jī)進(jìn)行計(jì)算求解(Khain et al.,2015;Berner et al.,2017)。在過去幾十年中,隨著超級(jí)計(jì)算機(jī)性能的不斷提高、衛(wèi)星以及一些相關(guān)科學(xué)技術(shù)的進(jìn)步,數(shù)值天氣預(yù)報(bào)模式的研究取得了很多進(jìn)展,這顯著地提高了降水預(yù)報(bào)的準(zhǔn)確性(Bauer et al.,2015;Schultz et al.,2021)。但是,這種預(yù)報(bào)方法具有一系列的缺點(diǎn)。例如:對(duì)降水過程來說,其中涉及大量且復(fù)雜的大氣運(yùn)動(dòng)、大氣環(huán)流、云微物理和大氣輻射等過程(Stevens and Feingold,2009),通過一些簡(jiǎn)單的物理方程組無法將這些大氣的運(yùn)動(dòng)變化過程表達(dá)得很準(zhǔn)確。因此,物理過程的參數(shù)化會(huì)出現(xiàn)各種偏差,這些偏差也進(jìn)一步導(dǎo)致了數(shù)值模式的最終預(yù)報(bào)結(jié)果不準(zhǔn)確(Li et al.,2020)。
隨著計(jì)算機(jī)硬件水平的逐步提升和大數(shù)據(jù)時(shí)代的到來,機(jī)器學(xué)習(xí)技術(shù)以及它的各種算法研究均取得了很大的進(jìn)展。深度學(xué)習(xí)(deep learning)是機(jī)器學(xué)習(xí)的一個(gè)子領(lǐng)域,其技術(shù)基礎(chǔ)為深層神經(jīng)網(wǎng)絡(luò)(Goodfellow et al.,2016)。近十幾年來,深度學(xué)習(xí)技術(shù)讓整個(gè)人工智能領(lǐng)域的研究取得了巨大的突破,解決了許多困擾已久的問題(Yann et al.,2015)。在氣象學(xué)的預(yù)報(bào)領(lǐng)域中,有很多任務(wù)需要對(duì)大量的氣象學(xué)的數(shù)據(jù)進(jìn)行計(jì)算。因此,有很多學(xué)者將在大數(shù)據(jù)計(jì)算領(lǐng)域取得重大突破的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法應(yīng)用到大氣科學(xué)中。例如:預(yù)報(bào)區(qū)域降水量(Akbari Asanjan et al.,2018;Wang et al.,2021;黃超等,2022)、預(yù)報(bào)各類大氣污染物濃度(黃春桃等,2021;Ma et al.,2021;Weng et al.,2022)、預(yù)報(bào)氣溫(雷蕾等,2022)、預(yù)測(cè)臺(tái)風(fēng)運(yùn)動(dòng)軌跡(Wang et al.,2022)等天氣和氣候事件。
Ham et al.(2019)利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)成功將ENSO事件的預(yù)報(bào)準(zhǔn)確性提前到了1.5 a,這是將深度學(xué)習(xí)模型應(yīng)用到氣候?qū)W研究領(lǐng)域取得的一次巨大的突破。Xue et al.(2021)使用包含了兩個(gè)模塊的CNN模型在中國(guó)新疆地區(qū)進(jìn)行降水量的預(yù)報(bào)。另外,考慮到地形因素也會(huì)影響降水量的估算,該研究把地形數(shù)據(jù)也作為訓(xùn)練數(shù)據(jù)中的一部分。研究發(fā)現(xiàn),該CNN模型比傳統(tǒng)模式對(duì)降水量的預(yù)報(bào)誤差更低,并且預(yù)報(bào)速度在每小時(shí)數(shù)據(jù)集的測(cè)試中僅需5.5 s。Hess and Boers(2022)研究了如何提高全球尺度上的強(qiáng)降水事件的預(yù)報(bào)。該研究用一種特殊的函數(shù)作為訓(xùn)練U-Net深度學(xué)習(xí)模型的損失函數(shù),隨后利用該模型對(duì)數(shù)值模式的預(yù)報(bào)結(jié)果進(jìn)行后處理,結(jié)果表明能夠改善數(shù)值模式對(duì)強(qiáng)降水事件的預(yù)報(bào)性能。因此,挑選出合適的損失函數(shù)是訓(xùn)練深度學(xué)習(xí)模型中一個(gè)非常重要的步驟。
短時(shí)、極端的強(qiáng)降水會(huì)嚴(yán)重影響人們的生活。因此,如何提高短期降水的預(yù)報(bào)準(zhǔn)確度,是降水預(yù)報(bào)中的一個(gè)重點(diǎn)與難點(diǎn)。在預(yù)報(bào)短期降水量方面,一種叫作TAFFNET的深度學(xué)習(xí)模型能同時(shí)利用雷達(dá)數(shù)據(jù)和天氣預(yù)報(bào)模式數(shù)據(jù)作為輸入,并能夠自適應(yīng)地優(yōu)化這兩種數(shù)據(jù)的融合權(quán)重(Wang et al.,2023)。該研究最終的結(jié)果表明,TAFFNET在12 h的極短期降水預(yù)報(bào)性能上明顯優(yōu)于傳統(tǒng)模式。這說明在深度學(xué)習(xí)模型中使用多個(gè)來源的輸入數(shù)據(jù),能夠提升模型的預(yù)報(bào)能力。
Chen and Wang(2022)使用美國(guó)大陸的ERA-Interim再分析資料中與降水有關(guān)的大氣變量,采用VGG架構(gòu)為基礎(chǔ)的神經(jīng)網(wǎng)絡(luò)模型(FPP),來預(yù)測(cè)美國(guó)大陸地區(qū)的每日降水量。隨后采用非線性變換法和集合平均等方法對(duì)模型的輸出結(jié)果進(jìn)行后處理,這些方法顯著提高了模型對(duì)美國(guó)大陸地區(qū)暴雨的預(yù)測(cè)準(zhǔn)確度。同時(shí),該研究也發(fā)現(xiàn),相比于美國(guó)其他地區(qū)的預(yù)報(bào)結(jié)果,F(xiàn)PP模型對(duì)美國(guó)東北部地區(qū)的日降水量預(yù)報(bào)準(zhǔn)確度低,低于傳統(tǒng)數(shù)值模式的預(yù)報(bào)性能。
由于前人的研究并沒有利用到神經(jīng)網(wǎng)絡(luò)方法對(duì)美國(guó)東北部地區(qū)的每日降水量進(jìn)行預(yù)報(bào),另外,美國(guó)東北部地區(qū)人口密集、城市化程度高以及經(jīng)濟(jì)發(fā)達(dá),這使得準(zhǔn)確地預(yù)報(bào)出該區(qū)域的短期降水量具有重要的實(shí)踐意義與應(yīng)用價(jià)值。因此,有必要進(jìn)一步探索并提升深度學(xué)習(xí)模型對(duì)美國(guó)東北部地區(qū)每日降水量的預(yù)報(bào)性能。
1 數(shù)據(jù)與研究方法
1.1 數(shù)據(jù)與研究區(qū)域
本研究主要用到美國(guó)東北部地區(qū)的氣象數(shù)據(jù)。模型的訓(xùn)練數(shù)據(jù)為1979—2018年ERA-Interim再分析資料中的氣象場(chǎng)數(shù)據(jù)(Dee et al.,2011),包含經(jīng)向風(fēng)(U)、緯向風(fēng)(V)、相對(duì)濕度(R)、絕對(duì)濕度(Q)、溫度(T)、位勢(shì)高度(Z)、垂直速度(W)、散度(D)、位勢(shì)渦度(PV)、相對(duì)渦度(VO)共10個(gè)氣象場(chǎng)變量。該數(shù)據(jù)的時(shí)間分辨率為6 h,水平分辨率為0.7°×0.7°(約70 km),空間上從地面1 000 hPa到1 hPa共37個(gè)高度層。數(shù)據(jù)的范圍為55°~110°W、25°~64°N,經(jīng)度、緯度方向的格點(diǎn)數(shù)分別為84和56。因此,最終輸入數(shù)據(jù)維度為(10,37,56,84)。
地面降水量數(shù)據(jù)采用美國(guó)氣候預(yù)報(bào)中心(CPC)提供的美國(guó)東北部地面降水量的觀測(cè)資料,并作為訓(xùn)練數(shù)據(jù)所對(duì)應(yīng)的標(biāo)簽。該數(shù)據(jù)時(shí)間分辨率為1 d,水平分辨率為0.25°×0.25°(約25 km),共包含美國(guó)東北部地區(qū)829個(gè)格點(diǎn)。另外,選用兩種數(shù)值模式ERA-Interim再分析資料中的12 h和24 h累積降水預(yù)報(bào)(ERA-Interim 12-h、ERA-Interim 24-h,以下簡(jiǎn)稱ERA12、ERA24)作為傳統(tǒng)數(shù)值模式結(jié)果,并與深度學(xué)習(xí)模型結(jié)果做對(duì)比。
選定的研究區(qū)域?yàn)槊绹?guó)東北部,共包含9個(gè)州:賓夕法尼亞州、紐約州、康涅狄格州、緬因州、馬薩諸塞州、新罕布什爾州、佛蒙特州、新澤西州、羅德島州。圖1為本文用到的氣象場(chǎng)數(shù)據(jù)的范圍和預(yù)報(bào)地區(qū)美國(guó)東北部的地形示意,圖中顯示出美國(guó)東北部地區(qū)鄰近大西洋,由9個(gè)面積較小的州組成,范圍在65°~82°W、38°~48°N。
1.2 深度學(xué)習(xí)模型
3種經(jīng)典深度學(xué)習(xí)模型框架(圖2)為:VGG(Simonyan and Zisserman,2014);ResNet (He et al.,2016);GoogleNet(Szegedy et al.,2016)。
VGG模型為2014年由牛津大學(xué)視覺幾何組開發(fā)出來的Visual Geometry Group模型。該模型由多個(gè)VGG塊堆疊而成,主要是為了驗(yàn)證模型的深度增加后,是否可以進(jìn)一步提高模型在圖像識(shí)別等領(lǐng)域的預(yù)測(cè)性能。圖2a是本文用到的VGG模型,共含有兩種類型的VGG塊,模型總層數(shù)為19層。
殘差網(wǎng)絡(luò)Residual Network(簡(jiǎn)稱為ResNet)開創(chuàng)性地提出了殘差連接這一概念,在深度學(xué)習(xí)模型中加入了殘差連接塊,極大地提高了網(wǎng)絡(luò)的學(xué)習(xí)能力,使訓(xùn)練出層數(shù)更深的神經(jīng)網(wǎng)絡(luò)成為了可能。本文用到的ResNet模型有4種不同類型的殘差連接塊,模型總層數(shù)為51層(圖2b)。
GoogleNet是谷歌公司在2014年推出的一個(gè)模型結(jié)構(gòu)。該模型采用了一種叫作Inception塊的結(jié)構(gòu),能夠同時(shí)用到多種不同大小的卷積核,從而可以在不同的空間范圍中提取信息。圖2c為本文用到的GoogleNet模型結(jié)構(gòu)示意圖,該模型共包含7個(gè)Inception塊。
本文對(duì)氣象場(chǎng)數(shù)據(jù)先進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理,隨后將處理完成的數(shù)據(jù)劃分為3個(gè)不同的數(shù)據(jù)集:訓(xùn)練集、驗(yàn)證集、測(cè)試集。測(cè)試集包含1998、2003、2008、2017、2018年數(shù)據(jù),驗(yàn)證集包含2010、2015年數(shù)據(jù),剩下的33 a數(shù)據(jù)作為訓(xùn)練集。這樣劃分?jǐn)?shù)據(jù)主要有兩方面原因:一是在訓(xùn)練集中盡可能包含更多樣本,以提高模型的準(zhǔn)確度;二是確保訓(xùn)練集和測(cè)試集中包含處于大氣多年變率(如ENSO)不同階段的樣本,從而更加客觀地認(rèn)識(shí)模型的預(yù)報(bào)能力(Chen et al.,2022)。
訓(xùn)練各個(gè)模型時(shí),使用ReLU作為激活函數(shù)。另外,深度學(xué)習(xí)模型在訓(xùn)練過程中能否有效收斂,與模型參數(shù)初始化方法及優(yōu)化算法有關(guān)。因此模型參數(shù)的初始化方法采用Kaiming初始化方法(He et al.,2015),優(yōu)化算法為Adam算法,并在模型訓(xùn)練過程中采用學(xué)習(xí)率倍減的方法。其中的重要超參數(shù)設(shè)置為:批量大小(batch size)為50,初始學(xué)習(xí)率為0.000 1,訓(xùn)練輪次數(shù)(epoch)為50。
1.3 評(píng)價(jià)指標(biāo)
本文采用常見的評(píng)價(jià)指標(biāo)——平均絕對(duì)誤差(MAE)和均方根誤差(RMSE)來評(píng)估傳統(tǒng)模式和3種深度學(xué)習(xí)模型對(duì)美國(guó)東北部日降水分布的預(yù)報(bào)性能。同時(shí)也用到2種評(píng)分函數(shù)——TS(Threat Score)評(píng)分與ETS(Equitable Threat Score)評(píng)分來評(píng)估模型對(duì)不同強(qiáng)度降水的預(yù)報(bào)效果(朱格利等,2014)。TS、ETS評(píng)分主要是指在給定降水閾值條件下,模型對(duì)降水和不降水區(qū)域的識(shí)別分類能力。根據(jù)預(yù)報(bào)有無降水和觀測(cè)有無降水的對(duì)應(yīng)關(guān)系,可以分成4種情況(表1)。
TS、ETS評(píng)分的計(jì)算式為:
TS=HH+F+M;(1)
ETS=H-DrH+F+M-Dr。(2)
其中:Dr=H+F×(H+M)H+F+M+C。
2 3種深度學(xué)習(xí)模型對(duì)美國(guó)東北部日降水量的預(yù)報(bào)結(jié)果
模型訓(xùn)練完成后,為了評(píng)估3種不同結(jié)構(gòu)的深度學(xué)習(xí)模型對(duì)美國(guó)東北部日降水量的預(yù)報(bào)性能,首先選用RMSE作為評(píng)價(jià)指標(biāo),利用測(cè)試數(shù)據(jù)集對(duì)模型的性能進(jìn)行評(píng)估。圖3給出了3種模型在5 a共計(jì)1 826 d測(cè)試集上,對(duì)美國(guó)東北部每日降水量的預(yù)測(cè)值與CPC觀測(cè)值之間的RMSE區(qū)域分布,圖右下角給出了RMSE的區(qū)域平均值??梢钥闯?,VGG模型預(yù)報(bào)結(jié)果的區(qū)域平均RMSE值為4.95,是3種模型中的最低(圖3a)。ResNet和GoogleNet的預(yù)報(bào)結(jié)果類似(圖3b、c),區(qū)域平均RMSE較VGG結(jié)果略大。
圖4通過比較3種模型在4個(gè)不同季節(jié)對(duì)每日降水的預(yù)報(bào)準(zhǔn)確性,更進(jìn)一步地對(duì)深度學(xué)習(xí)模型的預(yù)報(bào)性能進(jìn)行綜合評(píng)估。圖4中MAM、JJA、SON、DJF分別代表這5 a測(cè)試數(shù)據(jù)集中的春季(3—5月)、夏季(6—8月)、秋季(9—11月)、冬季(12—次年2月),3種不同顏色的條形柱分布代表3種模型的預(yù)報(bào)結(jié)果與CPC觀測(cè)值之間的RMSE值。圖4顯示,VGG模型在4個(gè)不同季節(jié)的預(yù)報(bào)結(jié)果略優(yōu)于另2種模型,3種模型對(duì)夏季(JJA)和秋季(SON)預(yù)報(bào)的RMSE值明顯高于冬季(DJF)和春季(MAM)。
圖5表示在5 a測(cè)試數(shù)據(jù)集中不同降水強(qiáng)度下3種模型的預(yù)報(bào)誤差。圖中,降水按強(qiáng)度分成4種類型:無降水(小于0.1 mm/d,共238 d)、小雨(0.1~<10 mm/d,共1 422 d)、中雨(10~<25 mm/d,共157 d)和大雨(25~<50 mm/d,共9 d)。可以明顯看到,隨著降水強(qiáng)度增加,3種模型的預(yù)報(bào)誤差均顯著增大。這說明深度學(xué)習(xí)模型對(duì)美國(guó)東北部弱降水及不降水事件的預(yù)報(bào)性能較好,而對(duì)強(qiáng)降水的預(yù)報(bào)性能較差。另外,對(duì)于25~<50 mm/d的大雨預(yù)報(bào),VGG模型的預(yù)報(bào)準(zhǔn)確度明顯優(yōu)于另兩種模型。
3 集合預(yù)報(bào)模型與傳統(tǒng)數(shù)值模式的預(yù)報(bào)結(jié)果分析
3.1 RMSE誤差分布對(duì)比
本文利用集合預(yù)報(bào)的思想,將3種不同結(jié)構(gòu)的深度學(xué)習(xí)模型預(yù)報(bào)結(jié)果進(jìn)行集合,并將集合之后得到的模型命名為NEP(Network Ensemble Prediction),以檢驗(yàn)集合預(yù)報(bào)方法對(duì)深度學(xué)習(xí)模型降水預(yù)報(bào)性能的影響。具體做法是采用兩種損失函數(shù)MAE、MSE,分別對(duì)VGG、ResNet、GoogleNet 3種模型進(jìn)行訓(xùn)練,共得到6種單一模型的預(yù)報(bào)結(jié)果。表2顯示了集合預(yù)報(bào)所用到的6種單一的深度學(xué)習(xí)模型。對(duì)這6種模型進(jìn)行集合的具體方法是,首先將6個(gè)模型的預(yù)報(bào)結(jié)果進(jìn)行拼接得到二維數(shù)據(jù),數(shù)據(jù)的維度為(6,829),隨后利用一維卷積的方法對(duì)該數(shù)據(jù)進(jìn)行二次訓(xùn)練,最終得到美國(guó)東北部829個(gè)格點(diǎn)的降水預(yù)報(bào)結(jié)果。即經(jīng)過一維卷積后,得到6個(gè)模型的加權(quán)平均結(jié)果NEP。
為了更直觀地顯示集合預(yù)報(bào)模型NEP對(duì)降水的預(yù)報(bào)性能,我們選用兩種傳統(tǒng)數(shù)值模式的預(yù)報(bào)結(jié)果ERA12、ERA24與其進(jìn)行對(duì)比。WP(Weighted Prediction)為集合預(yù)報(bào)結(jié)果NEP與ERA24傳統(tǒng)模式結(jié)果的等權(quán)平均,目的是評(píng)估深度學(xué)習(xí)模型和傳統(tǒng)模式的預(yù)報(bào)結(jié)果相結(jié)合后,能否進(jìn)一步提高對(duì)美國(guó)東北部每日降水的預(yù)報(bào)能力。圖6顯示了這4種方法對(duì)美國(guó)東北部每日降水量預(yù)報(bào)結(jié)果RMSE的區(qū)域分布。與圖3的對(duì)比顯示出,傳統(tǒng)模式結(jié)果ERA24和ERA12性能均優(yōu)于3種單獨(dú)的深度學(xué)習(xí)模型。集合預(yù)報(bào)模型NEP的區(qū)域平均RMSE低于模式ERA24,而WP在4種方法中預(yù)報(bào)性能最優(yōu),對(duì)美國(guó)東北部日降水的預(yù)報(bào)準(zhǔn)確度已經(jīng)超越ERA12模式。
3.2 不同季節(jié)、不同降水強(qiáng)度的預(yù)報(bào)結(jié)果
由于各種方法對(duì)不同季節(jié)、不同強(qiáng)度的降水預(yù)報(bào)會(huì)有一定的差異,本節(jié)檢驗(yàn)這4種預(yù)報(bào)方法對(duì)美國(guó)東北部4個(gè)季節(jié)、4種不同降水強(qiáng)度的每日降水量的預(yù)報(bào)性能。
圖7顯示出這4種預(yù)報(bào)方法在5 a測(cè)試數(shù)據(jù)集上,對(duì)冬季(DJF)和春季(MAM)的每日降水預(yù)報(bào)誤差相對(duì)較小,而對(duì)夏季(JJA)和秋季(SON)則預(yù)報(bào)誤差較大。這點(diǎn)與圖4的結(jié)果具有相似性。對(duì)于同一季節(jié),4種預(yù)報(bào)方法的結(jié)果也有一定的差異。其中ERA24和NEP在4種方法中預(yù)報(bào)性能相對(duì)較低,其RMSE值均高于WP和ERA12。WP模型預(yù)報(bào)性能最優(yōu),RMSE在4個(gè)季節(jié)中均低于另外3種預(yù)報(bào)方法。通過與圖4的對(duì)比可以看出,集合預(yù)報(bào)模型NEP和WP在4個(gè)季節(jié)上的預(yù)報(bào)RMSE值均低于VGG、ResNet、GoogleNet這3種模型。
圖8顯示出4種預(yù)報(bào)方法對(duì)弱降水以及不降水事件的預(yù)報(bào)性能較好,隨著降水強(qiáng)度的增加,各種方法的預(yù)報(bào)性能均明顯下降。另外,在同等降水強(qiáng)度下,ERA12和WP的預(yù)報(bào)性能優(yōu)于另外兩種方法。
圖7、8的對(duì)比顯示出各種方法對(duì)夏季(JJA)和秋季(SON)的預(yù)報(bào)誤差偏大。這可能是由于美國(guó)東北部地區(qū)在夏季和秋季的平均日降水量明顯大于該地區(qū)冬季和春季的平均日降水量,而各種方法對(duì)強(qiáng)降水事件的預(yù)報(bào)性能均不及弱降水事件。
3.3 TS、ETS評(píng)分結(jié)果對(duì)比
圖9給出了4種預(yù)報(bào)方法在不同降水強(qiáng)度下的TS、ETS評(píng)分情況??梢钥闯?,隨著降水閾值的增大,深度學(xué)習(xí)模型與傳統(tǒng)數(shù)值模式對(duì)降水的預(yù)報(bào)性能均逐漸降低。但這4種預(yù)報(bào)方法對(duì)不同降水閾值的TS、ETS評(píng)分也有差異。對(duì)于弱降水,NEP的TS、ETS評(píng)分不如模式ERA24,但WP的TS和ETS評(píng)分均優(yōu)于數(shù)值模式ERA24。對(duì)于降水閾值在25 mm/d的中雨和50 mm/d的大雨,模型NEP的TS、ETS評(píng)分較低,而WP的結(jié)果仍略優(yōu)于模式ERA24。這說明將深度學(xué)習(xí)模型的預(yù)報(bào)結(jié)果與模式預(yù)報(bào)結(jié)果進(jìn)行集合,能在一定程度上改進(jìn)傳統(tǒng)模式對(duì)大雨的預(yù)報(bào)準(zhǔn)確度。而對(duì)于降水閾值在100 mm/d的暴雨事件,模式ERA24在4種方法中TS、ETS評(píng)分最高(圖9a、b)。
3.4 典型個(gè)例分析
為了更加清晰地展示不同預(yù)報(bào)方法對(duì)美國(guó)東北部單日降水量的預(yù)報(bào)性能,本節(jié)通過一個(gè)典型的個(gè)例分析直觀對(duì)比傳統(tǒng)數(shù)值模式方法和深度學(xué)習(xí)模型的預(yù)報(bào)結(jié)果。
2018年2月26日美國(guó)東北部的區(qū)域日平均降水量為5.25 mm,降水級(jí)別屬于小雨。當(dāng)天美國(guó)東北部地區(qū)的地面觀測(cè)值表明,降水量超過10 mm/d的區(qū)域集中在該地區(qū)的東南沿海處(圖10e)。4種方法均顯示出強(qiáng)降水地區(qū)(圖中橙黃色、紅色區(qū)域)位于該地區(qū)的東南部,弱降水地區(qū)(圖中淡藍(lán)色、白色區(qū)域)位于該地區(qū)的西部,4種方法的預(yù)報(bào)結(jié)果均與地面實(shí)際觀測(cè)值類似。對(duì)于該區(qū)域西部的無降水及弱降水地區(qū),ERA12和ERA24模式對(duì)其降水量有一定的高估,而NEP的預(yù)報(bào)結(jié)果相對(duì)更準(zhǔn)確(圖10)。
表3使用3種評(píng)價(jià)指標(biāo)RMSE、TS、ETS,對(duì)4種預(yù)報(bào)方法在該地區(qū)2018年2月26日降水量的預(yù)報(bào)性能進(jìn)行了定量評(píng)估。其中,TS、ETS評(píng)分的閾值設(shè)定為5 mm/d。結(jié)果表明,集合預(yù)報(bào)結(jié)果NEP的性能最優(yōu),RMSE、TS、ETS分別為2.38、0.70、0.52,均超過了另外3種方法的預(yù)報(bào)結(jié)果。而數(shù)值模式ERA24在這4種預(yù)報(bào)方法中的預(yù)報(bào)性能最差。
4 結(jié)論
區(qū)域降水預(yù)測(cè)是大氣科學(xué)研究領(lǐng)域的一個(gè)熱點(diǎn)和重點(diǎn)。近些年來,對(duì)于處理大數(shù)據(jù)任務(wù)有著優(yōu)異性能的機(jī)器學(xué)習(xí)算法在多個(gè)領(lǐng)域中取得了突破性進(jìn)展。本文利用深度學(xué)習(xí)方法來預(yù)報(bào)美國(guó)東北部的日降水分布,是將神經(jīng)網(wǎng)絡(luò)方法應(yīng)用到降水預(yù)報(bào)領(lǐng)域的一次有益嘗試。本研究的創(chuàng)新性為利用了低分辨率的氣象場(chǎng)(0.7°)來預(yù)報(bào)高分辨率的降水(0.25°),以及用到了3種經(jīng)典的神經(jīng)網(wǎng)絡(luò)框架。本文的主要結(jié)論如下:
1)本文將3種人工智能領(lǐng)域經(jīng)典的神經(jīng)網(wǎng)絡(luò)框架應(yīng)用于美國(guó)東北部的降水量預(yù)報(bào)。通過RMSE分布可看出,VGG模型的RMSE區(qū)域平均值是3個(gè)模型中的最低,而ResNet和GoogleNet的預(yù)報(bào)誤差相對(duì)較大。因此,VGG模型對(duì)該地區(qū)每日降水量的總體預(yù)報(bào)性能最佳。但與數(shù)值模式的預(yù)報(bào)結(jié)果相比,3種模型的RMSE均大于數(shù)值模式ERA24。
2)對(duì)美國(guó)東北部不同強(qiáng)度、不同季節(jié)的每日降水量預(yù)報(bào)結(jié)果表明,3種模型均對(duì)于弱降水事件預(yù)報(bào)性能較好,而對(duì)于強(qiáng)降水事件預(yù)報(bào)性能則較差。同時(shí),由于美國(guó)東北部夏季平均降水量較大而冬季平均降水量較小,所以模型對(duì)該地區(qū)冬季降水量的預(yù)報(bào)性能最佳,而對(duì)夏季降水量的預(yù)報(bào)性能最差。
3)將3種模型對(duì)該地區(qū)每日降水量的預(yù)報(bào)結(jié)果進(jìn)行加權(quán)平均后,所得到的集合預(yù)報(bào)結(jié)果會(huì)明顯優(yōu)于單一模型的預(yù)報(bào)結(jié)果,也超過了ERA24數(shù)值模式的預(yù)報(bào)結(jié)果。將3種模型與ERA24預(yù)報(bào)結(jié)果進(jìn)行集合平均所得到的最終結(jié)果顯著提高了ERA24對(duì)不同季節(jié)、不同強(qiáng)度降水的預(yù)報(bào)。
然而,預(yù)報(bào)結(jié)果也表明,目前所采用的深度學(xué)習(xí)模型對(duì)于強(qiáng)降水的預(yù)報(bào)性能相對(duì)較差。因此,能否利用更先進(jìn)的神經(jīng)網(wǎng)絡(luò)框架,從而得到對(duì)強(qiáng)降水事件預(yù)報(bào)性能更好的模型,是今后的一個(gè)研究方向。
參考文獻(xiàn)(References)
Akbari Asanjan A,Yang T T,Hsu K,et al.,2018.Short-term precipitation forecast based on the PERSIANN system and LSTM recurrent neural networks[J].J Geophys Res:Atmos,123(22):12543-12563.doi:10.1029/2018jd028375.
Bauer P,Thorpe A,Brunet G,2015.The quiet revolution of numerical weather prediction[J].Nature,525(7567):47-55.doi:10.1038/nature14956.
Berner J,Achatz U,Batté L,et al.,2017.Stochastic parameterization:toward a new view of weather and climate models[J].Bull Amer Meteor Soc,98(3):565-588.doi:10.1175/bams-d-15-00268.1.
Chen G X,Wang W C,2022.Short-term precipitation prediction for contiguous United States using deep learning[J].Geophys Res Lett,49(8):e2022GL097904.doi:10.1029/2022gl097904.
Dai N,Soden B J,2020.Convective aggregation and the amplification of tropical precipitation extremes[J].AGU Adv,1(4):e2020AV000201.doi:10.1029/2020av000201.
Dee D P,Uppala S M,Simmons A J,et al.,2011.The ERA-Interim reanalysis:configuration and performance of the data assimilation system[J].Quart J Roy Meteo Soc,137(656):553-597.doi:10.1002/qj.828.
Goodfellow I,Bengio Y,Courville A,2016.Deep learning:adaptive computation and machine learning series[M].Cambridge:The MIT Press.
Ham Y G,Kim J H,Luo J J,2019.Deep learning for multi-year ENSO forecasts[J].Nature,573(7775):568-572.doi:10.1038/s41586-019-1559-7.
He K M,Zhang X Y,Ren S Q,et al.,2015.Delving deep into rectifiers:surpassing human-level performance on ImageNet classification[C]//2015 IEEE International Conference on Computer Vision (ICCV).Santiago,Chile:IEEE:1026-1034.doi:10.1109/ICCV.2015.123.
He K M,Zhang X Y,Ren S Q,et al.,2016.Deep residual learning for image recognition[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Las Vegas,NV,USA:IEEE:770-778.doi:10.1109/CVPR.2016.90.
Hess P,Boers N,2022.Deep learning for improving numerical weather prediction of heavy rainfall[J].J Adv Model Earth Syst,14(3):e2021MS002765.doi:10.1029/2021ms002765.
黃超,李巧萍,謝益軍,等,2022.機(jī)器學(xué)習(xí)方法在湖南夏季降水預(yù)測(cè)中的應(yīng)用[J].大氣科學(xué)學(xué)報(bào),45(2):191-202. Huang C,Li Q P,Xie Y J,et al.,2022.Prediction of summer precipitation in Hunan based on machine learning[J].Trans Atmos Sci,45(2):191-202.doi:10.13878/j.cnki.dqkxxb.20210903001.(in Chinese).
黃春桃,范東平,盧集富,等,2021.基于深度學(xué)習(xí)模型的廣州市大氣PM2.5和PM10濃度預(yù)測(cè)[J].環(huán)境工程,39(12):135-140. Huang C T,F(xiàn)an D P,Lu J F,et al.,2021.Prediction of PM2.5 and PM10 concentration in Guangzhou based on deep learning model[J].Environ Eng,39(12):135-140.(in Chinese).
Khain A P,Beheng K D,Heymsfield A,et al.,2015.Representation of microphysical processes in cloud-resolving models:spectral (Bin) microphysics versus bulk parameterization[J].Rev Geophys,53(2):247-322.doi:10.1002/2014rg000468.
雷蕾,徐邦琪,高慶九,等,2022.基于卷積神經(jīng)網(wǎng)絡(luò)的長(zhǎng)江流域夏季日最高溫度延伸期預(yù)報(bào)方法研究[J].大氣科學(xué)學(xué)報(bào),45(6):835-849. Lei L,Hsu P C,Gao Q J,et al.,2022.Extended-range forecasting method of summer daily maximum temperature in the Yangtze River Basin based on convolutional neural network[J].Trans Atmos Sci,45(6):835-849.(in Chinese).
栗晗,王新敏,朱楓,2022.“21·7”河南極端暴雨多模式預(yù)報(bào)性能綜合評(píng)估[J].大氣科學(xué)學(xué)報(bào),45(4):573-590. Li H,Wang X M,Zhu F,2022.Comprehensive evaluations of multi-model forecast performance for “21·7” Henan extreme rainstorm[J].Trans Atmos Sci,45(4):573-590.(in Chinese).
Li X,Zhang L,Wang J,2020.The sensitivity of the prediction of Meiyu torrential rainfall to model resolution and cumulus parameterization[J].Rainstorm Disaster,39(6):637-646.doi:10.3969/j.issn.1004-9045.2020.06.012.
Ma Y Y,Zhu Y,Liu B M,et al.,2021.Estimation of the vertical distribution of particle matter (PM2.5) concentration and its transport flux from lidar measurements based on machine learning algorithms[J].Atmos Chem Phys,21(22):17003-17016.doi:10.5194/acp-21-17003-2021.
Schultz M G,Betancourt C,Gong B,et al.,2021.Can deep learning beat numerical weather prediction?[J].Philos Trans A Math Phys Eng Sci,379(2194):20200097.doi:10.1098/rsta.2020.0097.
Simonyan K,Zisserman A,2014.Very deep convolutional networks for large-scale image recognition[EB/OL].arXiv:1409.1556.https://arxiv.org/abs/1409.1556.pdf
Stevens B,F(xiàn)eingold G,2009.Untangling aerosol effects on clouds and precipitation in a buffered system[J].Nature,461(7264):607-613.doi:10.1038/nature08281.
Szegedy C,Vanhoucke V,Ioffe S,et al.,2016.Rethinking the inception architecture for computer vision[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Las Vegas,NV,USA:IEEE:2818-2826.doi:10.1109/CVPR.2016.308.
Wang J L,Yang J,Ren H L,et al.,2021.Dynamical and machine learning hybrid seasonal prediction of summer rainfall in China[J].J Meteor Res,35(4):583-593.doi:10.1007/s13351-021-0185-0.
Wang J N,Wang X D,Guan J P,et al.,2023.TAFFNet:time-aware adaptive feature fusion network for very short-term precipitation forecasts[J].Geophys Res Lett,50(15):e2023GL104370.doi:10.1029/2023gl104370.
Wang P P,Wang P,Wang C,et al.,2022.Using a 3D convolutional neural network and gated recurrent unit for tropical cyclone track forecasting[J].Atmos Res,269:106053.doi:10.1016/j.atmosres.2022.106053.
Weng X,F(xiàn)orster G L,Nowack P,2022.A machine learning approach to quantify meteorological drivers of ozone pollution in China from 2015 to 2019[J].Atmos Chem Phys,22(12):8385-8402.doi:10.5194/acp-22-8385-2022.
Xue M,Hang R L,Liu Q S,et al.,2021.CNN-based near-real-time precipitation estimation from Fengyun-2 satellite over Xinjiang,China[J].Atmos Res,250:105337.doi:10.1016/j.atmosres.2020.105337.
Yann L,Yoshua B,Geoffrey H,2015.Deep learning[J].Nature,521(7553):436-444.doi:10.1038/nature14539.
袁宇鋒,翟盤茂,2022.全球變暖與城市效應(yīng)共同作用下的極端天氣氣候事件變化的最新認(rèn)知[J].大氣科學(xué)學(xué)報(bào),45(2):161-166. Yuan Y F,Zhai P M,2022.Latest understanding of extreme weather and climate events under global warming and urbanization influences[J].Trans Atmos Sci,45(2):161-166.doi:10.13878/j.cnki.dqkxxb.20211011001.(in Chinese).
張霞,楊慧,王新敏,等,2021.“21·7” 河南極端強(qiáng)降水特征及環(huán)流異常性分析[J].大氣科學(xué)學(xué)報(bào),44(5):672-687. Zhang X,Yang H,Wang X M,et al.,2021.Analysis on characteristic and abnormality of atmospheric circulations of the July 2021 extreme precipitation in Henan[J].Trans Atmos Sci,44(5):672-687.doi:10.13878/j.cnki.dqkxxb.20210907001.(in Chinese).
朱格利,林萬濤,曹艷華,2014.用WRF模式中不同云微物理參數(shù)化方案對(duì)華南一次暴雨過程的數(shù)值模擬和性能分析[J].大氣科學(xué),38(3):513-523. Zhu G L,Lin W T,Cao Y H,2014.Numerical simulation of a rainstorm event over South China by using various cloud microphysics parameterization schemes in WRF model and its performance analysis[J].Chin J Atmos Sci,38(3):513-523.doi:10.3878/j.issn.1006-9895.2013.13202.(in Chinese).
·ARTICLE·
Using deep learning to predict daily precipitation distribution in the northeastern United States
ZHANG Chi1,CHEN Guoxing1,2,3,YANG Hongtao1
1Department of Atmospheric and Oceanic Sciences/Institute of Atmospheric Sciences/China Meteorological Administration-Fudan University Joint Laboratory of Marine Meteorological Disasters, Fudan University, Shanghai 200438, China;
2Shanghai Qizhi Institute, Shanghai 200232, China;
3Shanghai Frontiers Science Center of Atmosphere-Ocean Interaction, Fudan University, Shanghai 200438, China
Abstract At present,precipitation forecasting mainly relies on numerical weather forecasting models.However,due to factors such as physical parameterization and computational resources,there remains significant uncertainty in precipitation forecasting based on numerical models.In recent years,deep learning has shown great advantages and potential in the field of weather forecasting.The present study constructs neural networks to predict daily precipitation distribution in the northeastern United States,to explore the capabilities of neural-network models in predicting high-resolution precipitation (CPC,0.25°) using low-resolution meteorological fields (ERA-Interim,0.7°).Next,the study compares the performance of three mainstream network frameworks (VGG,ResNet,and GoogleNet) in the aforementioned task.The results indicate that all three frameworks have certain capabilities for predicting the daily precipitation distribution in the northeastern United States,with VGG performing the best,but their root mean square error (RMSE) is higher than that of the ERA-Interim 24-hour (ERA24) prediction.The ensemble-mean results of the three neural networks are all superior to the ERA24 prediction,and combining these three with the ERA24 prediction results can significantly improve ERA24 prediction in different seasons and intensities.It is thus concluded that deep learning has great potential in improving the resolution and accuracy of precipitation prediction.
Keywords precipitation forecast;deep learning;neural network framework;model evaluation;northeastern United States
doi:10.13878/j.cnki.dqkxxb.20231009006
(責(zé)任編輯:袁東敏)