楊 絢 代 刊 朱躍建
1.國家氣象中心,北京,100081
2.美國國家環(huán)境預(yù)報(bào)中心/環(huán)境模式中心,馬里蘭,20740
中國國家級(jí)無縫隙智能網(wǎng)格天氣預(yù)報(bào)業(yè)務(wù)起步于2014年,至2020年已初步形成全國5 km分辨率0—30 d的逐1 h、3 h和12 h,全球10 km分辨率0—10 d逐3 h的氣象要素預(yù)報(bào)產(chǎn)品體系,實(shí)現(xiàn)了天氣預(yù)報(bào)從站點(diǎn)到格點(diǎn)的轉(zhuǎn)變(金榮花等,2019)。該體系根據(jù)不同預(yù)報(bào)時(shí)效和氣象要素,發(fā)展出了相應(yīng)的客觀預(yù)報(bào)方法,表1是根據(jù)預(yù)報(bào)時(shí)效列出的目前中國無縫隙智能網(wǎng)格預(yù)報(bào)的技術(shù)體系。
表1 目前中國無縫隙智能網(wǎng)格預(yù)報(bào)技術(shù)體系Table 1 Current technologies of seamless intelligent grid weather forecasting in China
客觀預(yù)報(bào)方法通常是數(shù)值天氣模式系統(tǒng)的延伸,是智能網(wǎng)格預(yù)報(bào)的關(guān)鍵必要技術(shù)支撐。數(shù)值預(yù)報(bào)模式是現(xiàn)代天氣預(yù)報(bào)業(yè)務(wù)的基石,但受初始場(chǎng)誤差、有限的模式分辨率、不完備的物理參數(shù)化及近似下邊界條件等因素制約,預(yù)報(bào)誤差長期存在(Boeing,2016)。在數(shù)值預(yù)報(bào)模式基礎(chǔ)上發(fā)展合理、客觀、定量的預(yù)報(bào)方法是連接數(shù)值模式與精準(zhǔn)預(yù)報(bào)的橋梁。在天氣預(yù)報(bào)業(yè)務(wù)中,客觀預(yù)報(bào)方法一方面是對(duì)海量數(shù)值模式預(yù)報(bào)信息的處理和融合,為預(yù)報(bào)業(yè)務(wù)流程提供最優(yōu)預(yù)報(bào)起點(diǎn);另一方面可以推動(dòng)以智能網(wǎng)格預(yù)報(bào)為主線的業(yè)務(wù)流程升級(jí),將預(yù)報(bào)員從繁重的產(chǎn)品制作中解放出來。然而,隨著數(shù)值預(yù)報(bào)模式數(shù)據(jù)和觀測(cè)數(shù)據(jù)呈指數(shù)級(jí)增長,無縫隙預(yù)報(bào)產(chǎn)品的精細(xì)化要求越來越高,這給進(jìn)一步發(fā)展智能網(wǎng)格預(yù)報(bào)業(yè)務(wù)帶來了嚴(yán)峻的挑戰(zhàn)。
人工智能(AI,Artificial Intelligence)技術(shù)的興起為客觀預(yù)報(bào)方法的發(fā)展提供了新機(jī)遇(Haupt,et al,2021;Vannitsem,et al,2021)。近些年,AI技術(shù)在自然科學(xué)各領(lǐng)域均得到了成功應(yīng)用(Reichstein,et al,2019;Raghu,et al,2020;Bauer,et al,2021;Boukabara,et al,2021)。在天氣預(yù)報(bào)領(lǐng)域,越來越多的研究將AI技術(shù)應(yīng)用于預(yù)報(bào)業(yè)務(wù)的各個(gè)環(huán)節(jié)(Geer,2021;Haupt,et al,2021;Kashinath,et al,2021)。AI技術(shù)尤其是深度學(xué)習(xí),在預(yù)報(bào)中應(yīng)用的優(yōu)勢(shì)主要體現(xiàn)在天氣系統(tǒng)識(shí)別、海量數(shù)據(jù)處理、空間建模、超分辨率降尺度、時(shí)空預(yù)測(cè)等方面?;谏鲜黾夹g(shù)優(yōu)勢(shì),歐洲中期天氣預(yù)報(bào)中心(ECMWF,European Centre for Mdeium-Range Weather Forecasts)在2021年初發(fā)布的未來10年發(fā)展規(guī)劃中(Machine learning at ECMWF:A roadmap for the next 10 years,https://www.ecmwf.int/node/19877)闡明了未來AI技術(shù)在ECMWF數(shù)值天氣預(yù)報(bào)流程中的重要性。AI技術(shù)不依賴物理框架,卻能夠部分替代數(shù)值預(yù)報(bào)模式,這促使AI與數(shù)值預(yù)報(bào)模式的關(guān)系成為國際上討論的熱點(diǎn)問題之一(Schultz,et al,2021),有研究從該角度將AI在天氣預(yù)報(bào)中的應(yīng)用分為“硬AI”“中度AI”和“軟AI”(Chantry,et al,2021)。其中,“軟AI”是利用AI技術(shù)優(yōu)化或者替代數(shù)值模式中的部分參數(shù)化方案,以提高模式運(yùn)行的效率(Kasim,et al,2020);“中度AI”是在模式預(yù)報(bào)解釋應(yīng)用、統(tǒng)計(jì)后處理、統(tǒng)計(jì)降尺度等方面應(yīng)用AI算法改進(jìn)模式預(yù)報(bào);純數(shù)據(jù)驅(qū)動(dòng)模型稱為“硬AI”,該模型完全替代數(shù)值預(yù)報(bào)模式,形成端到端的預(yù)報(bào)模型。
中國學(xué)者在氣象領(lǐng)域應(yīng)用AI技術(shù)上也進(jìn)行了諸多探討。許小峰(2018)認(rèn)為中國氣象領(lǐng)域的AI應(yīng)用展現(xiàn)出了巨大的潛在價(jià)值與廣闊的應(yīng)用前景,馬雷鳴(2020)回顧了天氣預(yù)報(bào)應(yīng)用AI技術(shù)的進(jìn)展,孫健等(2021)全面歸納了AI技術(shù)在數(shù)值模式預(yù)報(bào)系統(tǒng)中的應(yīng)用。李揚(yáng)等(2021)探討了深度學(xué)習(xí)在改進(jìn)數(shù)值預(yù)報(bào)模式方面的研究進(jìn)展,包括數(shù)值預(yù)報(bào)模式的資料同化、次網(wǎng)格物理過程參數(shù)化及后處理等方面的應(yīng)用前景與挑戰(zhàn)。上述研究從不同角度梳理了AI技術(shù)在天氣預(yù)報(bào)中的應(yīng)用,但未能完全體現(xiàn)其對(duì)智能網(wǎng)格預(yù)報(bào)業(yè)務(wù)的應(yīng)用價(jià)值,尤其未能完全覆蓋智能網(wǎng)格預(yù)報(bào)業(yè)務(wù)的實(shí)際問題和應(yīng)用場(chǎng)景。AI技術(shù)的核心內(nèi)容主要包括傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)兩部分,兩者都是從有限的觀測(cè)數(shù)據(jù)中學(xué)習(xí)具有一般性的規(guī)律,并利用這些規(guī)律對(duì)未知數(shù)據(jù)進(jìn)行預(yù)測(cè)的方法。傳統(tǒng)機(jī)器學(xué)習(xí)可以看作淺層學(xué)習(xí),它的一個(gè)重要特點(diǎn)是不涉及特征學(xué)習(xí),其特征主要靠人工經(jīng)驗(yàn)或特征轉(zhuǎn)換方法來提取,這個(gè)過程稱為“特征工程”,常見的傳統(tǒng)機(jī)器學(xué)習(xí)算法有:隨機(jī)森林、邏輯回歸等方法。深度學(xué)習(xí)則是從數(shù)據(jù)中自動(dòng)學(xué)習(xí)有效的特征表示,通常用于解決傳統(tǒng)機(jī)器學(xué)習(xí)在高維特征空間擬合能力不足的問題(Hinton,et al,2006;LeCun,et al,2015)。本研究聚焦深度學(xué)習(xí)技術(shù)的相關(guān)應(yīng)用,旨在歸納和總結(jié)深度學(xué)習(xí)技術(shù)在智能網(wǎng)格預(yù)報(bào)應(yīng)用方面的研究進(jìn)展和前景,包括數(shù)值預(yù)報(bào)訂正和解釋應(yīng)用、集合天氣預(yù)報(bào)、相似集合、統(tǒng)計(jì)降尺度、純數(shù)據(jù)驅(qū)動(dòng)的預(yù)報(bào)模型和極端天氣預(yù)報(bào),同時(shí)探討深度學(xué)習(xí)在智能網(wǎng)格預(yù)報(bào)應(yīng)用中面臨的機(jī)遇、挑戰(zhàn)與應(yīng)對(duì)措施。
模式預(yù)報(bào)產(chǎn)品的訂正和解釋應(yīng)用是在數(shù)值模式基礎(chǔ)上結(jié)合觀測(cè)資料,構(gòu)建統(tǒng)計(jì)-動(dòng)力預(yù)報(bào)方法以體現(xiàn)模式無法分辨的局地天氣特征,并獲得更加精準(zhǔn)的氣象要素或其他特需服務(wù)產(chǎn)品。在目前中國的智能網(wǎng)格預(yù)報(bào)技術(shù)體系中,針對(duì)不同氣象要素、不同預(yù)報(bào)時(shí)效采用不同的解釋應(yīng)用方法(金榮花等,2019;曹勇等,2021),如中短期預(yù)報(bào)等。降水預(yù)報(bào)主要采用頻率匹配、最優(yōu)百分位等面向非連續(xù)變量的偏差訂正集成方法;溫度、風(fēng)等連續(xù)變量主要采用模式輸出統(tǒng)計(jì)(MOS,Model Output Statistics)(Glahn,et al,1972)建模方法。然而,MOS等傳統(tǒng)客觀方法主要面向單點(diǎn)或小區(qū)域建模,處理海量數(shù)據(jù)及精細(xì)化網(wǎng)格的能力有限,如逐點(diǎn)建模需要耗費(fèi)巨大計(jì)算資源;同時(shí)該方法以回歸方程建立預(yù)報(bào)因子與預(yù)報(bào)量的關(guān)系,難以體現(xiàn)空間信息對(duì)預(yù)報(bào)變量偏差訂正的影響。
基于深度學(xué)習(xí)的數(shù)值預(yù)報(bào)訂正和解釋應(yīng)用技術(shù),在挖掘大數(shù)據(jù)非線性關(guān)系和空間建模能力上展現(xiàn)出了顯著優(yōu)勢(shì)?;谏窠?jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)模型可以利用不同來源的異構(gòu)數(shù)據(jù),不僅包括各類氣象預(yù)報(bào)因子,還可應(yīng)用地形、下墊面等地理信息數(shù)據(jù),模型可以從中自動(dòng)學(xué)習(xí)預(yù)報(bào)量與其他協(xié)變量的非線性關(guān)系。另外,該技術(shù)不再局限于單點(diǎn)建模,深度學(xué)習(xí)算法具有很強(qiáng)的空間建模能力,例如卷積神經(jīng)網(wǎng)絡(luò)(CNN,Convolutional Neural Networks),該算法具有優(yōu)異的空間特征提取能力,近些年在圖像識(shí)別、數(shù)據(jù)挖掘等領(lǐng)域取得了巨大成功(LeCun,et al,2015;Krizhevsky,et al,2017)。由于天氣預(yù)報(bào)的空間相關(guān)性,將空間化預(yù)報(bào)產(chǎn)品作為圖像輸入模型,對(duì)一定范圍內(nèi)的所有站點(diǎn)或整個(gè)網(wǎng)格構(gòu)建統(tǒng)一的模型,不僅能夠節(jié)約相當(dāng)?shù)挠?jì)算資源,還能捕捉每個(gè)網(wǎng)格或站點(diǎn)的空間信息對(duì)預(yù)報(bào)偏差做訂正。因此,基于深度學(xué)習(xí)的解釋應(yīng)用技術(shù)是進(jìn)一步開展具有局地特征精細(xì)化網(wǎng)格預(yù)報(bào)的有效途徑(Vannitsem,et al,2021)。
人工神經(jīng)網(wǎng)絡(luò)(ANN,Artificial Neural Network)是深度學(xué)習(xí)方法的基礎(chǔ),通過可調(diào)節(jié)的權(quán)重將不同節(jié)點(diǎn)的非線性函數(shù)相互連接,模仿神經(jīng)系統(tǒng)形成多層網(wǎng)絡(luò)。早在20世紀(jì)末,ANN就在客觀預(yù)報(bào)統(tǒng)計(jì)后處理中得到應(yīng)用(Gardner,et al,1998;Marzban,et al,1998;Marzban,2003;Yuan,et al,2007;McGovern,et al,2017)。Salazar等(2021)基于自動(dòng)編碼結(jié)構(gòu)的ANN建立短期地面風(fēng)速訂正模型,在構(gòu)建模型時(shí)納入多個(gè)天氣變量作為輸入因子有效提高了不同地形條件下風(fēng)速預(yù)報(bào)的訂正能力。
目前,數(shù)值模式預(yù)報(bào)訂正和解釋應(yīng)用對(duì)CNN算法的應(yīng)用主要以兩類模型架構(gòu)為主(圖1)。一類是常規(guī)CNN架構(gòu)的模型,經(jīng)過堆疊多個(gè)卷積層等模塊,再鏈接一個(gè)或多個(gè)全連接層作為輸出層構(gòu)成,這種架構(gòu)的CNN模型輸出固定長度的特征向量,在圖像識(shí)別領(lǐng)域常用作對(duì)整張圖像進(jìn)行分類的工具。在模式解釋應(yīng)用領(lǐng)域,一類應(yīng)用是構(gòu)建分類模型,根據(jù)降水的不同等級(jí)對(duì)降水預(yù)報(bào)進(jìn)行訂正,陳錦鵬等(2021)基于該架構(gòu)CNN模型建立了逐時(shí)降水分級(jí)訂正模型,并證明該方法的訂正效果優(yōu)于概率匹配法,CNN模型對(duì)晴雨、弱降水(0.1—15 mm/h)和強(qiáng)降水(30 mm/h以上)訂正效果顯著,TS評(píng)分比概率匹配高出0.137、0.066和0.046。另一類應(yīng)用是構(gòu)建回歸模型,孫全德等(2019)將該架構(gòu)的CNN模型應(yīng)用于地面10 m風(fēng)速預(yù)報(bào)的訂正上。門曉磊等(2019)應(yīng)用這類CNN模型進(jìn)行華北地區(qū)1—11 d地面氣溫預(yù)報(bào)訂正,相比ECMWF預(yù)報(bào),訂正后的氣溫預(yù)報(bào)在各預(yù)報(bào)時(shí)效上的均方根誤差都有所降低。Zhou等(2019)建立了6層CNN模型應(yīng)用于分類強(qiáng)對(duì)流天氣的潛勢(shì)預(yù)報(bào),利用NCEP再分析資料開展強(qiáng)對(duì)流天氣的分類訓(xùn)練和預(yù)報(bào),其預(yù)報(bào)產(chǎn)品已在國家氣象中心強(qiáng)對(duì)流天氣預(yù)報(bào)業(yè)務(wù)中得到應(yīng)用(張小玲等,2018)。另一類CNN算法的應(yīng)用是基于語義分割模型,這種模型是一種編碼器-解碼器(Encoder-Decoder)結(jié)構(gòu)。在圖像識(shí)別領(lǐng)域,語義分割模型應(yīng)用于圖像分類、目標(biāo)檢測(cè)和圖像分割。在算法上,這種模型首先經(jīng)過多個(gè)卷積層等模塊對(duì)輸入圖像進(jìn)行特征提取,再通過上采樣計(jì)算將特征向量進(jìn)行升尺度,最后得到與原圖像分辨率一致的具有逐像素語義標(biāo)注的分割圖像。相較于常規(guī)結(jié)構(gòu)的CNN模型,語義分割模型的優(yōu)勢(shì)是保留了原始圖像的空間信息,常見的語義分割模型有FCN(Long,et al,2015)、U-Net(Ronneberger,et al,2015)等。在模式解釋應(yīng)用中應(yīng)用最廣泛的是U-Net模型,Dupuy等(2021)將U-Net模型應(yīng)用于云量預(yù)報(bào)的統(tǒng)計(jì)后處理,得到比傳統(tǒng)機(jī)器學(xué)習(xí)算法更好的訂正效果。Kudo(2021)利用U-Net模型對(duì)日本關(guān)東地區(qū)的氣溫進(jìn)行偏差訂正,該研究證明了當(dāng)數(shù)值模式對(duì)于天氣系統(tǒng)(如鋒面)的位置預(yù)報(bào)有偏差時(shí),該模型仍能有效地訂正氣溫預(yù)報(bào)。Han等(2021)基于U-Net對(duì)ECMWF全球模式在華北地區(qū)地面氣溫、相對(duì)濕度、風(fēng)速和風(fēng)向的24—240 h預(yù)報(bào)構(gòu)建訂正模型。張延彪等(2022)在Han等(2021)工作基礎(chǔ)上,對(duì)U-Net模型增加了稠密卷積模 塊(Denseblock)(Huang,et al,2017),相對(duì)于ECMWF原始預(yù)報(bào),訂正后的地面氣溫均方根誤差降低了36.39%,相對(duì)濕度降低了29.9%,10 m風(fēng)速降低了27.39%。
圖1 基于CNN算法的數(shù)值模式預(yù)報(bào)訂正和解釋應(yīng)用的常用結(jié)構(gòu)和流程Fig.1 Flowchart of statistical postprocessing for numerical weather prediction using CNN
此外,有研究利用長短期記憶(LSTM,Long Short-Term Memory)(Hochreiter,et al,1997)算法討論了時(shí)間序列特征在預(yù)報(bào)解釋應(yīng)用上的優(yōu)勢(shì)(Zhang C J,et al,2020),該算法在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN,Recurrent Neural Network)基礎(chǔ)上加入了門控機(jī)制(Gating Mechanism),解決了RNN在處理長序列時(shí)會(huì)出現(xiàn)的梯度爆炸和消失問題。Zhang C J等(2020)利用ECMWF集合預(yù)報(bào)模式的對(duì)照預(yù)報(bào)數(shù)據(jù),基于LSTM算法構(gòu)建了中國東部地區(qū)12 h不同量級(jí)的降水預(yù)報(bào)訂正模型,相對(duì)于頻率匹配及傳統(tǒng)機(jī)器學(xué)習(xí)算法,在訂正小雨和暴雨量級(jí)時(shí)的效果更好。
集合天氣預(yù)報(bào)是表達(dá)預(yù)報(bào)不確定性的重要手段。相對(duì)于確定性預(yù)報(bào),模式原始輸出的集合預(yù)報(bào)常存在一階系統(tǒng)偏差和二階離散度偏差。因此,集合預(yù)報(bào)后處理技術(shù)需要糾正系統(tǒng)偏差和調(diào)整離散度,產(chǎn)生連續(xù)的概率分布或代表連續(xù)分布抽樣的離散集合成員,以提升集合預(yù)報(bào)的可靠性和準(zhǔn)確度。集合預(yù)報(bào)統(tǒng)計(jì)后處理方法通常包括基于特定概率分布的參數(shù)化方法和靈活的非參數(shù)化方法,已有學(xué)者對(duì)應(yīng)用廣泛的集合預(yù)報(bào)統(tǒng)計(jì)后處理方法進(jìn)行了全面的回顧(Vannitsem,et al,2018;代刊等,2018)。
隨著深度學(xué)習(xí)在集合預(yù)報(bào)統(tǒng)計(jì)后處理方面的應(yīng)用,參數(shù)化和非參數(shù)化后處理技術(shù)均迎來了新的擴(kuò)展。Schultz等(2021)全面回顧了目前基于神經(jīng)網(wǎng)絡(luò)在陣風(fēng)集合預(yù)報(bào)上的后處理方法,包括幾種參數(shù)化和非參數(shù)化方案,并與傳統(tǒng)統(tǒng)計(jì)學(xué)方法和機(jī)器學(xué)習(xí)方法進(jìn)行比較,參考該工作,圖2給出了基于深度學(xué)習(xí)模型的集合預(yù)報(bào)后處理常用方法示意。
圖2 基于深度學(xué)習(xí)模型的集合預(yù)報(bào)后處理的常用方法示意Fig.2 Illustration of current statistical postprocessing methods for ensemble forecasts using deep learning models
相對(duì)于傳統(tǒng)統(tǒng)計(jì)學(xué)方法,基于深度學(xué)習(xí)的集合預(yù)報(bào)統(tǒng)計(jì)后處理展現(xiàn)出三個(gè)方面的優(yōu)勢(shì):一是深度學(xué)習(xí)模型能夠靈活地?cái)M合任意預(yù)測(cè)變量和概率分布函數(shù)的非線性關(guān)系。二是深度學(xué)習(xí)模型可以充分利用全部可用的數(shù)據(jù)作為輸入,允許加入其他預(yù)報(bào)變量以及地形、下墊面等多尺度信息;同時(shí)利用“嵌入”方法可以把站點(diǎn)信息轉(zhuǎn)化為向量輸入模型,這種嵌入將映射到整個(gè)模型訓(xùn)練過程中,從而增加模型的本地化特征,這在傳統(tǒng)統(tǒng)計(jì)學(xué)方法中是較難實(shí)現(xiàn)的,這些預(yù)報(bào)變量或本地化信息的加入對(duì)預(yù)報(bào)的效果有明顯提升作用。三是利用深度學(xué)習(xí)對(duì)所有預(yù)報(bào)站點(diǎn)或整個(gè)網(wǎng)格構(gòu)建統(tǒng)一的、具有局地適應(yīng)性的模型成為可能,這在計(jì)算上更為高效,且更易推廣到其他統(tǒng)計(jì)后處理的問題中。
參數(shù)化集合預(yù)報(bào)方法將離散的預(yù)報(bào)成員轉(zhuǎn)變?yōu)檫B續(xù)的概率分布,該方法應(yīng)用最具代表性的是集合模式輸出統(tǒng)計(jì)(EMOS,Ensemble Model Output Statistics)(Gneiting,et al,2005),預(yù)先假定預(yù)報(bào)量服從某種概率分布,通過建立預(yù)報(bào)變量與概率分布參數(shù)的函數(shù)關(guān)系進(jìn)而求解連續(xù)概率預(yù)報(bào)分布函數(shù)。基于深度學(xué)習(xí)的參數(shù)化集合預(yù)報(bào)后處理方法相對(duì)于EMOS,不再需要提前指定預(yù)報(bào)變量與概率分布參數(shù)的關(guān)系函數(shù),而是直接利用神經(jīng)網(wǎng)絡(luò)通過數(shù)據(jù)驅(qū)動(dòng)方式自動(dòng)學(xué)習(xí)任意預(yù)報(bào)變量和分布參數(shù)的非線性關(guān)系,避免預(yù)先指定關(guān)系函數(shù)的局限,因此,該方法在擬合集合預(yù)報(bào)變量和指定分布函數(shù)時(shí)更加靈活。Rasp等(2018)首次提出基于神經(jīng)網(wǎng)絡(luò)的集合預(yù)報(bào)參數(shù)化后處理方案,該工作利用ANN確定地面氣溫集合預(yù)報(bào)高斯分布的參數(shù)。在構(gòu)建神經(jīng)網(wǎng)絡(luò)模型時(shí),將其他集合預(yù)報(bào)因子作為輸入放入模型,同時(shí)嵌入站點(diǎn)信息,利用連續(xù)排序概率得分(CRPS,Continuous Ranked Probability Score)作為損失函數(shù)進(jìn)行模型訓(xùn)練。結(jié)果表明,相較于EMOS和機(jī)器學(xué)習(xí)等方法,基于神經(jīng)網(wǎng)絡(luò)訂正后氣溫集合預(yù)報(bào)的CRPS改善明顯,相對(duì)于ECMWF原始預(yù)報(bào),EMOS訂正后的氣溫預(yù)報(bào)CRPS降低了13%,基于神經(jīng)網(wǎng)絡(luò)的CRPS降低了29%。Ghazvinian等(2021)將該方法應(yīng)用于中、短期降水集合預(yù)報(bào)的訂正,利 用ANN擬 合 刪 失 偏 移 的Γ分 布(CSGD,Censored Shifted Gamma Distribution)的參數(shù)來訂正降水概率預(yù)報(bào)。
基于深度學(xué)習(xí)的非參數(shù)化集合預(yù)報(bào)后處理方案,目標(biāo)是預(yù)測(cè)集合預(yù)報(bào)變量的完整概率分布。以目前的研究來看,實(shí)現(xiàn)這一目標(biāo)主要有3種方法(圖2):一是基于神經(jīng)網(wǎng)絡(luò)的條件分位數(shù)回歸方法(Xu,et al,2017;Cannon,2018),該方法是分位數(shù)回歸方法(Bremnes,2004)的擴(kuò)展,這種方法利用神經(jīng)網(wǎng)絡(luò)得到分位數(shù)函數(shù)的近似值,從而擬合預(yù)報(bào)變量的概率分布。Cannon(2018)提出用單調(diào)復(fù)合分位數(shù)回歸神經(jīng)網(wǎng)絡(luò)模型估計(jì)極端降水。Bremnes(2020)將分位數(shù)函數(shù)改進(jìn)為伯恩斯坦多項(xiàng)式的線性組合,其系數(shù)通過神經(jīng)網(wǎng)絡(luò)計(jì)算得到,在訓(xùn)練模型時(shí)所用的損失函數(shù)是分位數(shù)損失。第2種是適用性更強(qiáng)的概率分布估計(jì)方法,該方法通過直方圖將預(yù)報(bào)變量進(jìn)行離散化處理,將預(yù)估預(yù)報(bào)變量的概率分布問題轉(zhuǎn)化為分類任務(wù),通過神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)預(yù)報(bào)要素在預(yù)先指定的分倉值(Bins)內(nèi)的概率來估計(jì)概率密度分布,實(shí)現(xiàn)這種方法的方式之一是在深度學(xué)習(xí)模型的輸出層使用softmax激活函數(shù),訓(xùn)練模型的損失函數(shù)可以是分類交叉熵(Categorical cross-entropy),也可以是CRPS或負(fù)對(duì)數(shù)似然估計(jì)(Negative log-likelihood)等(Veldkamp,et al,2021)。Scheuerer等(2020)利用該方法基于ANN對(duì)中、短期降水集合預(yù)報(bào)進(jìn)行統(tǒng)計(jì)后處理,相對(duì)于傳統(tǒng)方法得到了更高的降水概率預(yù)報(bào)可靠性。上述工作主要以ANN建模,然而簡單的神經(jīng)網(wǎng)絡(luò)并不適用于高維空間數(shù)據(jù),越來越多的工作將CNN算法應(yīng)用于集合預(yù)報(bào)統(tǒng)計(jì)后處理中。Veldkamp等(2021)基于CNN通過直方圖訂正方法對(duì)風(fēng)速集合預(yù)報(bào)的概率分布進(jìn)行建模,構(gòu)建CNN模型時(shí)將站點(diǎn)周圍一定區(qū)域內(nèi)的空間變量輸入模型進(jìn)行訓(xùn)練,這項(xiàng)工作還比較了線性回歸、分位數(shù)回歸森林(QRF,Quantile regression forests)(Meinshausen,2006;Taillardat,et al,2016)、神經(jīng)網(wǎng)絡(luò)的參數(shù)化和非參數(shù)化方案對(duì)未來48 h風(fēng)速概率預(yù)報(bào)的訂正能力,結(jié)果表明基于CNN且使用softmax作為輸出層的訂正模型具有最好的訂正技能,訂正后風(fēng)速的均方根誤差比線性回歸方法降低了21.2%,比QRF方法降低了14.8%,且對(duì)于較大風(fēng)速(超過10 m/s)的訂正效果好于其他方法。Gr?nquist等(2021)基于U-Net模型實(shí)現(xiàn)了850 hPa溫度和500 hPa位勢(shì)高度集合預(yù)報(bào)的偏差訂正。第3種方法是Finn(2021)提出的將基于自注意機(jī)制的Transformer(Vaswani,et al,2017)模型應(yīng)用于集合預(yù)報(bào)統(tǒng)計(jì)后處理,該方法是逐成員訂 正(MBM,Member-By-Member)(van Schaeybroeck,et al,2015)的擴(kuò)展。Finn(2021)的工作表明,自注意機(jī)制可以學(xué)習(xí)集合成員之間的相互作用,Transformer模型能夠從集合成員之間的相互作用中提取額外信息,從而有效訂正集合預(yù)報(bào)的系統(tǒng)偏差和離散度偏差。另一大亮點(diǎn)是,該模型不再利用集合成員的統(tǒng)計(jì)量,而是直接處理全部集合成員,并且輸出訂正后空間連貫的一組集合成員。為了與簡單神經(jīng)網(wǎng)絡(luò)模型進(jìn)行對(duì)比,該工作引用Rasp等(2018)的 工 作 結(jié)果,對(duì)ECMWF的 地 面2 m氣溫集合預(yù)報(bào)進(jìn)行偏差訂正,結(jié)果表明,Transformer模型的訂正預(yù)報(bào)準(zhǔn)確率更高,比ECMWF原始集合預(yù)報(bào)和Rasp等(2018)神經(jīng)網(wǎng)絡(luò)模型的CRPS分別降低了21.1%和2.4%。
此外,量化預(yù)報(bào)的不確定是集合預(yù)報(bào)的目標(biāo)之一。Gr?nquist等(2021)基于ResNet架構(gòu)建立集合預(yù)報(bào)的不確定量化模型,ResNet架構(gòu)是基于殘差學(xué)習(xí)模塊的CNN模型(He,et al,2016),相對(duì)于一般結(jié)構(gòu)的CNN模型,ResNet可以構(gòu)建更深的網(wǎng)絡(luò)層數(shù)而不易過擬合,從而有更好的空間特征提取能力。該研究證明了將深度學(xué)習(xí)應(yīng)用于集合預(yù)報(bào)的不確定性量化可以有效提高集合預(yù)報(bào)不確定性的量化技能,同時(shí),只需少量集合成員就能夠提供比原始集合成員更有效的預(yù)報(bào)不確定性信息,由此大幅度減少集合預(yù)報(bào)模式的計(jì)算量。
相似集合(AnEn,Analog Ensemble)是一種基于相似理論、大數(shù)據(jù)挖掘和集合預(yù)報(bào)思路的統(tǒng)計(jì)后處理方法(Delle Monache,et al,2011,2013),該方法假設(shè)在長期、穩(wěn)定的數(shù)值模式預(yù)報(bào)中對(duì)于同一地點(diǎn)、相同起報(bào)時(shí)間和預(yù)報(bào)時(shí)效具有穩(wěn)定的預(yù)報(bào)性能(即具有相似的預(yù)報(bào)誤差分布特征),通過尋找與當(dāng)前預(yù)報(bào)最相似的若干歷史預(yù)報(bào),由其預(yù)報(bào)量的觀測(cè)值組成相似集合,并利用集合預(yù)報(bào)的概念生成訂正后 的 確 定 性 和 概 率 預(yù) 報(bào)(Delle Monache,et al,2013;Junk,et al,2015)。AnEn方法已在氣象要素預(yù)報(bào)訂正、極端天氣事件預(yù)估、統(tǒng)計(jì)降尺度等方面獲 得 廣 泛 應(yīng) 用(Keller,et al,2017;Sperati,et al,2017;Alessandrini,et al,2019;王在文等,2019)。
將深度學(xué)習(xí)技術(shù)引入AnEn主要是利用深度學(xué)習(xí)模型生成概率預(yù)報(bào)。Cervone等(2017)提出了一種基于ANN的AnEn方法,生成光伏發(fā)電站未來72 h發(fā)電量的概率預(yù)報(bào),首先利用ANN生成確定性預(yù)報(bào),再將預(yù)報(bào)結(jié)果作為AnEn中的附加預(yù)報(bào)因子組成相似集合。Fanfarillo等(2021)利用條件變分自編碼器(CVAE,Conditional Variational Auto Encoder)(Sohn,et al,2015)生成基于相似集合的概率預(yù)報(bào),CVAE是一種深度生成模型(DGM,Deep Generative Model),DGM是以概率的形式隨機(jī)生成觀測(cè)數(shù)據(jù)的模型,常用于概率密度估計(jì)和生成樣本?;贑VAE的AnEn方法通過訓(xùn)練模型學(xué)習(xí)歷史氣象觀測(cè)數(shù)據(jù)集中預(yù)報(bào)要素的概率分布,相較于原始AnEn方法,在相似集合的組成方式上不再使用一組相似的實(shí)際觀測(cè)數(shù)據(jù)集合,而是使用預(yù)報(bào)要素的概率分布直接生成訂正后的概率預(yù)報(bào)。預(yù)報(bào)性能方面,目前AnEn更好,然而,AnEn方法的計(jì)算成本較大,需要將歷史預(yù)報(bào)數(shù)據(jù)和觀測(cè)數(shù)據(jù)集保存在內(nèi)存里,而CVAE模型不需要內(nèi)存的消耗,因此能夠節(jié)省大量的計(jì)算資源和時(shí)間。
原始AnEn方法在計(jì)算歷史預(yù)報(bào)與當(dāng)前預(yù)報(bào)的“相似度”時(shí),以兩者的歐式距離作為相似性指標(biāo)(Delle Monache,et al,2013)。Hu等(2021)提出全新的基于深度學(xué)習(xí)的相似性指標(biāo)和相似集合計(jì)算流程,該流程顛倒了原始AnEn方法的計(jì)算過程,首先找到與目標(biāo)預(yù)報(bào)相似的一組歷史觀測(cè)值,搜索相對(duì)應(yīng)的歷史預(yù)報(bào)組成相似集合;該流程的實(shí)現(xiàn)基于LSTM算法,通過建立模式預(yù)報(bào)誤差與觀測(cè)之間的模型得到。這項(xiàng)工作優(yōu)化了原始AnEn方法,突破了計(jì)算歐氏距離需要進(jìn)行特征選擇和權(quán)重優(yōu)化的限制,利用深度學(xué)習(xí)空間建模能力,允許輸入更多預(yù)報(bào)因子,能夠靈活地建立模式預(yù)報(bào)誤差與觀測(cè)的非線性關(guān)系。同時(shí),該方法對(duì)于數(shù)值模式更新具有更高的魯棒性。
統(tǒng)計(jì)降尺度用于實(shí)現(xiàn)模式預(yù)報(bào)要素從粗網(wǎng)格到細(xì)網(wǎng)格的轉(zhuǎn)化。傳統(tǒng)的降尺度方法通過雙線性插值實(shí)現(xiàn),忽略了低分辨率和高分辨率預(yù)報(bào)要素的統(tǒng)計(jì)關(guān)系,準(zhǔn)確度有限。在目前的智能網(wǎng)格預(yù)報(bào)業(yè)務(wù)中,降水的統(tǒng)計(jì)降尺度采用比例矢量降尺度技術(shù)(曹勇等,2016)。有研究(Sachindra,et al,2018;Yang,et al,2018;Vandal,et al,2019)對(duì)過去經(jīng)典的降尺度技術(shù)和傳統(tǒng)機(jī)器學(xué)習(xí)算法進(jìn)行比較,結(jié)果表明沒有哪種算法有明顯的優(yōu)勢(shì)。鑒于深度學(xué)習(xí)優(yōu)異的圖像重構(gòu)能力,給統(tǒng)計(jì)降尺度技術(shù)帶來了可期待的潛力。
深度學(xué)習(xí)作為擅長挖掘數(shù)據(jù)間非線性映射關(guān)系的技術(shù),已在統(tǒng)計(jì)降尺度中得到了應(yīng)用。Misra等(2018)利用長、短期記憶循環(huán)神經(jīng)網(wǎng)絡(luò)(RNNLSTM)進(jìn)行統(tǒng)計(jì)降尺度,相較于傳統(tǒng)回歸方法,RNN-LSTM模型能夠更好地反映局地降雨的時(shí)、空關(guān)系。Pan等(2019)利用CNN進(jìn)行統(tǒng)計(jì)降尺度以改善模式降水預(yù)報(bào)的分辨率,與線性回歸、鄰回歸、隨機(jī)森林或全連接深度神經(jīng)網(wǎng)絡(luò)相比表現(xiàn)出明顯優(yōu)勢(shì)。Ba?o-Medina等(2020)評(píng)估了CNN模型在氣溫和降水統(tǒng)計(jì)降尺度上的性能,結(jié)果優(yōu)于線性和廣義線性方法,并能在細(xì)網(wǎng)格上重現(xiàn)氣溫極端值。
超分辨率(SR,Super-Resolution)是深度學(xué)習(xí)在計(jì)算機(jī)視覺中提高圖像或視頻分辨率的圖像處理技術(shù)。近年來,基于深度學(xué)習(xí)的超分辨率重構(gòu)技術(shù)取得了重大突破,極大提高了圖像超分辨率重建的準(zhǔn)確度,Wang等(2021)全面回顧了SR技術(shù)的發(fā)展歷程和最新進(jìn)展,該技術(shù)為氣象領(lǐng)域統(tǒng)計(jì)降尺度提供了新的契機(jī)。
超分辨率卷積神經(jīng)網(wǎng)絡(luò)(SRCNN,Super-Resolution Convolutional Neural Network)是深度學(xué)習(xí)在SR技術(shù)上的開山之作(Chao,et al,2014)。Vandal等(2017)提出深度統(tǒng)計(jì)降尺度技術(shù)(Deep Statistical Downscaling,DeepSD),是首次將SR技術(shù)應(yīng)用于氣象領(lǐng)域。Deep SD用多尺度輸入通道增強(qiáng)了SRCNN,最大限度地提高了統(tǒng)計(jì)降尺度的可預(yù)測(cè)性。至此,SRCNN和Deep SD成為基于深度學(xué)習(xí)技術(shù)在統(tǒng)計(jì)降尺度方面的基準(zhǔn)模型。Kumar等(2021)比較了SRCNN、堆疊SRCNN和Deep SD三種算法在降水預(yù)報(bào)上的統(tǒng)計(jì)降尺度效果,結(jié)果表明基于Deep SD算法的均方根誤差最小。H?hlein等(2020)提出基于U-Net架構(gòu)的統(tǒng)計(jì)降尺度模型(Deep RU),結(jié) 果 表 明Deep RU能 夠 實(shí) 現(xiàn) 其他CNN算法降尺度模型無法重建的風(fēng)場(chǎng)結(jié)構(gòu),且計(jì)算高效。Sha等(2020a,2020b)對(duì)U-Net模型進(jìn)行了改進(jìn),實(shí)現(xiàn)了美國西部地區(qū)從0.258°到4 km網(wǎng)格氣溫、降水的統(tǒng)計(jì)降尺度,與原U-Net相比,該模型的平均絕對(duì)誤差降低10%以上。
近些年,SR技術(shù)的發(fā)展趨勢(shì)由以CNN算法為基礎(chǔ)的統(tǒng)計(jì)降尺度模型向DGM轉(zhuǎn)變。在統(tǒng)計(jì)降尺度中應(yīng)用最廣泛的DGM是生成式對(duì)抗網(wǎng)絡(luò)(GAN,Generative Adversarial Networks)(Goodfellow,et al,2014),GAN是近些年復(fù)雜分布無監(jiān)督學(xué)習(xí)最具前景的方法之一。GAN由生成模型和判別模型組成,通過兩類模型的對(duì)抗行為優(yōu)化模型參數(shù),產(chǎn)生新的樣本。增強(qiáng)超分辨率GAN模型(ESRGAN,Enhanced Super-Resolution Generative Adversarial Networks)(Wang,et al,2018)是這類方法在統(tǒng)計(jì)降尺度上的典型模型,Singh等(2019)利用ESRGAN模型對(duì)地面風(fēng)速實(shí)現(xiàn)4倍分辨率的統(tǒng)計(jì)降尺度,與雙三次插值和SRCNN算法進(jìn)行對(duì)比,ESRGAN模型結(jié)果的峰值信噪比(PSNR,Peak Signal to Noise Ration)有了明顯改善,這表明ESRGAN對(duì)高頻功率譜的信息捕捉得更好。然而,GAN仍存在一定局限,包括模型訓(xùn)練難以收斂、生成樣本缺乏多樣性且不可控等,針對(duì)這些問題,Goodfellow等(2014)提出條件生成對(duì)抗網(wǎng)絡(luò)(CGAN,Conditional Generative Adversarial Nets),對(duì)生成模型或判別模型引入額外信息作為約束條件。Leinonen等(2021)分別利用低分辨率雷達(dá)數(shù)據(jù)和衛(wèi)星數(shù)據(jù)作為約束條件構(gòu)建CGAN模型,實(shí)現(xiàn)降水預(yù)報(bào)的時(shí)間降尺度。Price等(2022)利用細(xì)網(wǎng)格雷達(dá)觀測(cè)數(shù)據(jù)構(gòu)建CGAN模型,同時(shí)實(shí)現(xiàn)了大尺度全球數(shù)值模式預(yù)報(bào)的訂正和統(tǒng)計(jì)降尺度,輸入模型的預(yù)報(bào)數(shù)據(jù)是ECMWF集合預(yù)報(bào)并采用雙線性插值至32 km,輸出4 km網(wǎng)格美國地區(qū)的降水集合預(yù)報(bào),其預(yù)報(bào)性能比線性方法、基于CNN降尺度模型要好,CRPS和各等級(jí)降水Brier分?jǐn)?shù)與區(qū)域模式區(qū)域高分辨率集合模式(HREF,High-Resolution Ensemble Forecast)相當(dāng)。這是具有啟發(fā)性和突破性的,利用深度學(xué)習(xí)技術(shù)將大尺度全球模式預(yù)報(bào)降尺度至高分辨率預(yù)報(bào)只需要幾秒鐘,而高分辨率區(qū)域模式的計(jì)算成本則是較大的,且兩者的預(yù)報(bào)性能相當(dāng),由此對(duì)運(yùn)行高成本區(qū)域模式的必要性提出了思考。
近些年,隨著高分辨率、高頻率衛(wèi)星、雷達(dá)等氣象觀測(cè)數(shù)據(jù)和數(shù)值天氣預(yù)報(bào)模式輸出數(shù)據(jù)的指數(shù)級(jí)增長以及深度學(xué)習(xí)技術(shù)的飛速發(fā)展,使得天氣預(yù)報(bào)由深度學(xué)習(xí)模型直接輸出成為可能。純數(shù)據(jù)驅(qū)動(dòng)預(yù)報(bào)模型作為“硬AI”,獨(dú)立于數(shù)值預(yù)報(bào)模式,不再通過求解復(fù)雜的物理微分方程,而是通過深度學(xué)習(xí)算法建立數(shù)據(jù)間的非線性關(guān)系并輸出預(yù)報(bào)結(jié)果,形成端到端的天氣預(yù)報(bào)過程,是深度學(xué)習(xí)技術(shù)在天氣預(yù)報(bào)領(lǐng)域的研究熱點(diǎn)。
純數(shù)據(jù)驅(qū)動(dòng)模型首先在臨近預(yù)報(bào)中獲得廣泛應(yīng)用。由于模式啟動(dòng)時(shí)間、非高斯數(shù)據(jù)同化等問題,數(shù)值預(yù)報(bào)模式在0—2 h臨近預(yù)報(bào)上表現(xiàn)不佳(Sun,2005;Buehner,et al,2020);雷達(dá)回波外推是氣象臨近預(yù)報(bào)業(yè)務(wù)的重要手段(Germann,et al,2002,2004),目前,投入業(yè)務(wù)應(yīng)用的方法主要基于光流法(Optical flow)(Horn,et al,1981),但由于拉格朗日守恒和平滑運(yùn)動(dòng)場(chǎng)假設(shè),這類方法仍存在無法判斷系統(tǒng)生消演變等特征的局限(Prudden,et al,2020)。
基于深度學(xué)習(xí)的臨近預(yù)報(bào)模型不依賴物理框架,通過雷達(dá)等觀測(cè)數(shù)據(jù)訓(xùn)練模型并預(yù)報(bào)回波的運(yùn)動(dòng)過程,可以很好地模擬傳統(tǒng)方法難以預(yù)測(cè)的非線性降水,已有研究對(duì)這方面工作做了全面回顧(Shi,et al,2018;Prudden,et al,2020;周康輝等,2021a)。最早應(yīng)用神經(jīng)網(wǎng)絡(luò)做降水臨近預(yù)報(bào)的是French等(1992)的工作,但該研究并沒有發(fā)現(xiàn)比拉格朗日守恒更高的預(yù)報(bào)技巧。一個(gè)里程碑式的工作是Shi等(2015)提出的基于卷積長短時(shí)記憶模型(Conv LSTM,Convolutional LSTM),該模型成功實(shí)現(xiàn)了臨近降水量預(yù)報(bào),ConvLSTM融合了CNN提取圖像特征和LSTM處理序列數(shù)據(jù)的能力,解決了時(shí)、空序列預(yù)報(bào)問題,相比光流法展現(xiàn)出更好的時(shí)、空捕捉能力。隨后,數(shù)據(jù)驅(qū)動(dòng)短期臨近預(yù)報(bào)取得了快速發(fā)展(Shi,et al,2017,2018)。Agrawal等(2019)把臨近降水預(yù)報(bào)當(dāng)作圖像問題進(jìn)行處理,利用雷達(dá)場(chǎng)數(shù)據(jù)進(jìn)行基于CNN的U-Net模型訓(xùn)練,得到未來1小時(shí)1 km空間分辨率的降水預(yù)報(bào),其預(yù)報(bào)準(zhǔn)確率超過了基于光流法的模型,然而當(dāng)預(yù)報(bào)時(shí)效超過5 h,數(shù)值預(yù)報(bào)模式將優(yōu)于U-Net。Google公司提出基于注意力機(jī)制的深度學(xué)習(xí)降水預(yù)報(bào)模型MetNet(Kaae S?nderby,et al,2020),該模型融合了雷達(dá)、衛(wèi)星、降水等觀測(cè)數(shù)據(jù),實(shí)現(xiàn)了1 km空間分辨率、2 min時(shí)間分辨率在美國區(qū)域提前7—8 h的降水預(yù)報(bào),該模型預(yù)測(cè)的1 mm降水準(zhǔn)確率超過了快速更新同化高分辨率數(shù)值模式(HRRR,High Resolution Rapid Refresh)的臨近降水預(yù)報(bào),同時(shí)計(jì)算效率大幅度提高。清華大學(xué)軟件學(xué)院分別提出預(yù)測(cè)循環(huán)神經(jīng)網(wǎng)絡(luò)(PredRNN,Predictive Recurrent Neural Network)和 運(yùn) 動(dòng) 循 環(huán) 神 經(jīng) 網(wǎng) 絡(luò)(Motion-RNN,Motion Recurrent Neural Network)模 型(Wang,et al,2017,2021),對(duì)捕捉和預(yù)測(cè)動(dòng)作空間和時(shí)間內(nèi)部復(fù)雜變化的能力有顯著提升,并應(yīng)用于短時(shí)臨近雷達(dá)回波的預(yù)報(bào)。針對(duì)強(qiáng)對(duì)流天氣預(yù)報(bào),中國的強(qiáng)對(duì)流天氣研究進(jìn)展與天氣雷達(dá)、氣象衛(wèi)星、閃電定位儀、自動(dòng)氣象站等觀測(cè)密切相關(guān)(Zhang X L,et al,2020;俞小鼎等,2020),Zhou等(2020)融合了雷達(dá)回波、衛(wèi)星云圖、閃電密度等多源觀測(cè)資料,基于CNN構(gòu)建語義分割模型提取中國部分地區(qū)閃電時(shí)空發(fā)生、發(fā)展特征,實(shí)現(xiàn)了0—1 h的閃電預(yù)報(bào),且具備一定的對(duì)流系統(tǒng)生消演變的預(yù)報(bào)能力。
然而,數(shù)據(jù)驅(qū)動(dòng)臨近降水預(yù)報(bào)出現(xiàn)的普遍問題是隨著時(shí)間推移,回波會(huì)越來越平滑、強(qiáng)度會(huì)越來越弱(Shi,et al,2017;Ayzel,et al,2020),這使深度學(xué)習(xí)模型在預(yù)報(bào)大量級(jí)降水時(shí)會(huì)出現(xiàn)嚴(yán)重低估的現(xiàn)象。這種現(xiàn)象出現(xiàn)的主要原因是模型訓(xùn)練時(shí)為了使損失函數(shù)最小化,深度學(xué)習(xí)的算法策略會(huì)減弱對(duì)峰值的預(yù)測(cè),趨向于用平均值替代。為了改善由損失函數(shù)帶來的不確定性,有研究者提出應(yīng)用DGM進(jìn)行臨近預(yù)報(bào),這類模型學(xué)習(xí)可觀測(cè)樣本的概率密度并隨機(jī)生成新樣本,其損失函數(shù)是數(shù)據(jù)分布與模型分布的距離,在估計(jì)兩者距離上,傳統(tǒng)方法通常是求解極大似然函數(shù)。GAN(Goodfellow,et al,2014)作為一類典型的DGM,它的成功就在于將難以求解的似然函數(shù)轉(zhuǎn)化成神經(jīng)網(wǎng)絡(luò),讓模型自己訓(xùn)練出合適的參數(shù)擬合似然函數(shù)。Deep Mind公司研發(fā)了基于CGAN從雷達(dá)數(shù)據(jù)的條件分布中生成臨近降水概率預(yù)報(bào)模型(Ravuri,et al,2021),該模型引入有條件的正則化項(xiàng)用于懲罰真實(shí)雷達(dá)序列和模型預(yù)測(cè)平均值的網(wǎng)格分辨率偏差,該模型比平流法(PySTEPS)能更好地捕捉環(huán)流系統(tǒng)的強(qiáng)度和結(jié)構(gòu),在所有降水等級(jí)上都具有更好的預(yù)報(bào)準(zhǔn)確率,相對(duì)于U-Net生成了更接近實(shí)況的大量級(jí)降水預(yù)報(bào)。除了臨近降水預(yù)報(bào),利用深度學(xué)習(xí)空間相關(guān)的建模能力,有學(xué)者還對(duì)氣象觀測(cè)數(shù)據(jù)不足且局地性強(qiáng)的山谷地區(qū)進(jìn)行臨近預(yù)報(bào),Dupuy等(2019)利用山谷周邊的氣象觀測(cè)數(shù)據(jù)基于ANN生成了局地山谷風(fēng)速和風(fēng)向的臨近預(yù)報(bào)。
對(duì)于中、短期預(yù)報(bào),已有研究(Weyn,et al,2021;Rasp,et al,2021;Chattopadhyay,et al,2022;Keisler,2022;Pathak,et al,2022)探索利用純數(shù)據(jù)驅(qū)動(dòng)模型直接預(yù)報(bào)的可行性。這類模型主要基于數(shù)值天氣預(yù)報(bào)模式輸出的長序列數(shù)據(jù)集進(jìn)行訓(xùn)練,其中,Rasp等(2021)以及Weyn等(2021)構(gòu)建模型應(yīng)用的算法都是CNN,這兩項(xiàng)工作構(gòu)建全球天氣預(yù)報(bào)模型的空間分辨率相對(duì)較低,分別是5.625°和1.9°,預(yù)報(bào)性能僅與常見低分辨率數(shù)值模式相當(dāng)。Pathak等(2022)構(gòu)建了基于傅里葉變換的神經(jīng)網(wǎng)絡(luò)預(yù)報(bào)模 型(FourCastNet,F(xiàn)ourier ForeCasting Neural Network),應(yīng)用的深度學(xué)習(xí)算法主要是Vision Transformer(Dosovitskiy,et al,2021),該模型的空間分辨率達(dá)到0.25°,能夠提供全球短、中期地面風(fēng)速和降水量等預(yù)報(bào),其預(yù)報(bào)性能與ECMWF綜合預(yù)報(bào)系統(tǒng)(IFS,Integrated Forecasting System)相當(dāng)。同時(shí),F(xiàn)ourCastNet能夠以不到2 s的時(shí)間生成未來7 d的預(yù)報(bào),比ECMWF IFS快了幾個(gè)數(shù)量級(jí)。Keisler(2022)利用圖神經(jīng)網(wǎng)絡(luò)(GNNs,Graph Neural Networks)(Pfaff,et al,2020)構(gòu)建全球天氣預(yù)報(bào)模型,提供關(guān)鍵等壓面上位勢(shì)高度、溫度、風(fēng)等6個(gè)變量未來6 d的預(yù)報(bào),空間分辨率為1°,其預(yù)報(bào)準(zhǔn)確率與ECMWF IFS和GFS(Global Forecast System)的水平相當(dāng)。
數(shù)值預(yù)報(bào)模式通常難以準(zhǔn)確理解和模擬極端天氣的物理過程,因此極端天氣預(yù)報(bào)一直是天氣預(yù)報(bào)領(lǐng)域的難題。Liu等(2016)基于氣候數(shù)據(jù)集,首次利用CNN模型檢測(cè)到數(shù)據(jù)集中的極端天氣,但該項(xiàng)工作并沒有擴(kuò)展到極端天氣預(yù)報(bào)上。
基于深度學(xué)習(xí)的純數(shù)據(jù)驅(qū)動(dòng)模型,在預(yù)報(bào)臨近極端天氣方面展現(xiàn)出新的前景和挑戰(zhàn)。Guastavino等(2021)結(jié)合CNN和LSTM算法構(gòu)建模型,利用雷達(dá)數(shù)據(jù)實(shí)現(xiàn)臨近雷暴天氣的預(yù)報(bào)、預(yù)警。在2.5節(jié)中已提到,深度學(xué)習(xí)在臨近降水預(yù)報(bào)中面臨的主要挑戰(zhàn)是預(yù)報(bào)結(jié)果過于平滑,這種缺陷會(huì)導(dǎo)致極端天氣被嚴(yán)重低估(Frei,et al,2019;Foresti,et al,2019);即使改進(jìn)損失函數(shù)的設(shè)計(jì)仍難以避免這一問題(Brehmer,et al,2019)。為提高極端降水預(yù)報(bào)技能,F(xiàn)ranch等(2020)提出以模型堆疊(stacking)的方式構(gòu)建深度模型集合,并在模型訓(xùn)練中加入地形數(shù)據(jù),模型輸出不同降水等級(jí)閾值的概率分布來判斷極端降水發(fā)生的概率,依此提高極端降水臨近預(yù)報(bào)的能力。
針對(duì)中、短期極端天氣預(yù)報(bào),純數(shù)據(jù)驅(qū)動(dòng)預(yù)報(bào)模型的價(jià)值主要體現(xiàn)在能夠快速輸出大量集合預(yù)報(bào) 樣 本(Weyn,et al,2021;Chattopadhyay,et al,2022;Pathak,et al,2022),從而有利于改善概率預(yù)報(bào),在一定程度上提高極端天氣事件早預(yù)警的可靠性。數(shù)值預(yù)報(bào)模式生成集合預(yù)報(bào)的計(jì)算成本較高,而通過數(shù)據(jù)驅(qū)動(dòng)深度學(xué)習(xí)模型生成大規(guī)模集合預(yù)報(bào)的速度比傳統(tǒng)模式快幾個(gè)量級(jí),計(jì)算成本要低很多。Pathak等(2022)構(gòu)建的FourCastNet模型一旦訓(xùn)練完成,僅用幾秒便可以生成有上千個(gè)集合成員的集合預(yù)報(bào),但在極端天氣預(yù)報(bào)技能上,該模型的極端降水預(yù)報(bào)仍不及ECMWF IFS模式。Chattopadhyay等(2020)利用500 hPa高度場(chǎng)和平均溫度場(chǎng)的集合預(yù)報(bào)數(shù)據(jù)進(jìn)行模型訓(xùn)練,以相似預(yù)報(bào)的思路實(shí)現(xiàn)了北美地區(qū)未來1—5 d極端氣溫的預(yù)報(bào),對(duì)北美地區(qū)未來5 d內(nèi)寒潮或熱浪事件的發(fā)生和區(qū)域的準(zhǔn)確率達(dá)到80%。這項(xiàng)工作利用的深度學(xué)習(xí)算法 是 膠囊神經(jīng)網(wǎng)絡(luò)(CapsNets,Capsule Neural Networks)(Sabour,et al,2017),該算法是在圖像識(shí)別領(lǐng)域中提出的,解決了CNN算法無法分辨提取的特征屬性之間關(guān)系的缺陷。在中、長期預(yù)報(bào)方面,Jacques-Dumas等(2021)利用氣候模式輸出的長達(dá)1000 a的氣象數(shù)據(jù)集,基于CNN模型提前15 d預(yù)報(bào)出持續(xù)熱浪事件。
目前,大部分面向氣象學(xué)科的深度學(xué)習(xí)算法還處于研發(fā)階段,實(shí)際應(yīng)用效果還有待評(píng)估(Irrgang,et al,2021)。與理論研究不同,深度學(xué)習(xí)技術(shù)要在智能網(wǎng)格預(yù)報(bào)業(yè)務(wù)體系中應(yīng)用還將面臨諸多挑戰(zhàn),根本挑戰(zhàn)體現(xiàn)在以下三個(gè)方面:一是氣象領(lǐng)域的學(xué)者或業(yè)務(wù)人員對(duì)深度學(xué)習(xí)算法的認(rèn)識(shí)不足,包括如何從眾多深度學(xué)習(xí)算法中選擇適用于智能網(wǎng)格預(yù)報(bào)業(yè)務(wù)應(yīng)用的算法等。二是數(shù)據(jù)基礎(chǔ),這是深度學(xué)習(xí)在智能網(wǎng)格預(yù)報(bào)應(yīng)用的最根本挑戰(zhàn)。深度學(xué)習(xí)只是一個(gè)工具,其應(yīng)用完全依賴于高質(zhì)量、可靠的數(shù)據(jù)集,然而目前中國可用于AI算法訓(xùn)練的數(shù)據(jù)集還較為缺乏。三是深度學(xué)習(xí)對(duì)預(yù)報(bào)機(jī)理的解釋不足,從而導(dǎo)致氣象領(lǐng)域?qū)W者或業(yè)務(wù)人員對(duì)深度學(xué)習(xí)的可信度和可用性的理解不充分,對(duì)深度學(xué)習(xí)技術(shù)的接受度不高。
基于上述挑戰(zhàn),提出七點(diǎn)具體的應(yīng)對(duì)措施進(jìn)行討論,包括算法的選擇、數(shù)據(jù)基礎(chǔ)、多源數(shù)據(jù)融合及模型的可解釋性、可信度、可用性和工程化。
深度學(xué)習(xí)技術(shù)是以處理計(jì)算機(jī)視覺等問題為核心發(fā)展起來的,氣象領(lǐng)域的研究人員首先要面臨的挑戰(zhàn)是如何從眾多算法中選擇適合的算法來解決實(shí)際預(yù)報(bào)問題,如何連接深度學(xué)習(xí)技術(shù)與智能網(wǎng)格預(yù)報(bào)業(yè)務(wù)需求,如何評(píng)估深度學(xué)習(xí)在智能網(wǎng)格預(yù)報(bào)業(yè)務(wù)中的適用性等問題。這就要求氣象研究人員對(duì)深度學(xué)習(xí)的主要算法、模型架構(gòu)有深入理解,通過開展深度學(xué)習(xí)算法在智能網(wǎng)格預(yù)報(bào)各個(gè)環(huán)節(jié)上的研究和試驗(yàn),了解各類算法的優(yōu)缺點(diǎn)和適用性,根據(jù)氣象領(lǐng)域知識(shí)建立一套算法評(píng)估體系,針對(duì)不同預(yù)報(bào)任務(wù)、不同預(yù)報(bào)要素、不同預(yù)報(bào)時(shí)效等的深度學(xué)習(xí)算法應(yīng)用進(jìn)行比較和優(yōu)化,以實(shí)現(xiàn)深度學(xué)習(xí)技術(shù)在智能網(wǎng)格預(yù)報(bào)業(yè)務(wù)中的應(yīng)用。表2是深度學(xué)習(xí)技術(shù)在智能網(wǎng)格預(yù)報(bào)各環(huán)節(jié)的算法、應(yīng)用效果和主要參考文獻(xiàn),供研究人員參考。
表2 深度學(xué)習(xí)技術(shù)在智能網(wǎng)格預(yù)報(bào)應(yīng)用的主要算法和模型列表Table 2 List of main algorithms and models of deep learning in intelligent grid weather forecasting
深度學(xué)習(xí)技術(shù)在智能網(wǎng)格預(yù)報(bào)中應(yīng)用的最大挑戰(zhàn)是缺乏可用于訓(xùn)練的高質(zhì)量數(shù)據(jù)集(Chantry,et al,2021)。深度學(xué)習(xí)是構(gòu)建數(shù)據(jù)間非線性映射關(guān)系的技術(shù),數(shù)據(jù)集的數(shù)量和質(zhì)量決定了模型效果的上限。深度學(xué)習(xí)技術(shù)之所以能夠在近些年獲得飛速發(fā)展,除了得益于算法和硬件的提升,更重要的因素是在圖像識(shí)別領(lǐng)域,由全球上萬名工作人員共同創(chuàng)建了一系列標(biāo)準(zhǔn)數(shù)據(jù)集,最著名的如ImageNet數(shù)據(jù)集(Deng,et al,2009;Krizhevsky,et al,2017)。通過標(biāo)準(zhǔn)數(shù)據(jù)集和標(biāo)準(zhǔn)化的模型性能指標(biāo),全球科研人員迅速開展了深度學(xué)習(xí)算法的研發(fā),通過結(jié)果的直接對(duì)比與驗(yàn)證,使研發(fā)的算法具有可信度和說服力。因此,標(biāo)準(zhǔn)數(shù)據(jù)集是淬煉深度學(xué)習(xí)算法不斷升級(jí)的煉金石。
在氣象領(lǐng)域,國外已有團(tuán)隊(duì)研發(fā)了氣象標(biāo)準(zhǔn)數(shù)據(jù)集,如WeatherBench數(shù)據(jù)集(Rasp,et al,2020)、RainBench數(shù)據(jù)集(Witt,et al,2020),這給氣象領(lǐng)域研發(fā)人員對(duì)比不同算法在網(wǎng)格預(yù)報(bào)中的效果提供了重要基礎(chǔ)。然而,中國在這方面還非常缺乏,這將成為AI在中國天氣預(yù)報(bào)領(lǐng)域發(fā)展的根本障礙,因此,迫切需要?dú)庀箢I(lǐng)域的研究人員共同建立長歷史、統(tǒng)計(jì)特性一致的模式數(shù)據(jù),整理和開發(fā)用于訓(xùn)練和檢驗(yàn)的長序列、高分辨率、高質(zhì)量的觀測(cè)和再分析數(shù)據(jù)。同時(shí),亟待構(gòu)建極端天氣或高影響天氣數(shù)據(jù)集,這類數(shù)據(jù)集由于觀測(cè)樣本少、分類標(biāo)準(zhǔn)不明確等問題在構(gòu)建上具有挑戰(zhàn)。中國國家氣象信息中心在AI數(shù)據(jù)集方面做了大量工作,已發(fā)布強(qiáng)對(duì)流天氣人工智能應(yīng)用訓(xùn)練基礎(chǔ)數(shù)據(jù)集(劉娜等,2021),該數(shù)據(jù)集包括2012—2019年中國大陸區(qū)域的雷暴、短時(shí)強(qiáng)降水等5種強(qiáng)對(duì)流天氣的大量個(gè)例和樣本,為中國強(qiáng)對(duì)流天氣智能識(shí)別和預(yù)報(bào)應(yīng)用提供了堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。
另外,隨著數(shù)值預(yù)報(bào)模式的發(fā)展,其版本在不斷更新,不同版本數(shù)值模式預(yù)報(bào)的偏差會(huì)發(fā)生改變。有研究采用時(shí)間自適應(yīng)(Lang,et al,2020)、響應(yīng)理論(Demaeyer,et al,2020)等統(tǒng)計(jì)后處理方案應(yīng)對(duì)該問題。然而,模式改變將影響統(tǒng)計(jì)模型的整體性能(Lang,et al,2020;Vannitsem,et al,2021),為獲得具有一致性的訓(xùn)練數(shù)據(jù)集,理想的應(yīng)對(duì)措施是采用與實(shí)時(shí)模式相同的模式版本對(duì)過去幾十年的預(yù)報(bào)進(jìn)行回算(Hamill,et al,2013),利用回算預(yù)報(bào)數(shù)據(jù)集訓(xùn)練模型,以達(dá)到更好的預(yù)報(bào)效果。
在多源數(shù)據(jù)及多種客觀預(yù)報(bào)技術(shù)發(fā)展的背景下,提高智能網(wǎng)格預(yù)報(bào)的精細(xì)化水平,更有效地解決預(yù)報(bào)時(shí)效和預(yù)報(bào)方法上的協(xié)調(diào)一致達(dá)到無縫隙連接是智能網(wǎng)格預(yù)報(bào)亟待解決的關(guān)鍵問題(曹勇等,2021)。有效融合海量氣象觀測(cè)、多源模式預(yù)報(bào)數(shù)據(jù)及下墊面等局地特征數(shù)據(jù)是解決上述兩個(gè)關(guān)鍵問題的方案之一。多源數(shù)據(jù)融合的關(guān)鍵技術(shù)難點(diǎn)在于如何實(shí)現(xiàn)不同時(shí)空尺度、不同頻次數(shù)據(jù)的特征提取與融合。
深度學(xué)習(xí)對(duì)處理海量數(shù)據(jù)有顯著優(yōu)勢(shì),這必然會(huì)給多源數(shù)據(jù)融合技術(shù)提供新的契機(jī)。基于深度學(xué)習(xí)的多源數(shù)據(jù)融合,以目前的研究來看,主要有三個(gè)研究方向:一是多源觀測(cè)數(shù)據(jù)的融合,這類融合技術(shù)已廣泛應(yīng)用于基于深度學(xué)習(xí)的純數(shù)據(jù)驅(qū)動(dòng)的臨近預(yù)報(bào)模型中。二是多源模式預(yù)報(bào)的融合,de Ruiter(2021)利用CNN算法的圖像處理能力,對(duì)全球低分辨率模式和區(qū)域高分辨率模式數(shù)據(jù)進(jìn)行融合,實(shí)現(xiàn)的中期降水概率預(yù)報(bào)比單一模式預(yù)報(bào)效果要好。三是融合多源觀測(cè)數(shù)據(jù)和數(shù)值預(yù)報(bào)數(shù)據(jù),能夠在一定程度上解決預(yù)報(bào)時(shí)效一致性等問題。周康輝等(2021b)利用多源數(shù)據(jù)融合的深度學(xué)習(xí)技術(shù)實(shí)現(xiàn)了臨近到短時(shí)預(yù)報(bào)的無縫隙過渡,該工作基于CNN構(gòu)建了一個(gè)雙輸入單輸出的語義分割模型,雙輸入為分別輸入衛(wèi)星、雷達(dá)、閃電等多源觀測(cè)數(shù)據(jù)和CMA_GFS模式預(yù)報(bào)數(shù)據(jù),利用模型將兩類數(shù)據(jù)進(jìn)行融合并輸出0—6 h的閃電落區(qū)預(yù)報(bào),其預(yù)報(bào)結(jié)果比單純使用多源觀測(cè)數(shù)據(jù)或高分辨率模式預(yù)報(bào)要好。Schaumann等(2021)利用神經(jīng)網(wǎng)絡(luò)融合了雷達(dá)數(shù)據(jù)和高分辨率數(shù)值預(yù)報(bào)產(chǎn)品,實(shí)現(xiàn)了1—6 h降水預(yù)報(bào)。
深度學(xué)習(xí)利用統(tǒng)計(jì)方法建立數(shù)據(jù)間的非線性關(guān)系,難以解釋其中的物理機(jī)制,常常因缺乏可解釋性被認(rèn)為是“黑箱模型”,即使其生成的輸出結(jié)果看起來合理,但往往很難在物理一致性上得到解釋和驗(yàn)證(Irrgang,et al,2021)。這在一定程度上限制了該技術(shù)在行業(yè)內(nèi)的應(yīng)用和認(rèn)可。同時(shí),深度學(xué)習(xí)模型最終目標(biāo)需要對(duì)所學(xué)內(nèi)容進(jìn)行解釋,而不局限于預(yù)測(cè)結(jié)果本身(Toms,et al,2020)。
已有許多學(xué)者開展了在科學(xué)領(lǐng)域的深度學(xué)習(xí)可解釋性研究(Raghu,et al,2020;Roscher,et al,2020),并做了全面回顧(Zhang,et al,2021)??山忉屝缘膶?shí)質(zhì)是對(duì)深度學(xué)習(xí)模型的決策過程進(jìn)行理解,根據(jù)研究的不同角度可解釋性研究主要分為兩類:一類為特征歸屬,即基于模型的輸入特征對(duì)模型貢獻(xiàn)的重要程度來解釋模型的內(nèi)在機(jī)制,所用的方法主要有通過執(zhí)行特征消融、特征擾動(dòng)、特征置換等方式分析特征因子的重要性。另一類為模型檢查,這類方法著眼于檢查和分析模型不同的神經(jīng)網(wǎng)絡(luò)單元學(xué)到了什么特征(Bau,et al,2017),并用可視化的方式顯示神經(jīng)網(wǎng)絡(luò)的內(nèi)在工作機(jī)制,因此也稱為模型可視化方法,這類方法是深度學(xué)習(xí)可解釋性研究的熱點(diǎn)(Roscher,et al,2020)。模型檢查的傳統(tǒng)方法有Shapely值(Shapley,1953),但該方法計(jì)算成本高,Lundberg等(2017)針對(duì)AI領(lǐng)域提出了更高效的方法—SHAP值,其代碼已在github上開源(https://github.com/slundberg/shap)。
在氣象預(yù)報(bào)應(yīng)用領(lǐng)域,已有學(xué)者對(duì)深度學(xué)習(xí)方法的可解釋性展開了深入討論(Lagerquist,et al,2019;McGovern,et al,2019;Ebert-Uphoff,et al,2020;Toms,et al,2020)。典 型 的 工 作 是Mc Govern等(2019)全面梳理了深度學(xué)習(xí)在天氣預(yù)報(bào)應(yīng)用中常見的可視化解釋方法,包括顯著圖(Saliency maps)(Simonyan,et al,2014)、基于梯度權(quán)重的激活圖(Grad-CAM,Gradient-weighted Class-Activation Maps)(Selvaraju,et al,2020)等方法。分層相關(guān)傳 播(LRP,Layer-wise Relevance Propagation)(Montavon,et al,2017)作為深度學(xué)習(xí)可解釋方法,目前尚未在預(yù)報(bào)領(lǐng)域得到廣泛應(yīng)用,卻有著很大的潛力(Ebert-Uphoff,et al,2020),Toms等(2020)介紹了該方法在地球科學(xué)領(lǐng)域中的成功應(yīng)用。該方法基于泰勒分解算法利用反向傳播計(jì)算得到深度學(xué)習(xí)模型標(biāo)簽間的相關(guān),通過生成熱圖(heat map)的方式顯示神經(jīng)網(wǎng)絡(luò)每一層的工作機(jī)制。
上述方法在理解深度學(xué)習(xí)模型的決策過程上取得了一定進(jìn)展,然而,目前深度學(xué)習(xí)技術(shù)無法考慮大氣運(yùn)動(dòng)的基本物理規(guī)律,在短期內(nèi)難以完全替代數(shù)值預(yù)報(bào)模式進(jìn)行獨(dú)立預(yù)報(bào)。因此,將數(shù)值預(yù)報(bào)模式與深度學(xué)習(xí)相結(jié)合是提高該技術(shù)在預(yù)報(bào)領(lǐng)域應(yīng)用的有效措施之一。利用深度學(xué)習(xí)技術(shù)實(shí)現(xiàn)大量的、高頻的、小尺度觀測(cè)數(shù)據(jù)與多源的、低頻的、相對(duì)大尺度的模式預(yù)報(bào)數(shù)據(jù)融合,彌補(bǔ)觀測(cè)數(shù)據(jù)和模式預(yù)報(bào)數(shù)據(jù)之間不同時(shí)、空尺度的信息提取和轉(zhuǎn)換問題,是深度學(xué)習(xí)在智能網(wǎng)格預(yù)報(bào)應(yīng)用的重要發(fā)展方向。
深度學(xué)習(xí)模型存在潛在的不確定性。由于深度學(xué)習(xí)算法不依賴物理框架的計(jì)算,會(huì)出現(xiàn)模型結(jié)果并不符合基本物理原理的問題(Reichstein,et al,2019),這就導(dǎo)致其不能很好地泛化到新的數(shù)據(jù)集中。有研究討論了深度學(xué)習(xí)在自然科學(xué)領(lǐng)域應(yīng)用時(shí)常面臨的不確定性特征,包括偶然不確定性和認(rèn)知不確定性(Kendall,et al,2017;Lakshminarayanan,et al,2017)。偶然不確定性是由數(shù)據(jù)引起的,是在訓(xùn)練數(shù)據(jù)集中存在一些噪音,從而影響模型泛化;認(rèn)知不確定性是由模型本身引起的,是模型在測(cè)試集中遇到訓(xùn)練集和驗(yàn)證集中沒出現(xiàn)的樣本特征產(chǎn)生的認(rèn)知不確定。
因此,對(duì)模型的準(zhǔn)確率、泛化能力、可復(fù)用性進(jìn)行多維度評(píng)估是深度學(xué)習(xí)在預(yù)報(bào)業(yè)務(wù)中應(yīng)用的重要前提,也是提高深度學(xué)習(xí)技術(shù)可信度的應(yīng)對(duì)措施之一。深度學(xué)習(xí)模型在智能網(wǎng)格預(yù)報(bào)的理論研究越來越成熟,然而算法的比較方式、模型可信度的度量標(biāo)準(zhǔn)、模型適應(yīng)性的評(píng)估指標(biāo)等問題需要在預(yù)報(bào)業(yè)務(wù)應(yīng)用之前進(jìn)行全面制定和評(píng)估。模型結(jié)果首先需要與預(yù)報(bào)要素的基準(zhǔn)客觀算法進(jìn)行對(duì)比,依此來度量深度學(xué)習(xí)模型的準(zhǔn)確性和可信度。在訓(xùn)練模型時(shí),要求遵循標(biāo)準(zhǔn)訓(xùn)練流程,明確區(qū)分?jǐn)?shù)據(jù)的訓(xùn)練集、驗(yàn)證集和測(cè)試集,以確保它們之間沒有因時(shí)間相關(guān)而導(dǎo)致模型的不確定性。針對(duì)不同預(yù)報(bào)要素,選擇合適的、公認(rèn)的標(biāo)準(zhǔn)評(píng)估指標(biāo)檢驗(yàn)?zāi)P托阅苁墙⒛P涂尚哦鹊闹匾绞健?/p>
一個(gè)能夠在智能網(wǎng)格預(yù)報(bào)業(yè)務(wù)應(yīng)用的深度學(xué)習(xí)模型,除了需要嚴(yán)格度量其準(zhǔn)確性和可信度外,還必須評(píng)估其運(yùn)算效率、穩(wěn)定性、可行性等可用性指標(biāo),同時(shí),還應(yīng)具有一定的物理意義。模型的可用性包括對(duì)模型不確定性和適用性的評(píng)估,需要根據(jù)模型的不確定性特征指定適應(yīng)性場(chǎng)景。例如,數(shù)據(jù)驅(qū)動(dòng)臨近降水預(yù)報(bào)模型的預(yù)報(bào)結(jié)果存在過于平滑的不確定性(Shi,et al,2017;Ayzel,et al,2020),這就導(dǎo)致在目前的研究階段這類模型更適用于弱量級(jí)降水預(yù)報(bào),對(duì)于強(qiáng)降水預(yù)報(bào),尤其是極端降水的預(yù)報(bào)還不適用。
為了得到具有物理意義的深度學(xué)習(xí)模型,一個(gè)有效的策略是將物理機(jī)制和天氣預(yù)報(bào)相關(guān)知識(shí)融入到模型中,根據(jù)不同預(yù)報(bào)要素的特征選擇或優(yōu)化具有物理意義的損失函數(shù),這不僅使模型在物理機(jī)制上具有可解釋性,還能夠提高模型的預(yù)報(bào)效果和泛化能力,這種方法也被稱為基于物理機(jī)制的正則化方法(Schultz,et al,2021)。例如,Larraondo等(2020)提出了一種降水預(yù)報(bào)損失函數(shù)優(yōu)化方案,利用數(shù)學(xué)方法將降水預(yù)報(bào)常用的檢驗(yàn)指標(biāo)可微分化,建立針對(duì)降水預(yù)報(bào)的損失函數(shù),有效提高了模型的降水預(yù)報(bào)技能。
深度學(xué)習(xí)技術(shù)在智能網(wǎng)格預(yù)報(bào)業(yè)務(wù)中應(yīng)用的實(shí)現(xiàn)就是其工程化過程。不同于理論研究,基于業(yè)務(wù)應(yīng)用的深度學(xué)習(xí)模型不僅要確保其可信度和可用性,還要完成具有及時(shí)性、可操作性、可部署、可管理的全鏈路工程化生產(chǎn)。在實(shí)際業(yè)務(wù)中,數(shù)值預(yù)報(bào)模式版本更新、模型的及時(shí)調(diào)優(yōu)是深度學(xué)習(xí)技術(shù)在預(yù)報(bào)業(yè)務(wù)中應(yīng)用的關(guān)鍵(Vannitsem,et al,2021)。數(shù)值模式版本更新會(huì)導(dǎo)致預(yù)報(bào)偏差發(fā)生改變,需要構(gòu)建新版本模式數(shù)據(jù)訓(xùn)練集對(duì)深度學(xué)習(xí)模型進(jìn)行再次訓(xùn)練。然而,深度學(xué)習(xí)模型不需要從頭開始訓(xùn)練,利用遷移學(xué)習(xí)技術(shù)可以在之前模型的基礎(chǔ)上,以共享參數(shù)等方式對(duì)新訓(xùn)練數(shù)據(jù)集進(jìn)行訓(xùn)練,從而快速實(shí)現(xiàn)參數(shù)更新以適應(yīng)新的數(shù)據(jù),避免浪費(fèi)過多的計(jì)算資源和模型更新時(shí)間。另外,基于深度學(xué)習(xí)模型運(yùn)行的高效性,模型一旦訓(xùn)練完成,可以快速滾動(dòng)融入最新數(shù)據(jù)生成整個(gè)網(wǎng)格的預(yù)報(bào)結(jié)果,為業(yè)務(wù)應(yīng)用提供較好的及時(shí)性。
深度學(xué)習(xí)技術(shù)在近幾年取得了突破性進(jìn)展,為智能網(wǎng)格預(yù)報(bào)技術(shù)的提升提供了新的機(jī)遇和挑戰(zhàn)。如何通過理論創(chuàng)新發(fā)揮深度學(xué)習(xí)的作用,如何將深度學(xué)習(xí)技術(shù)與智能網(wǎng)格預(yù)報(bào)相結(jié)合,構(gòu)建面向氣象的可復(fù)用、可驗(yàn)證、可解釋的深度學(xué)習(xí)模型等問題已成為深度學(xué)習(xí)在智能網(wǎng)格預(yù)報(bào)應(yīng)用上的關(guān)鍵挑戰(zhàn)。
AI技術(shù)在智能網(wǎng)格預(yù)報(bào)應(yīng)用離不開高質(zhì)量數(shù)據(jù)集,數(shù)據(jù)集是AI技術(shù)應(yīng)用最核心的因素。目前,中國還尚缺乏長歷史序列、高分辨率、高質(zhì)量的回算預(yù)報(bào)數(shù)據(jù)集,這制約了AI技術(shù)在網(wǎng)格預(yù)報(bào)應(yīng)用的發(fā)展。因此,在未來迫切需要建立中國的長歷史、統(tǒng)計(jì)特性一致的高質(zhì)量人工智能訓(xùn)練數(shù)據(jù)集,以促進(jìn)AI技術(shù)在氣象領(lǐng)域的深入應(yīng)用。同時(shí),AI技術(shù)應(yīng)用還離不開氣象領(lǐng)域從業(yè)人員對(duì)它的認(rèn)識(shí),應(yīng)加強(qiáng)人才培養(yǎng),提高業(yè)務(wù)人員對(duì)AI產(chǎn)品的接受度。
在可預(yù)見的未來,智能網(wǎng)格預(yù)報(bào)技術(shù)將以數(shù)值模式為核心,以高質(zhì)量實(shí)況客觀分析資料為基礎(chǔ),研發(fā)基于AI技術(shù)的智能網(wǎng)格預(yù)報(bào)體系。包括研發(fā)面向氣象數(shù)據(jù)特點(diǎn)的AI算法適應(yīng)性研究,開展AI技術(shù)與數(shù)值預(yù)報(bào)模式融合研究,探索各類算法在天氣預(yù)報(bào)中的可解釋性,揭開應(yīng)用的“黑匣子”。未來的智能網(wǎng)格預(yù)報(bào)就是應(yīng)用AI技術(shù)將海量的、高頻的、小尺度觀測(cè)數(shù)據(jù)與大量的、低頻的、大中尺度數(shù)值模式預(yù)報(bào)相融合,同時(shí)納入地理信息等數(shù)據(jù),基于深度學(xué)習(xí)等技術(shù)學(xué)習(xí)大量數(shù)據(jù)的內(nèi)在規(guī)律和局地特征,提高智能網(wǎng)格預(yù)報(bào)的精細(xì)化水平。同時(shí),通過正則化等方法將預(yù)報(bào)員的經(jīng)驗(yàn)內(nèi)化在模型中,實(shí)現(xiàn)真正的客觀化預(yù)報(bào)。通過發(fā)展算法先進(jìn)、穩(wěn)定可靠、自主可控的智能預(yù)報(bào)系統(tǒng),全面支撐天氣監(jiān)測(cè)評(píng)估、災(zāi)害天氣預(yù)報(bào)、影響預(yù)報(bào)及風(fēng)險(xiǎn)預(yù)警等核心業(yè)務(wù),重點(diǎn)實(shí)現(xiàn)水文、生態(tài)、海洋、環(huán)境等專業(yè)領(lǐng)域的預(yù)報(bào)智能化。