李揚(yáng) 劉玉寶 許小峰
(1 南京信息工程大學(xué),精細(xì)化區(qū)域地球模擬和信息中心,南京 210044;2 南京信息工程大學(xué),中國(guó)氣象局氣溶膠-云-降水重點(diǎn)開放實(shí)驗(yàn)室,氣候與環(huán)境變化國(guó)際合作聯(lián)合實(shí)驗(yàn)室,南京 210044;3 中國(guó)氣象局,北京 100081)
過去的一個(gè)世紀(jì)里,天氣預(yù)報(bào)已經(jīng)從基于經(jīng)驗(yàn)和類比預(yù)報(bào)的階段發(fā)展到高度自動(dòng)化和高準(zhǔn)確率的預(yù)報(bào)階段,這主要得益于大氣觀測(cè)能力的飛速發(fā)展、對(duì)大氣流體力學(xué)和其他大氣物理過程更精確的描述,以及數(shù)字計(jì)算能力的出現(xiàn)和飛躍。高時(shí)空分辨率數(shù)值天氣預(yù)報(bào)模式的開發(fā)和新一代地球觀測(cè)系統(tǒng)的布局,包括氣象衛(wèi)星、氣象雷達(dá)等先進(jìn)的業(yè)務(wù)遙感觀測(cè),導(dǎo)致每天所產(chǎn)生的數(shù)據(jù)量已經(jīng)遠(yuǎn)遠(yuǎn)超出了傳統(tǒng)的數(shù)據(jù)處理方法提取、加工、應(yīng)用信息的能力。近年來機(jī)器學(xué)習(xí),尤其是深度學(xué)習(xí),展示了處理大數(shù)據(jù)的強(qiáng)大能力。該方法能從海量數(shù)據(jù)中提取有效信息和處理非線性問題,已在圖像處理、語音識(shí)別等領(lǐng)域得到廣泛研究,并已被廣泛應(yīng)用于氣象領(lǐng)域的極端事件的檢測(cè)和預(yù)測(cè)和對(duì)流天氣短時(shí)臨近預(yù)報(bào)。
數(shù)值天氣預(yù)報(bào)模式是天氣過程預(yù)測(cè)和氣象短時(shí)臨近預(yù)報(bào)的重要手段,該方法通過求解一系列數(shù)學(xué)物理方程模擬大氣過程。數(shù)值模擬的過程中存在很多不確定性因素,比如不準(zhǔn)確的初始條件、物理過程參數(shù)化等。由于大氣的混沌特性,不準(zhǔn)確的初始場(chǎng)以及物理過程的參數(shù)化會(huì)導(dǎo)致模式結(jié)果出現(xiàn)很大的不確定性。近20年里,觀測(cè)技術(shù)提升、資料同化技術(shù)改善、模式分辨率提高、模式物理參數(shù)化改進(jìn)和模式輸出統(tǒng)計(jì)后處理技術(shù)的應(yīng)用有效改善了數(shù)值天氣模式的預(yù)報(bào)結(jié)果,但是,模式系統(tǒng)的各個(gè)分量仍存在許多不確定因素有待解決。近年來,深度學(xué)習(xí)技術(shù)的突破,為解決數(shù)值天氣預(yù)報(bào)模式的不確定性問題提供了一個(gè)新思路,并已取得了積極的成果。比如利用深度學(xué)習(xí)代替?zhèn)鹘y(tǒng)的統(tǒng)計(jì)后處理,改善數(shù)值天氣預(yù)報(bào)模式的預(yù)報(bào)結(jié)果、利用深度學(xué)習(xí)模型代替物理過程參數(shù)化模塊,改善數(shù)值天氣預(yù)報(bào)模式的計(jì)算效率等。
近些年,國(guó)外一些研究者詳細(xì)探討了深度學(xué)習(xí)在地球科學(xué)及大氣科學(xué)方面的應(yīng)用研究進(jìn)展。比如,Reichstein等探討了深度學(xué)習(xí)在地球科學(xué)領(lǐng)域的應(yīng)用,包括深度學(xué)習(xí)對(duì)物理模型的參數(shù)化優(yōu)化、模型子模塊替換等;Boukabara等從短時(shí)臨近預(yù)報(bào)、模式后處理和資料同化方面總結(jié)了深度學(xué)習(xí)在數(shù)值天氣預(yù)報(bào)模式方面的研究進(jìn)展;McGovern等從可解釋性方面探討了如何增強(qiáng)深度學(xué)習(xí)模型的物理理解能力。上述回顧從不同角度討論了深度學(xué)習(xí)在數(shù)值天氣預(yù)報(bào)模式方面的研究進(jìn)展,本文針對(duì)深度學(xué)習(xí)在數(shù)值天氣預(yù)報(bào)系統(tǒng)應(yīng)用研究方面的最新成果進(jìn)行系統(tǒng)性介紹,深入探討深度學(xué)習(xí)在數(shù)值天氣預(yù)報(bào)模式參數(shù)化的不確定性參數(shù)改進(jìn)和子模塊替換、模擬完整數(shù)值天氣預(yù)報(bào)模式積分、數(shù)值天氣預(yù)報(bào)模式輸出誤差訂正、改善資料同化技術(shù)的研究進(jìn)展、面臨的問題和未來的發(fā)展?jié)摿?,并討論深度學(xué)習(xí)技術(shù)在數(shù)值天氣預(yù)報(bào)模式應(yīng)用中的可解釋性和不確定性量化問題。
近10年里,深度學(xué)習(xí)在圖像處理、語音識(shí)別等領(lǐng)域取得了巨大成功,發(fā)展了諸多功能強(qiáng)大的神經(jīng)網(wǎng)絡(luò)模型,比如卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)等。當(dāng)前氣象應(yīng)用中的神經(jīng)網(wǎng)絡(luò)模型大多是在上述領(lǐng)域得到成熟應(yīng)用后遷移而來。這些模型的網(wǎng)絡(luò)結(jié)構(gòu)多是針對(duì)特定應(yīng)用領(lǐng)域的特定問題進(jìn)行了大量測(cè)試所設(shè)計(jì)而來。因此,這些模型可能對(duì)特定問題而言具有最優(yōu)性能。而在氣象領(lǐng)域應(yīng)用這些模型時(shí),研究者應(yīng)該充分考慮所處理氣象問題的特點(diǎn)和分析相應(yīng)模型的優(yōu)缺點(diǎn)(表1),選擇和構(gòu)造適當(dāng)?shù)纳疃葘W(xué)習(xí)模型。以下概括介紹用于改進(jìn)數(shù)值天氣模式和預(yù)報(bào)的主要深度學(xué)習(xí)模型。
表1 不同神經(jīng)網(wǎng)絡(luò)模型的優(yōu)缺點(diǎn) Table 1 Advantages and disadvantages of different neural network models
1)卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)在氣象領(lǐng)域的分類和狀態(tài)預(yù)測(cè)任務(wù)中得到較多的應(yīng)用,包括極端天氣的檢測(cè)和預(yù)測(cè)、雷達(dá)回波外推預(yù)報(bào)、基于地基或衛(wèi)星觀測(cè)的云分類等。這主要得益于CNN中的卷積層和池化層。卷積層可以從圖像和結(jié)構(gòu)化數(shù)據(jù)中提取關(guān)鍵特征,池化層進(jìn)一步對(duì)特征進(jìn)行降維。
池化層在降低特征維度時(shí)保持了平移和尺度不變性,導(dǎo)致CNN模型很難處理對(duì)相對(duì)位置敏感的問題。氣象場(chǎng)具有非常復(fù)雜和演變的時(shí)空分布特征,氣象特征的相對(duì)位置是比較敏感的,比如高低壓系統(tǒng)的不同相對(duì)位置可能會(huì)導(dǎo)致不同的天氣形勢(shì)。因此,在利用CNN處理時(shí)空分布的氣象場(chǎng)時(shí),針對(duì)要處理的問題應(yīng)分析特征變量的相對(duì)位置演變特點(diǎn)及對(duì)結(jié)果是否具有重要影響。如果特征的相對(duì)位置對(duì)最終結(jié)果具有較為明顯的影響,那么在構(gòu)建深度學(xué)習(xí)模型時(shí),應(yīng)該考慮和解決CNN無法處理位置敏感特征提取的問題。
2)循環(huán)神經(jīng)網(wǎng)絡(luò)
循環(huán)神經(jīng)網(wǎng)絡(luò)是一類專門為處理序列數(shù)據(jù)設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò),在時(shí)間序列預(yù)報(bào)中發(fā)揮重要作用。氣象過程的演變和預(yù)報(bào)是時(shí)間序列過程,因此,循環(huán)神經(jīng)網(wǎng)絡(luò)更適合處理氣象領(lǐng)域的時(shí)間序列的預(yù)測(cè)問題。但是傳統(tǒng)的RNN模型在處理長(zhǎng)時(shí)間序列時(shí)可能會(huì)導(dǎo)致梯度爆炸和梯度消失的問題。為解決此問題,學(xué)界進(jìn)行了很多研究, 第一類解決方案是設(shè)計(jì)多時(shí)間尺度模型,讓高和低時(shí)間分辨率尺度負(fù)責(zé)處理不同時(shí)間尺度的信息,在不同時(shí)間尺度使用稱為滲透單元的隱藏單元幫助學(xué)習(xí)長(zhǎng)期依賴;第二類方案引入門控循環(huán)神經(jīng)網(wǎng)絡(luò),包括最具有代表性的基于信息篩選記憶的長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)和基于門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)(Gated Recurrent Unit,GRU)。滲透單元是基于手動(dòng)選擇常量或參數(shù)化的連接權(quán)重學(xué)習(xí)長(zhǎng)期依賴關(guān)系,而門控循環(huán)神經(jīng)網(wǎng)絡(luò)是自動(dòng)學(xué)習(xí),并決定何時(shí)清除狀態(tài)。因此,目前在處理具有明顯的長(zhǎng)期依賴的時(shí)間序列問題時(shí),多是以LSTM等門控循環(huán)神經(jīng)網(wǎng)絡(luò)為主。要注意的是,盡管循環(huán)神經(jīng)網(wǎng)絡(luò)對(duì)單站點(diǎn)的時(shí)間序列預(yù)測(cè)具有較好的使用效果,但是對(duì)于更復(fù)雜的時(shí)空序列問題,需要結(jié)合能夠處理空間特征的卷積神經(jīng)網(wǎng)絡(luò)和能夠處理長(zhǎng)期依賴的循環(huán)神經(jīng)網(wǎng)絡(luò),解決基于時(shí)間和空間特征的時(shí)序預(yù)測(cè)問題。
3)卷積和循環(huán)混合神經(jīng)網(wǎng)絡(luò)
混合卷積和循環(huán)神經(jīng)網(wǎng)絡(luò)是為了更好的處理具有時(shí)空分布特性的任務(wù)。卷積長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(ConvLSTM)在基于雷達(dá)回波的強(qiáng)對(duì)流短時(shí)臨近預(yù)報(bào)中得以有效應(yīng)用。該方法仍然無法避免CNN針對(duì)時(shí)空分布的氣象場(chǎng)中某些特征對(duì)相對(duì)位置敏感的問題。此外,CNN模型更適合處理矩形網(wǎng)絡(luò)結(jié)構(gòu)的數(shù)據(jù),而氣象場(chǎng)通常是地球曲面時(shí)空分布數(shù)據(jù),且氣象觀測(cè)具有高度時(shí)空不均勻性,進(jìn)行投影轉(zhuǎn)換時(shí)就會(huì)出現(xiàn)信息丟失,從而導(dǎo)致在訓(xùn)練和預(yù)測(cè)的過程中可能會(huì)歪曲或丟失相關(guān)信息。因此,選擇混合神經(jīng)網(wǎng)絡(luò)模型時(shí),應(yīng)考慮到CNN和RNN網(wǎng)絡(luò)各自的優(yōu)缺點(diǎn),盡量避免混合模型沿襲部分或所有組成模型的缺點(diǎn)。
4)膠囊神經(jīng)網(wǎng)絡(luò)
為了解決CNN無法處理相對(duì)位置敏感的問題,Sabour等引入了膠囊神經(jīng)網(wǎng)絡(luò)(Capsule Neural Networks,CapsNet),利用膠囊替換CNN網(wǎng)絡(luò)中的池化層。不同于僅輸出標(biāo)量值的神經(jīng)元,膠囊單元輸出是由一系列信息構(gòu)成的向量,比如包含了位置、相對(duì)距離、形狀、方向、尺寸等信息。相比于池化層的不變性,膠囊神經(jīng)網(wǎng)絡(luò)更關(guān)注等變性,可以將相對(duì)位置等特征編碼到特征圖中。Chattopadhyay等利用CapsNet、類比預(yù)報(bào)和自動(dòng)標(biāo)注策略,預(yù)測(cè)導(dǎo)致極端事件的天氣形勢(shì),結(jié)果表明CapsNet的效果要優(yōu)于CNN,而且隨著訓(xùn)練數(shù)據(jù)的減少,CNN的準(zhǔn)確率比CapsNet下降更明顯。他們認(rèn)為這很可能是因?yàn)镃apsNet具有從有限的訓(xùn)練數(shù)據(jù)中提取更多的信息和特征的能力。CapsNet可以保留特征要素的相對(duì)位置和移動(dòng)方向的信息,對(duì)于處理時(shí)空分布多變的氣象問題有明顯優(yōu)勢(shì)。
同時(shí)需要指出的是,由于該網(wǎng)絡(luò)中膠囊單元是由一系列神經(jīng)元堆疊而成,可能會(huì)導(dǎo)致計(jì)算效率有所降低。此外,膠囊神經(jīng)網(wǎng)絡(luò)和CNN一樣,也無法處理地球曲面數(shù)據(jù)。當(dāng)前,膠囊神經(jīng)網(wǎng)絡(luò)在氣象領(lǐng)域的應(yīng)用相對(duì)較少。未來這一方法可能在對(duì)流短時(shí)臨近預(yù)報(bào)、極端事件預(yù)測(cè)等方面發(fā)揮較大作用。
5)球面卷積神經(jīng)網(wǎng)絡(luò)
無論是CNN還是CapsNet,在處理時(shí)空分布的氣象場(chǎng)時(shí),通常都需要將分布在球面的氣象場(chǎng)投影到平面上,但是這樣會(huì)出現(xiàn)空間形狀失真,從而導(dǎo)致平移權(quán)重共享失效。在常規(guī)經(jīng)緯度網(wǎng)格上,往兩極方向的網(wǎng)格會(huì)被拉伸,因此,動(dòng)力過程會(huì)隨著緯度變化。而且除了科氏力的作用外,地球的旋轉(zhuǎn)導(dǎo)致的風(fēng)向偏離也隨緯度變化。有研究者提出可以使用球面卷積神經(jīng)網(wǎng)絡(luò)解決此問題,或者可以通過代價(jià)函數(shù)在訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型時(shí)考慮隨緯度變化的情況。
球面卷積神經(jīng)網(wǎng)絡(luò)的提出或許能夠進(jìn)一步改善基于曲面數(shù)據(jù)的分類和回歸任務(wù)。對(duì)于天氣和全球尺度的數(shù)值天氣預(yù)報(bào)模式相關(guān)的問題,球面卷積神經(jīng)網(wǎng)絡(luò)能夠更好的適應(yīng)球面投影數(shù)據(jù),而無需進(jìn)行投影轉(zhuǎn)換。因此,球面卷積神經(jīng)網(wǎng)絡(luò)在天氣尺度和全球尺度氣象過程的應(yīng)用中,將發(fā)揮重要作用。但是球面卷積神經(jīng)網(wǎng)絡(luò)中仍存在池化層,仍然無法有效處理對(duì)細(xì)節(jié)信息敏感的任務(wù),比如相對(duì)位置、形狀、方向等特征具有明顯影響的任務(wù)。
6)其他
除了上述在氣象應(yīng)用中使用較多的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)外,還有一些神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)對(duì)氣象應(yīng)用具有很大潛力,包括基于編碼解碼結(jié)構(gòu)像素級(jí)預(yù)測(cè)的U-Net模型、基于時(shí)空循環(huán)神經(jīng)網(wǎng)絡(luò)的PredRNN模型、基于生成器和判別器的生成對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Networks,GAN)等。U-Net、PredRNN和GAN已經(jīng)在短臨預(yù)報(bào)、數(shù)值天氣預(yù)報(bào)模式次網(wǎng)格物理過程參數(shù)化、基于MODIS(Moderate-Resolution Imaging Spectrometer)觀測(cè)重建云結(jié)構(gòu)、基于衛(wèi)星圖像的臺(tái)風(fēng)預(yù)測(cè)等方面的應(yīng)用獲得較好的效果。
數(shù)值天氣預(yù)報(bào)模式屬于一類理論驅(qū)動(dòng)模型,其基本數(shù)理基礎(chǔ)是熱力學(xué)定律和牛頓運(yùn)動(dòng)定律。此類模型具有嚴(yán)謹(jǐn)?shù)睦碚摶A(chǔ),較強(qiáng)的數(shù)學(xué)和物理解釋和數(shù)值推演能力。但由于此類模型的一些數(shù)學(xué)和物理過程過于復(fù)雜,需要對(duì)其物理和動(dòng)力過程進(jìn)行參數(shù)化處理,以及不準(zhǔn)確的初始條件,從而導(dǎo)致數(shù)值天氣預(yù)報(bào)模式產(chǎn)生誤差,影響模擬和預(yù)報(bào)精度。而深度學(xué)習(xí)屬于一類數(shù)據(jù)驅(qū)動(dòng)模型,旨在從大量的數(shù)據(jù)中發(fā)現(xiàn)新規(guī)律。此類模型具有很好的靈活性,但是沒有嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)物理理論指導(dǎo),可解釋能力較差。表2對(duì)比了深度學(xué)習(xí)和數(shù)值天氣預(yù)報(bào)模式的重要優(yōu)缺點(diǎn)。將深度學(xué)習(xí)與數(shù)值天氣預(yù)報(bào)模式結(jié)合起來,有利于發(fā)揮兩者的優(yōu)勢(shì),實(shí)現(xiàn)對(duì)數(shù)值天氣預(yù)報(bào)模式技術(shù)和應(yīng)用價(jià)值地提升。圖1概括了當(dāng)前深度學(xué)習(xí)在數(shù)值天氣預(yù)報(bào)模式相關(guān)方面的應(yīng)用研究情況。
表2 深度學(xué)習(xí)和數(shù)值天氣預(yù)報(bào)模式方法對(duì)比 Table 2 Comparison of deep learning technologies and numerical weather prediction models
圖1 數(shù)值預(yù)報(bào)模式和深度學(xué)習(xí)整合(藍(lán)色矩形部分表示深度學(xué)習(xí)已有應(yīng)用、且已經(jīng)得到概念證明的模式分量,灰色矩形部分表示當(dāng)前的深度學(xué)習(xí)應(yīng)用尚處于探索階段的模式分量) Fig. 1 Linkages between deep learning and numerical weather prediction models (NWP) (The blue rectangular indicates the model components that deep learning can be applied; the gray rectangular indicates the those where the deep learning application is still in the exploration stage)
資料同化是將高質(zhì)量的大氣觀測(cè)有效融合到數(shù)值天氣預(yù)報(bào)模式產(chǎn)生的預(yù)報(bào)場(chǎng)(初猜場(chǎng))中,改善數(shù)值天氣預(yù)報(bào)模式的初始條件精度。當(dāng)前的氣象觀測(cè)的數(shù)據(jù)量已遠(yuǎn)超出同化系統(tǒng)的處理能力,亟需尋找新的方法用以改善資料同化的過程。而近10年來深度學(xué)習(xí)技術(shù)的快速發(fā)展,為改善資料同化的過程帶來了新的機(jī)遇。
深度學(xué)習(xí)在資料同化方面的應(yīng)用研究剛剛起步。Abarbanel等在機(jī)器學(xué)習(xí)和統(tǒng)計(jì)資料同化間建立起了等價(jià)關(guān)系,深入探討了神經(jīng)網(wǎng)絡(luò)和資料同化間的關(guān)系,為神經(jīng)網(wǎng)絡(luò)在資料同化方面應(yīng)用奠定了理論基礎(chǔ)。Cintra等利用人工神經(jīng)網(wǎng)絡(luò)模型代替區(qū)域集合卡爾曼濾波方法(Local Ensemble Transform Kalman Filter,LETKF),結(jié)果表明,基于神經(jīng)網(wǎng)絡(luò)的大氣資料同化具有和LETKF方法類似的同化質(zhì)量,但具有更好的計(jì)算效率。Brajard等發(fā)展了EnKF資料同化方法與卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行雙向互反饋耦合方案,獲得了較好的短時(shí)臨近預(yù)報(bào)效果。但是此方法對(duì)于觀測(cè)的噪音干擾以及觀測(cè)數(shù)據(jù)量非常敏感,當(dāng)噪音干擾嚴(yán)重或觀測(cè)數(shù)量過少時(shí),預(yù)測(cè)技能顯著降低。此外,該研究?jī)H是基于低維理想模式對(duì)混合資料同化和神經(jīng)網(wǎng)絡(luò)方案的概念證明,尚未應(yīng)用到高維氣象數(shù)值天氣預(yù)報(bào)模式。而且由于此方法混合了資料同化方法和神經(jīng)網(wǎng)絡(luò)模型,其計(jì)算量有所增加。
除了上述完整的資料同化替代方案和混合方案外,Jing采用神經(jīng)網(wǎng)絡(luò)模型構(gòu)建觀測(cè)算子模型,結(jié)果表明:當(dāng)訓(xùn)練數(shù)據(jù)足夠的情況下,神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)到的觀測(cè)算子的結(jié)果優(yōu)于使用不準(zhǔn)確的轉(zhuǎn)置值的預(yù)測(cè)算子的結(jié)果。Geer等指出對(duì)于機(jī)器學(xué)習(xí)方案和資料同化技術(shù)很多方面非常一致,比如,用觀測(cè)誤差來表示不同級(jí)別的不確定性,用觀測(cè)算子從規(guī)則的模型網(wǎng)格映射到不規(guī)則的稀疏觀測(cè),以及用物理模型組件或深度學(xué)習(xí)層對(duì)深度學(xué)習(xí)網(wǎng)絡(luò)施加物理約束。在地球系統(tǒng)科學(xué)中,機(jī)器學(xué)習(xí)和資料同化高度相似。當(dāng)前,深度學(xué)習(xí)在氣象領(lǐng)域資料同化方面的應(yīng)用多是基于簡(jiǎn)單的數(shù)值天氣預(yù)報(bào)模式進(jìn)行概念證明。如何在觀測(cè)質(zhì)控和誤差訂正、模式誤差估計(jì)和訂正、模式參數(shù)優(yōu)化等方面最大化發(fā)揮深度學(xué)習(xí)和資料同化技術(shù)的優(yōu)勢(shì),仍面臨諸多挑戰(zhàn)。為深化深度學(xué)習(xí)技術(shù)在高維數(shù)值天氣預(yù)報(bào)模式資料同化方面應(yīng)用,仍需要大量地深入研究和嘗試。
自20世紀(jì)50年代以來,數(shù)值天氣預(yù)報(bào)模式發(fā)展迅猛,模式分辨率不斷提升。然而,大氣物理過程的發(fā)生尺度比當(dāng)前最先進(jìn)的數(shù)值天氣預(yù)報(bào)模式的網(wǎng)格尺度要小,而這些次網(wǎng)格過程對(duì)于大氣演變是非常重要的。目前的求解辦法是用動(dòng)力模式能解析的網(wǎng)格點(diǎn)狀態(tài)量的函數(shù)來近似表示次網(wǎng)格尺度的動(dòng)力和物理過程,即次網(wǎng)格物理過程參數(shù)化。次網(wǎng)格參數(shù)化方案包含近似函數(shù)和大量可調(diào)參數(shù),是造成數(shù)值天氣預(yù)報(bào)模式預(yù)報(bào)誤差的重要因素之一。
為了改善氣候預(yù)測(cè)和天氣預(yù)報(bào),更高效且準(zhǔn)確的次網(wǎng)格物理過程估算是非常重要的。目前,深度學(xué)習(xí)已經(jīng)被用于嘗試代替數(shù)值天氣預(yù)報(bào)模式中半經(jīng)驗(yàn)性質(zhì)的次網(wǎng)格物理過程參數(shù)化子模塊,包括數(shù)值天氣預(yù)報(bào)模式中的對(duì)流參數(shù)化、長(zhǎng)波和短波或完整的輻射參數(shù)化方案、行星邊界層參數(shù)化等。這些研究表明,深度學(xué)習(xí)對(duì)于改善數(shù)值天氣預(yù)報(bào)模式物理過程的計(jì)算效率或精度具有非常好的潛力,但同時(shí)需要解決穩(wěn)定性、質(zhì)量和能量守恒性問題。
Gentine等發(fā)現(xiàn),基于人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練的對(duì)流參數(shù)化方案與原始的物理對(duì)流參數(shù)化具有相似的結(jié)果,且計(jì)算效率明顯提高。但在沒有明確的能量守恒限制情況下,人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練的結(jié)果可能無法保證能量守恒和濕守恒;雖然深層神經(jīng)網(wǎng)絡(luò)模型的結(jié)果基本能夠保持能量守恒,但是深層神經(jīng)網(wǎng)絡(luò)模型很難訓(xùn)練,而且泛化能力較弱,可能存在固有誤差。Pal等利用深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNN)代替地球系統(tǒng)模式中的輻射參數(shù)化方案,盡管在保證準(zhǔn)確率的情況下模型效率得到了改善,但只利用DNN模擬了晴空氣體的長(zhǎng)波和短波輻射,沒有包括云和氣溶膠的輻射效應(yīng)。Wang等利用DNN模擬WRF模式中的PBL參數(shù)化,成功地模擬了邊界層內(nèi)速度、溫度和水汽的垂直廓線,但尚未完全耦合到WRF模式中。此外,為了進(jìn)一步提高計(jì)算效率還需要解決模型分布式訓(xùn)練的問題。
除了研究利用深度學(xué)習(xí)來替換單獨(dú)的參數(shù)化方案,Brenowitz等通過訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型替換次網(wǎng)格的多個(gè)參數(shù)化方案,比如包括積云對(duì)流、輻射、邊界層輸送及其他隨機(jī)過程參數(shù)化,即統(tǒng)一物理參數(shù)化替代模型??紤]到氣象預(yù)測(cè)的時(shí)空變化特征,僅對(duì)每個(gè)時(shí)步的均方根誤差進(jìn)行性能評(píng)估是不夠的,應(yīng)采用多時(shí)步預(yù)測(cè)和觀測(cè)誤差構(gòu)建損失函數(shù),確保長(zhǎng)時(shí)間運(yùn)行期間的穩(wěn)定性和準(zhǔn)確性。然而,由于多時(shí)步評(píng)價(jià)的損失函數(shù)的神經(jīng)網(wǎng)絡(luò)模型對(duì)時(shí)間離散化和時(shí)間步長(zhǎng)具有隱式依賴,會(huì)導(dǎo)致訓(xùn)練模型產(chǎn)生誤差,因此需要對(duì)多時(shí)步損失函數(shù)的方法進(jìn)行適當(dāng)?shù)貎?yōu)化。此外,必須指出的是,以上兩種損失函數(shù)均無法解決神經(jīng)網(wǎng)絡(luò)模型和動(dòng)力模型耦合時(shí)的“模式爆炸”(model blow-up)問題,即因混合模型無法考慮兩個(gè)模型間的反饋,導(dǎo)致?lián)p失函數(shù)不能懲罰這種反饋所導(dǎo)致的不確定性,最終發(fā)生模式態(tài)嚴(yán)重偏離,即“模式爆炸”。多時(shí)步損失函數(shù)的提出為解決長(zhǎng)時(shí)間預(yù)測(cè)的穩(wěn)定性和準(zhǔn)確性問題打開了新的視野。
除研究利用深度學(xué)習(xí)替換數(shù)值預(yù)報(bào)模式的次網(wǎng)格物理參數(shù)化子模塊外,Scher和Weber等還嘗試了直接利用端到端的深層神經(jīng)網(wǎng)絡(luò)模型替換完整的數(shù)值天氣預(yù)報(bào)模式?;诤?jiǎn)化模型的研究表明,如果有足夠的數(shù)據(jù),深層神經(jīng)網(wǎng)絡(luò)模型可以在不犧牲預(yù)報(bào)準(zhǔn)確率的情況下顯著改善計(jì)算效率。Scher等發(fā)現(xiàn),訓(xùn)練數(shù)據(jù)集的大小以及不同氣候過程的復(fù)雜度會(huì)影響神經(jīng)網(wǎng)絡(luò)模型的預(yù)報(bào)技能。他們認(rèn)為卷積神經(jīng)網(wǎng)絡(luò)雖然能夠通過卷積層和池化層處理空間特征,但是只適合處理矩形網(wǎng)格數(shù)據(jù)。對(duì)于具有時(shí)空變化特征的地球彎曲表面的氣象場(chǎng),采用球面卷積神經(jīng)網(wǎng)絡(luò)或許能得到更好的結(jié)果。
此外,卷積神經(jīng)網(wǎng)絡(luò)很難處理關(guān)鍵特征的空間變化問題,比如一張面部圖,眼睛和嘴巴的位置挪動(dòng)之后,仍然具有正確的特征,但是相對(duì)位置卻錯(cuò)了。這是由于卷積神經(jīng)網(wǎng)絡(luò)中的池化層通過計(jì)算相鄰網(wǎng)格點(diǎn)的最大或平均值引入平移或尺度不變性來識(shí)別不同大小或位置的相同對(duì)象。解決這一問題對(duì)利用深度學(xué)習(xí)處理時(shí)空復(fù)雜多變的氣象問題非常重要。為此,Sabour等提出膠囊神經(jīng)網(wǎng)絡(luò),利用包含更多特征信息的膠囊單元替換卷積神經(jīng)網(wǎng)絡(luò)中的池化層,以提取包含位置、相對(duì)距離、方向等信息,將相對(duì)位置編碼在特征圖中,并引入了位置等變性,從而更好地處理對(duì)相對(duì)位置特征敏感的問題。
上述提到的替換模式物理參數(shù)化子模塊和替換完整的數(shù)值天氣預(yù)報(bào)模式方法都是基于模式物理參數(shù)化和完整的數(shù)值天氣預(yù)報(bào)模式的模擬數(shù)據(jù)集訓(xùn)練深度學(xué)習(xí)模型。Vlachas等嘗試?yán)蒙窠?jīng)網(wǎng)絡(luò)模型構(gòu)建純數(shù)據(jù)驅(qū)動(dòng)的動(dòng)力系統(tǒng)模型的方法,相比于高斯過程回歸,基于LSTM的模型在短期預(yù)測(cè)方面取得了更好的結(jié)果,但是隨著迭代的增加誤差不斷累積,且更容易發(fā)散。此外,一些研究者開始利用大量的觀測(cè)數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí),近似表示偏微分方程,試圖從高維數(shù)據(jù)中發(fā)現(xiàn)物理定律。這些研究未來無疑會(huì)對(duì)深度學(xué)習(xí)在數(shù)值天氣預(yù)報(bào)模式方面的應(yīng)用帶來新的啟發(fā)。
大氣是一個(gè)混沌系統(tǒng),數(shù)值天氣預(yù)報(bào)模式預(yù)報(bào)對(duì)模式初始條件非常敏感,加上模式動(dòng)力近似、次網(wǎng)格物理參數(shù)化和下墊面地形、植被、土壤等特性參數(shù)的不確定性等因素,模式預(yù)報(bào)誤差不可避免,有時(shí)會(huì)在小尺度過程上迅速發(fā)展,隨后傳播到大尺度過程,導(dǎo)致數(shù)值天氣預(yù)報(bào)模式預(yù)報(bào)出現(xiàn)極大的不確定性。目前,集合數(shù)值模式預(yù)報(bào)方法是考慮數(shù)值預(yù)報(bào)的不確定性的主要手段。但是數(shù)值天氣預(yù)報(bào)模式的自由度非常大,通常超過10,由于計(jì)算資源的限制,當(dāng)前大部分業(yè)務(wù)集合數(shù)值模式預(yù)報(bào)的成員數(shù)在20~50個(gè),而且集合數(shù)值模式預(yù)報(bào)的初始條件一般是從不完美的初始場(chǎng)誤差分布中進(jìn)行采樣。因此,數(shù)值天氣預(yù)報(bào)模式的不確定性和集合數(shù)值模式預(yù)報(bào)取樣數(shù)(成員)的限制導(dǎo)致集合數(shù)值模式預(yù)報(bào)的結(jié)果仍可能存在較大誤差。
考慮到上述問題,數(shù)值天氣預(yù)報(bào)模式輸出的統(tǒng)計(jì)后處理尤為重要。除傳統(tǒng)的統(tǒng)計(jì)后處理方法外,機(jī)器學(xué)習(xí)方法也已逐漸被應(yīng)用于數(shù)值預(yù)報(bào)的后處理,比如基于保序回歸的冰雹預(yù)報(bào)校正,基于隨機(jī)森林的溫度和雷暴尺度降水預(yù)報(bào)校正。此外,一些研究者利用神經(jīng)網(wǎng)絡(luò)對(duì)集合數(shù)值模式預(yù)報(bào)的降水和溫度進(jìn)行預(yù)報(bào)校正。這些研究結(jié)果表明,深度學(xué)習(xí)模型的結(jié)果總體優(yōu)于傳統(tǒng)的統(tǒng)計(jì)后處理方法,但是深度學(xué)習(xí)容易發(fā)生過擬合??傮w而言,當(dāng)前深度學(xué)習(xí)在數(shù)值天氣預(yù)報(bào)模式后處理方面(特別是集合數(shù)值模式預(yù)報(bào)的后處理)的應(yīng)用仍處于初步階段,大部分僅用于針對(duì)站點(diǎn)的觀測(cè)和預(yù)報(bào)匹配數(shù)據(jù)集,利用具有極少參數(shù)的模型來校正數(shù)值天氣預(yù)報(bào)模式的預(yù)報(bào)。未來利用卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)二維、三維網(wǎng)格的數(shù)值預(yù)報(bào)進(jìn)行后處理,通過捕捉相應(yīng)的大、中、小尺度的天氣環(huán)流信息,有利于生成空間一致和更準(zhǔn)確的預(yù)測(cè)。通過增加數(shù)據(jù)量、改善神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)、數(shù)據(jù)增強(qiáng)技術(shù)等,將會(huì)進(jìn)一步改善深度學(xué)習(xí)方法的過擬合問題。
深度學(xué)習(xí)模型是基于大量的數(shù)據(jù)通過多層神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)規(guī)律,沒有直接的物理規(guī)律的限制。因此,深度學(xué)習(xí)的預(yù)測(cè)結(jié)果經(jīng)常存在變量時(shí)空分布和多變量之間物理不一致的問題。這一問題會(huì)導(dǎo)致深度學(xué)習(xí)模型得到基于某種評(píng)分方式較好的預(yù)測(cè)結(jié)果,但其預(yù)測(cè)變量間可能不滿足真實(shí)大氣的物理規(guī)律。因此,使用深度學(xué)習(xí)模型時(shí),有必要在改善模型預(yù)測(cè)能力的同時(shí),加強(qiáng)模型的學(xué)習(xí)過程和對(duì)物理規(guī)律的可解釋能力。深度學(xué)習(xí)模型的可解釋性和不確定性量化不僅在氣象領(lǐng)域非常重要,也是所有其他具有動(dòng)力演變機(jī)制的應(yīng)用領(lǐng)域都需要解決的問題。
2.5.1 模型的可解釋性
深度學(xué)習(xí)在對(duì)流短時(shí)臨近預(yù)報(bào)、極端天氣預(yù)測(cè)、數(shù)值天氣預(yù)報(bào)模式次網(wǎng)格過程參數(shù)化以及數(shù)值天氣預(yù)報(bào)模式后處理方面的應(yīng)用,多數(shù)是處理復(fù)雜的非線性問題。雖然從結(jié)構(gòu)上說,神經(jīng)網(wǎng)絡(luò)是由非線性變化及可調(diào)整權(quán)重和偏差的一系列層構(gòu)成,但在實(shí)際應(yīng)用中,由于深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)的高度復(fù)雜性以及多層網(wǎng)絡(luò)層抽象程度的增加,理解神經(jīng)網(wǎng)絡(luò)模型如何以及為什么能得到(或不能得到)我們想要的結(jié)果是非常困難的。比如,在估計(jì)降水的降尺度產(chǎn)品時(shí),Pan等利用激活層和擾動(dòng)敏感性技術(shù)來分析CNN模型的學(xué)習(xí)過程,表明不同的降水事件在不同的網(wǎng)絡(luò)通道表現(xiàn)出了不同的特征,CNN模型通過核學(xué)習(xí)過濾數(shù)據(jù)增強(qiáng)特征提取過程,但該方法仍很難區(qū)分這些特征是如何與特定降水事件聯(lián)系起來的。
為了解決這些問題,有研究提出了“可解釋人工智能(Explainable Artificial Intelligence, EXI)”的概念,試圖賦予模型可靠性、可解釋性、負(fù)責(zé)性以及透明性的能力。而且已有研究者開始探索利用可解釋人工智能來研究解決機(jī)器學(xué)習(xí)和深度學(xué)習(xí)在氣象領(lǐng)域的可解釋性問題。比如,Gagne等利用特征重要性和特征優(yōu)化解釋卷積神經(jīng)網(wǎng)絡(luò)的結(jié)果,揭示出卷積神經(jīng)網(wǎng)絡(luò)得到的環(huán)境和雷暴形態(tài)學(xué)信息與我們對(duì)冰雹增長(zhǎng)的理論理解是一致的;Brenowitz等通過評(píng)估神經(jīng)網(wǎng)絡(luò)對(duì)低層對(duì)流層穩(wěn)定性和中層對(duì)流層濕度的敏感性以及耦合神經(jīng)網(wǎng)絡(luò)的線性響應(yīng)函數(shù)簡(jiǎn)化重力波動(dòng)力過程,更好地解釋了在利用神經(jīng)網(wǎng)絡(luò)改善次網(wǎng)格尺度參數(shù)化并耦合大氣流體動(dòng)力過程時(shí)產(chǎn)生的極度不穩(wěn)定性問題;Toms等發(fā)展了特征可視化和層間相關(guān)傳播(Layer-Wise Relevance Propagation,LRP)方法,探討了神經(jīng)網(wǎng)絡(luò)在ENSO和季節(jié)性預(yù)報(bào)方面的可解釋性問題。
除了上述研究外,McGovern等較為系統(tǒng)地介紹了機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方面的可解釋性方法在氣象領(lǐng)域的應(yīng)用,包括雜質(zhì)重要性、組合重要性、序列選擇、部分依賴圖、顯著圖、梯度加權(quán)類別激活圖、反向優(yōu)化和新奇探測(cè)法,并對(duì)每種方法的使用場(chǎng)景以及優(yōu)缺點(diǎn)進(jìn)行了總結(jié),以確保機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型應(yīng)用到氣象領(lǐng)域時(shí)能夠發(fā)揮最佳性能。
2.5.2 不確定性量化
模型檢驗(yàn)和評(píng)估的主要任務(wù)之一是量化數(shù)據(jù)的不確定性。數(shù)據(jù)不確定性包含了可以幫助更加合理的進(jìn)行資料同化、假設(shè)檢驗(yàn)和決策的重要信息。對(duì)數(shù)值天氣預(yù)報(bào)模式,由于模式初始狀態(tài)和模式方程都存在誤差,數(shù)值預(yù)報(bào)本身存在很大的不確定性。因此,無論是評(píng)估氣候變化還是檢驗(yàn)數(shù)值天氣預(yù)報(bào),量化不確定性都是非常重要的。
當(dāng)前,氣象預(yù)報(bào)領(lǐng)域通常是通過集合數(shù)值模式預(yù)報(bào)方法量化預(yù)報(bào)的不確定性。深度學(xué)習(xí)在氣象領(lǐng)域仍處于初步應(yīng)用階段,對(duì)于深度學(xué)習(xí)模型預(yù)測(cè)不確定性的研究較少,在量化模型的不確定性方面存在明顯不足。比如,僅通過常規(guī)評(píng)價(jià)方法量化具有線性誤差假設(shè)、相互依賴和不充分等問題;或通過引入新的損失函數(shù)優(yōu)化模型,僅對(duì)單站點(diǎn)的預(yù)測(cè)進(jìn)行不確定性量化。目前,基于深度學(xué)習(xí)的標(biāo)量值的不確定性量化結(jié)果的技能評(píng)分表現(xiàn)比集合數(shù)值天氣預(yù)報(bào)的結(jié)果差。由于這些相對(duì)簡(jiǎn)單的不確定性量化方法存在嚴(yán)重不足,有些學(xué)者嘗試發(fā)展更復(fù)雜的量化方法,比如貝葉斯深度學(xué)習(xí)方法。然而,這些更先進(jìn)的方法面臨很多困難,需要進(jìn)行大量地交互式模型修改和調(diào)整,且計(jì)算效率低。Gal提出了無需修改模型或進(jìn)行優(yōu)化的貝葉斯深度學(xué)習(xí)不確定性評(píng)估工具,但距應(yīng)用于氣象領(lǐng)域的深度學(xué)習(xí)模型預(yù)測(cè)尚有一定的差距。氣象領(lǐng)域應(yīng)用深度學(xué)習(xí)模型需要處理不同的噪音源、高維空間、多尺度、遙相關(guān)等問題,有必要整合貝葉斯或概率推斷處理不確定性問題。
深度學(xué)習(xí)的不確定性分析是基于大量歷史數(shù)據(jù)推演出由于數(shù)據(jù)、模型構(gòu)造和模型參數(shù)的不確定性導(dǎo)致的資料同化分析場(chǎng)、模型預(yù)報(bào)、數(shù)值天氣預(yù)報(bào)誤差訂正等產(chǎn)品的不確定性和概率特征。實(shí)際上這些不確定性與所處理的天氣過程的穩(wěn)定性和可預(yù)報(bào)性有一定的關(guān)系。理論上,對(duì)不穩(wěn)定、可預(yù)報(bào)性較低的氣象過程,機(jī)器學(xué)習(xí)數(shù)據(jù)和模型參數(shù)的不確定性較大,學(xué)習(xí)結(jié)果的可靠性偏小。而對(duì)穩(wěn)定、可預(yù)報(bào)性較高的氣象過程,機(jī)器學(xué)習(xí)數(shù)據(jù)和模型參數(shù)的不確定性較小,學(xué)習(xí)結(jié)果的可靠性會(huì)更強(qiáng)。這與數(shù)值天氣預(yù)報(bào)中數(shù)理方程驅(qū)動(dòng)的集合預(yù)報(bào)的基礎(chǔ)概念和要解決的問題非常一致。如何結(jié)合深度學(xué)習(xí)和數(shù)值集合預(yù)報(bào)技術(shù),提升預(yù)報(bào)精度和更精確地定量表達(dá)預(yù)報(bào)誤差的概率分布,可能是提升當(dāng)前集合預(yù)報(bào)產(chǎn)品精度的重要手段。最近,Hewson等利用深度學(xué)習(xí)技術(shù)對(duì)歐洲中期天氣預(yù)報(bào)中心(ECMWF)的集合數(shù)值預(yù)報(bào)的降水預(yù)報(bào)進(jìn)行后處理,明顯地改進(jìn)了模式降水預(yù)報(bào)精度和使用價(jià)值。
上述分析表明,為進(jìn)一步改善深度學(xué)習(xí)在氣象領(lǐng)域的應(yīng)用,深度學(xué)習(xí)模型的不確定性量化和學(xué)習(xí)過程的可解釋性是目前亟待解決的問題。隨著深度學(xué)習(xí)模型不確定性量化方法的不斷改進(jìn),這些技術(shù)將為量化氣象領(lǐng)域深度學(xué)習(xí)模型預(yù)測(cè)的不確定性帶來新的機(jī)遇。
綜合回顧了深度學(xué)習(xí)在改善數(shù)值天氣模式次網(wǎng)格物理過程參數(shù)化、資料同化、模式輸出后處理及模型可解釋性和不確定性量化方面的研究進(jìn)展,探討了當(dāng)前深度學(xué)習(xí)在氣象領(lǐng)域所面臨的問題及未來應(yīng)加強(qiáng)的研究方向。
本研究認(rèn)為,完全忽視數(shù)值天氣模式嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)和大氣物理的理論和目前已取得的業(yè)務(wù)預(yù)報(bào)上的成功,試圖應(yīng)用深度學(xué)習(xí)替代數(shù)值天氣模式可能是不明智的,對(duì)相對(duì)較長(zhǎng)時(shí)間、包含復(fù)雜非線性過程的天氣過程的預(yù)報(bào)尤其如此。目前多數(shù)學(xué)者已達(dá)成共識(shí),構(gòu)建耦合數(shù)值天氣預(yù)報(bào)模式和深度學(xué)習(xí)的混合模型,利用深度學(xué)習(xí)的優(yōu)勢(shì)改善理論驅(qū)動(dòng)的物理模型存在的問題,發(fā)揮兩者的協(xié)同作用是發(fā)揮深度學(xué)習(xí)技術(shù)在氣象預(yù)報(bào)中價(jià)值的可行路徑。整體而言,深度學(xué)習(xí)和數(shù)值天氣預(yù)報(bào)模式的協(xié)同作用研究尚處于探索階段,對(duì)耦合深度學(xué)習(xí)和數(shù)值天氣預(yù)報(bào)模式時(shí)導(dǎo)致的不穩(wěn)定性和偏差尚缺乏充分認(rèn)識(shí)和較好的解決方案。
當(dāng)前深度學(xué)習(xí)在替換數(shù)值天氣預(yù)報(bào)模式中的參數(shù)化子模塊、模擬數(shù)值天氣預(yù)報(bào)模式積分和資料同化等方面的研究,主要是針對(duì)選取有限特征的低維系統(tǒng)。因此,未來需要對(duì)深度學(xué)習(xí)在數(shù)值天氣預(yù)報(bào)模式方面的應(yīng)用進(jìn)行更加全面的研究,以進(jìn)一步改善高維氣象業(yè)務(wù)數(shù)值天氣預(yù)報(bào)模式的計(jì)算效率和精度。Ott等開發(fā)了用于科學(xué)計(jì)算的Fortran語言和現(xiàn)代深度學(xué)習(xí)模型語言間的橋梁接口,在一定程度上從技術(shù)層面解決了耦合數(shù)值天氣預(yù)報(bào)模式和現(xiàn)代語言體系下的深度學(xué)習(xí)模型所面臨的困難。這一工作開創(chuàng)了數(shù)值天氣預(yù)報(bào)模式和深度學(xué)習(xí)高度混合模型計(jì)算的先例。考慮到數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)模型和基于數(shù)理方程的數(shù)值天氣預(yù)報(bào)模式的數(shù)據(jù)流、計(jì)算方法和并行計(jì)算的邏輯均有所差異。ECMWF計(jì)劃于2024年構(gòu)建具備支持該中心未來深度學(xué)習(xí)和數(shù)值天氣預(yù)報(bào)模式混合計(jì)算的高性能計(jì)算(HPC)設(shè)施。未來幾年,不僅要深入探索和改進(jìn)深度學(xué)習(xí)在數(shù)值天氣預(yù)報(bào)的觀測(cè)資料處理和質(zhì)量控制、資料同化、物理過程參數(shù)化、數(shù)值方案和模式輸出處理及釋用方面的能力,還需要開發(fā)新型模式軟件設(shè)計(jì)和計(jì)算機(jī)硬件架構(gòu),以期提升深度學(xué)習(xí)和數(shù)值天氣預(yù)報(bào)模式混合計(jì)算效率。
通過為深度學(xué)習(xí)模型添加基于理論的物理限制,即物理限制的深度學(xué)習(xí)模型,一方面可以解決深度學(xué)習(xí)的物理一致性問題,另一方面可以在一定程度上增強(qiáng)深度學(xué)習(xí)模型的可解釋性。同時(shí),在模型中引入貝葉斯/概率推斷,也是處理模型不確定性問題的可行方案。因此,未來應(yīng)進(jìn)一步發(fā)展數(shù)值天氣動(dòng)力和物理理論驅(qū)動(dòng)的深度學(xué)習(xí)模型,加強(qiáng)數(shù)值天氣預(yù)報(bào)模式和深度學(xué)習(xí)模型的協(xié)同作用,進(jìn)一步改善數(shù)值天氣預(yù)報(bào)模式的結(jié)果和運(yùn)行效率。
必須指出的是,不同于其他領(lǐng)域的深度學(xué)習(xí)技術(shù)發(fā)展,深度學(xué)習(xí)在數(shù)值天氣預(yù)報(bào)中的應(yīng)用必須充分考慮氣象過程的高度非線性、下墊面非均勻強(qiáng)迫和觀測(cè)的多樣性和不確定性,同時(shí)發(fā)揮大氣動(dòng)力數(shù)學(xué)和物理理論優(yōu)勢(shì),以數(shù)值天氣預(yù)報(bào)模式的熱動(dòng)力方程和大氣物理過程機(jī)制為基礎(chǔ),針對(duì)數(shù)值天氣模式的不同分量的特殊功能和問題,構(gòu)建物理限制的深度學(xué)習(xí)技術(shù),提升氣象模擬精度。因此,除在人工智能廣域研究中鑒別和加強(qiáng)適用于氣象特有問題的深度學(xué)習(xí)新技術(shù)外,探索耦合深度學(xué)習(xí)和數(shù)值天氣預(yù)報(bào)模式的資料同化、模式物理和動(dòng)力以及預(yù)報(bào)后處理等多環(huán)節(jié)的混合模型、利用遷移學(xué)習(xí)技術(shù)解決數(shù)據(jù)量不足所帶來的問題,以及發(fā)展深度學(xué)習(xí)模型訓(xùn)練中氣象特征和信息篩選的可解釋能力,將是未來進(jìn)一步提升深度學(xué)習(xí)在數(shù)值天氣模式研究和應(yīng)用中的能力和價(jià)值的重要研究方向。
Advances in Meteorological Science and Technology2021年3期