亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        深度學習在天氣預(yù)報領(lǐng)域的應(yīng)用分析及研究進展綜述

        2023-07-03 14:12:34董潤婷王曉英曹騰飛黃建強吳潔瑕
        計算機應(yīng)用 2023年6期
        關(guān)鍵詞:天氣預(yù)報氣象數(shù)值

        董潤婷,吳 利*,王曉英,曹騰飛,黃建強,管 琴,吳潔瑕

        (1.青海大學 計算機技術(shù)與應(yīng)用系,西寧 810016;2.青海省氣象臺,西寧 811300;3.北京弘象科技有限公司,北京 100195)

        0 引言

        天氣預(yù)報作為一個與人類生產(chǎn)生活和社會穩(wěn)定息息相關(guān)的課題,一直是科學家們的研究重點。由于人們并不完全清楚氣候變化這種復(fù)雜時空問題的內(nèi)在機制,很難建立精確且高效的數(shù)值天氣預(yù)報(Numerical Weather Prediction,NWP)模式;另外,雖然基于機器學習的方法已被證明可以根據(jù)歷史數(shù)據(jù)學習內(nèi)在“規(guī)律”并有助于作出相對準確的預(yù)測[1],但是由于天氣預(yù)報相關(guān)問題涉及的氣象數(shù)據(jù)體量龐大、特征維度高、格式復(fù)雜多樣,傳統(tǒng)機器學習方法在面對爆炸式增長的氣象訓練數(shù)據(jù)和更長期的預(yù)測需求時,預(yù)測效果難以進一步提升,因此當前人們能夠準確預(yù)測的天氣演變時長仍然僅限于短短幾天,而長期或者季節(jié)性的預(yù)測,以及臺風、山洪等極端天氣情況的預(yù)報仍然是該領(lǐng)域面臨的主要挑戰(zhàn)[2]。目前,不斷發(fā)展的時空序列深度學習模型、計算機持續(xù)增長的計算能力和大量現(xiàn)有的觀測數(shù)據(jù)都為氣象領(lǐng)域相關(guān)問題建模分析和預(yù)測提供了新的機遇。氣象領(lǐng)域的預(yù)測或檢測問題無論是從數(shù)據(jù)形式還是問題本身,都非常經(jīng)典地融合了時間與空間特征的深度學習問題,因此深度學習在天氣預(yù)報領(lǐng)域,例如風速與降水等天氣要素的預(yù)測問題[3-4]、極端天氣的檢測問題[5-6]和天氣現(xiàn)象的分類問題[5]等,都有著廣泛的應(yīng)用。根據(jù)歷史的觀測結(jié)果準確檢測氣象信息、正確預(yù)測氣象要素的未來趨勢對廣泛的科學研究和實際應(yīng)用至關(guān)重要。

        雖然深度學習模型一般分為能夠編碼時間信息的遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)和能夠編碼空間信息的卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Network,CNN)兩大主要方向,但現(xiàn)在越來越多研究開始將兩者結(jié)合,對融合時間與空間特性的氣象數(shù)據(jù)進行分析建模。這種使用深度學習模型進行時空序列預(yù)測(SpatioTemporal Sequence Forecasting,STSF)分析的方式與傳統(tǒng)機器學習模型相比有諸多優(yōu)勢:氣象數(shù)據(jù)的空間鄰近性和長期時間相關(guān)性通常比較復(fù)雜,特征難以捕捉,因此與傳統(tǒng)的需要人工設(shè)定特征的機器學習方法相比,融合了CNN 多層卷積和RNN 遞歸結(jié)構(gòu)的深度學習模型可自動從原始數(shù)據(jù)中學習這些時空依賴關(guān)系[7];氣象數(shù)據(jù)特征維度高、數(shù)據(jù)格式復(fù)雜難懂[8],而由多個簡單且非線性的模塊堆疊而成的深度學習模型擁有強大的函數(shù)逼近能力,可以通過子模塊的池化、參數(shù)丟棄和激活的功能將抽象的高層特征表示轉(zhuǎn)化為較低層次的潛在特征表示。目前已有更多的研究者[9]探索由用于時空序列預(yù)測的深度神經(jīng)網(wǎng)絡(luò)和編碼器結(jié)構(gòu)(例如注意力機制)組成的混合深度學習模型,這種組合建模的發(fā)展過程如圖1 所示。在天氣預(yù)報領(lǐng)域,具有發(fā)展前景的融合時空信息與注意力機制的深度學習模型則是將原始數(shù)據(jù)按時間序列順序輸入經(jīng)過采樣器采樣和時空序列預(yù)測模型編碼時空信息,再通過注意力機制整合空間信息得到預(yù)測輸出的結(jié)果,原理如圖2 所示。

        圖1 時空序列預(yù)測問題的深度學習模型發(fā)展流程Fig.1 Development flow of deep learning model for spatiotemporal sequence forecasting problem

        圖2 融合時空信息與注意力機制的深度學習模型Fig.2 Deep learning model integrating spatiotemporal information and attention mechanism

        同時,隨著遙感和實地檢測技術(shù)的普及,已有大量的地球系統(tǒng)數(shù)據(jù)可用[10],但是來自傳感器的觀測數(shù)據(jù)可能會由于設(shè)備原因而包含噪聲信息或缺省值[11],如何從這些大量復(fù)雜又不確定的時空數(shù)據(jù)中提取有用的信息和知識也是一個需要突破的方向。此外,從原理上來看,理論驅(qū)動的數(shù)值天氣預(yù)報模式和數(shù)據(jù)驅(qū)動的深度學習技術(shù)通常被視為兩個不同的領(lǐng)域,具有截然不同的科學范式,但兩者間的協(xié)同作用較大,因此兩種技術(shù)的共同進步也使得使模擬和數(shù)據(jù)科學的方法能夠在多個方面更緊密地結(jié)合在一起。

        本文先將經(jīng)典深度學習應(yīng)用領(lǐng)域的科學問題與天氣預(yù)報領(lǐng)域應(yīng)用深度學習技術(shù)的數(shù)據(jù)格式和問題模型的異同作類比分析。首先,回顧并總結(jié)了深度學習在解決天氣預(yù)報方面問題的發(fā)展歷程與應(yīng)用現(xiàn)狀;然后,綜述了將深度學習技術(shù)與數(shù)值天氣預(yù)報結(jié)合的技術(shù)重點和最新應(yīng)用進展,指出了在龐大的氣象數(shù)據(jù)體量下對深度學習模型性能提升的可能性和研究深度學習模型的可解釋性對天氣預(yù)報領(lǐng)域的重要性;最后,對比了深度學習問題的評價指標在氣象領(lǐng)域的融合與適配以及應(yīng)用場景,指出了深度學習在天氣預(yù)報中應(yīng)用的挑戰(zhàn)問題、后續(xù)發(fā)展方向和研究重點,為以后天氣預(yù)報領(lǐng)域的深度學習發(fā)展提供參考依據(jù)。

        1 天氣預(yù)報問題與其他經(jīng)典深度學習問題的類比分析

        針對時空數(shù)據(jù)的深度學習技術(shù)已經(jīng)在智能交通(交通預(yù)測)、城市規(guī)劃(人流移動)等相關(guān)應(yīng)用領(lǐng)域[12-14]取得了顯著成功,而在天氣預(yù)報領(lǐng)域的應(yīng)用仍處于初級階段。

        使用深度學習模型解決經(jīng)典時空序列預(yù)測問題的一般過程通常是:首先將原始時空數(shù)據(jù)構(gòu)建數(shù)據(jù)實例進行存儲,再將時空數(shù)據(jù)實例表示為一種特定的數(shù)據(jù)格式,例如序列數(shù)據(jù)、二維矩陣、三維張量和圖等;然后針對不同的數(shù)據(jù)格式采用不同的深度學習模型進行處理;最后選擇合適的深度學習模型用于處理各種時空數(shù)據(jù)挖掘任務(wù),如預(yù)測、分類等。

        無論是數(shù)據(jù)格式還是抽象后的問題模型(回歸、分類、異常檢測、時空狀態(tài)預(yù)測),天氣預(yù)報領(lǐng)域問題與其他經(jīng)典深度學習問題都有著一定的相關(guān)性。

        1.1 數(shù)據(jù)格式

        Wang 等[15]總結(jié)了經(jīng)典深度學習問題的基本數(shù)據(jù)格式,包含事件、軌跡、數(shù)值和視頻等幾種類型?;诖耍疚膶⒏黝悢?shù)據(jù)格式與相關(guān)天氣預(yù)報問題對應(yīng)如下。

        1)事件。事件數(shù)據(jù)包括在某個地點和時間發(fā)生的離散事件,例如極端天氣檢測問題中的冰雹、雷電等。

        2)軌跡。軌跡表示隨時間推移在空間中移動的物體所經(jīng)過的路徑。軌跡數(shù)據(jù)通常由傳感器收集,隨著時間的推移周期性地采集云高云量等天氣相關(guān)信息。

        3)數(shù)值。數(shù)值數(shù)據(jù)包括各類連續(xù)時空場的測量值,例如在空間和時間上觀測的一組溫度、濕度等基本天氣要素參數(shù)。

        4)圖像。天氣預(yù)報領(lǐng)域的圖像數(shù)據(jù)通常是將雷達的基本反射率通過線性轉(zhuǎn)換成普通圖片后進行雷達回波外推。

        5)視頻。由一系列圖像組成的視頻也可以視為一種時空數(shù)據(jù)。在空間域中,相鄰像素通常具有相似的RGB 值,因此呈現(xiàn)出較高的空間相關(guān)性。在時間域中,連續(xù)幀的圖像通常會平滑變化并呈現(xiàn)較高的時間依賴性。

        深度學習模型所處理的數(shù)據(jù)類型與氣象數(shù)據(jù)之間的相似性為將深度學習整合到氣象系統(tǒng)中提供了令人信服的論據(jù),但氣象數(shù)據(jù)獨有的特性也一定程度上成為了天氣預(yù)報問題應(yīng)用深度學習模型的挑戰(zhàn)。例如,衛(wèi)星觀測數(shù)據(jù)會伴隨著各種噪聲、缺省與不確定性,以及采集、存儲和傳輸過程中的失真[16],另外,光譜、空間和時間維度也帶來了計算上的挑戰(zhàn)[17]。

        1.2 問題模型

        當把包含有時間與空間的氣象數(shù)據(jù),表示為深度學習模型能夠處理的合適的數(shù)據(jù)表示格式后,將它們提供給不同的深度學習模型,以解決不同類型的天氣預(yù)報問題。例如經(jīng)典CNN 模型主要用于處理圖數(shù)據(jù)[18],完成對各類天氣模式的檢測與識別,也可以用來處理軌跡數(shù)據(jù),預(yù)測雷達回波圖中的云層軌跡;RNN 模型用于預(yù)測時間序列,預(yù)測天氣要素的未來值;ConvLSTM(Convolutional Long Short-Term Memory network)[19]首先提出將RNN 和CNN 結(jié)合,通過雷達回波圖應(yīng)用于降水情況分類;此外還有以自動編碼器(Auto-Encoder,AE)為基礎(chǔ)的復(fù)雜深度學習模型[1,20],在模型中同時編碼時間與空間信息以解決更復(fù)雜更不確定的科學問題。

        天氣預(yù)報問題可以類比經(jīng)典深度學習問題,大致劃分為分類、回歸、檢測識別等幾個方向;然而在解決每個天氣預(yù)報領(lǐng)域中具體的實際問題時,如何選擇并設(shè)計一個完整且合理的深度學習模型,以及需要融合哪些其他數(shù)據(jù)或基礎(chǔ)模型仍然需要具體分析。因為現(xiàn)實中某個時間和空間點上的過程會受到一些不易被觀察到的其他狀態(tài)的影響,例如,當判定某一大氣狀況歸類是颶風還是溫帶風暴時,就需要同時了解一定的空間信息[21]。

        綜上所述,在天氣預(yù)報領(lǐng)域中的觀測圖像可以類比為經(jīng)典深度學習問題中包含特定變量的二維數(shù)據(jù)或是照片中的顏色三元組(RGB 值);而動態(tài)視頻本質(zhì)上為一系列圖像序列,可類比于隨時間演變的二維數(shù)據(jù);同樣,自然語言和語音信號也具有與地球系統(tǒng)變量動態(tài)時間序列相同的多分辨率特性;此外,分類(氣旋分類、天氣狀況分類)、回歸(天氣要素數(shù)值預(yù)測)、異常檢測(極端天氣檢測)和動態(tài)建模是氣象監(jiān)測領(lǐng)域的典型問題。

        因此,經(jīng)典問題中深度學習技術(shù)的發(fā)展方向也同樣適用于天氣預(yù)報領(lǐng)域。經(jīng)典深度學習方法通常被分為空間特征學習(例如計算機視覺領(lǐng)域的CNN)和時間特征學習(例如自然語言處理領(lǐng)域的RNN)兩個方向,Shi 等[19]提出的ConvLSTM 將兩個方向結(jié)合用于降水預(yù)測。

        1.3 評價指標

        在深度學習領(lǐng)域,針對不同類型的數(shù)據(jù)(數(shù)值、圖像等)和問題(分類、回歸、檢測識別等)的評價指標體系已基本建立完備。下面對于這些評價指標在天氣預(yù)報領(lǐng)域的適配與應(yīng)用進行總結(jié)和說明。

        1.3.1 分類問題

        天氣預(yù)報問題中經(jīng)常根據(jù)預(yù)測后的雷達回波圖在一定區(qū)域范圍的網(wǎng)格化的氣象要素結(jié)果對該區(qū)域進行晴雨分類,當格點數(shù)值大于一個特定閾值時,預(yù)測為有降水;否則預(yù)測為無降水。以晴雨分類為例,經(jīng)典深度學習中的混淆矩陣對應(yīng)的氣象概念如表1 所示。

        表1 氣象領(lǐng)域的混淆矩陣Tab.1 Confusion matrix in meteorological field

        針對不同需求,氣象上有許多評價此類預(yù)報準確度的指標,其中關(guān)鍵成功指數(shù)(Critical Success Index,CSI)、誤警率(False Alarm Rate,F(xiàn)AR)和檢測率(Probability Of Detection,POD)常用于評估模型精度,具體如表2所示。

        表2 氣象分類問題的評估指標Tab.2 Evaluation metrics for meteorological classification problems

        1.3.2 回歸問題

        當評價時序模型預(yù)測結(jié)果時,一般基于預(yù)測值和實際值的函數(shù),比如預(yù)測某坐標未來一段時間的風速、溫度和降水量等數(shù)值預(yù)測問題。假設(shè)存在n個樣本,每個樣本的真實值為預(yù)測值為y={y1,y2,…,yn},則常用的評價指標通常有均方誤差(Mean Square Error,MSE)、均方根誤差(Root Mean Square Error,RMSE)、平均絕對誤差(Mean Absolute Error,MAE)、平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE),以上幾種評估結(jié)果的數(shù)值范圍均為[0,+∞),且結(jié)果越小,模型越優(yōu)。表3 給出了關(guān)于上述指標的計算原理和說明。

        表3 氣象回歸問題的評估指標Tab.3 Evaluation metrics for meteorological regression problems

        1.3.3 圖像預(yù)測與檢測識別

        氣象有關(guān)的時空序列問題也通常包含圖片的數(shù)據(jù)格式,例如在視頻幀預(yù)測、根據(jù)雷達回波圖進行降水預(yù)測或者根據(jù)溫度位勢圖檢測熱帶氣旋以識別極端天氣模式時,通常需要對比評估預(yù)測生成的圖像與真實地理圖像的區(qū)別,客觀的基于數(shù)學原理的評價方法則有助于量化評價的數(shù)值結(jié)果。目前主流的客觀評價方法為通過峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)和結(jié)構(gòu)相似度(Structural SIMilarity,SSIM)評估預(yù)測圖像與真實圖像的差異[22],通過交并比(Intersection of Union,IoU)[23]評估檢測范圍與真實范圍的重疊度。例如,Chen 等[24]使用生 成式對 抗網(wǎng)絡(luò)(Generative Adversarial Network,GAN)解決天氣雷達回波的超分辨率問題,通過PSNR 指標證明了該方法可以取得更好的重建性能;Yuan等[25]也分別通過對比PSNR和SSIM結(jié)果證明了所提出的模型在天氣雷達圖像重建的視覺質(zhì)量方面取得的優(yōu)異性能。

        PSNR 基于統(tǒng)計學原理,通過計算預(yù)測結(jié)果與原始圖像對應(yīng)像素點灰度值之間的差異評估預(yù)測結(jié)果圖片的準確度。公式如下:

        其中:F為結(jié)果圖像,R為原始圖像,圖像的大小為M×N。結(jié)果范圍[0,+∞],結(jié)果越大,模型效果越好。

        PSNR 的原理簡單直觀,但PSNR 僅考慮了圖像像素值的全局統(tǒng)計結(jié)果;而人眼對不同區(qū)域的敏感度是不同的,相較于PSNR,SSIM 更符合人類視覺系統(tǒng)的特點,SSIM 的評估對象由亮度、對比度和結(jié)構(gòu)這3 個方面組成,可以避免PSNR 的局限性。

        在計算亮度相似度時,SSIM 使用亮度的均值來度量兩幅圖像的亮度差異;在計算對比度相似度時,SSIM 使用標準差來度量兩幅圖像的對比度差異;在計算結(jié)構(gòu)相似度時,SSIM 使用亮度和對比度信息的相關(guān)性來度量兩幅圖像的結(jié)構(gòu)差異。

        若使用x和y表示需要計算相似度的兩幅圖像,則SSIM的具體公式可以表示為:

        其中:l(x,y)表示亮度相似度,c(x,y)表示對比度相似度,s(x,y)表示結(jié)構(gòu)相似度,α、β和γ是3 個非負的加權(quán)系數(shù),滿足α+β+γ=1。

        亮度相似度可以用式(3)進行計算:

        其中:μx、μy分別表示兩幅圖的亮度均值。

        對比度相似度可以用式(4)進行計算:

        其中:σx、σy分別表示兩幅圖的亮度標準差。

        結(jié)構(gòu)相似度可以用式(5)進行計算:

        其中σxy表示兩幅圖的亮度協(xié)方差。

        式(3)~(5)中的c1、c2和c3均為常數(shù),用于避免分母為0或者噪聲過大的情況,取值需要根據(jù)具體應(yīng)用進行調(diào)整。

        另一個在處理氣象領(lǐng)域的異常天氣檢測(例如氣旋檢測等)問題上廣泛應(yīng)用的評價指標為交并比(IoU)。例如在檢測熱帶氣旋時,不僅要識別氣旋中心,同時也要定位整個熱帶氣旋的發(fā)生和影響范圍。定位精度評價指標IoU 定義了兩個邊界框的重疊度,如圖3 所示。

        圖3 IoU示意圖Fig.3 Schematic diagram of IoU

        矩形框A、B的一個重合度IoU 計算公式為:

        即矩形框A、B的重疊面積占A、B并集的面積比例,其中SI、SA、SB分別表示I、A、B三個部分的面積:

        實際上,除了上述PSNR 和SSIM 此類常用的有參考的圖像質(zhì)量評價方法之外,由于天氣預(yù)報領(lǐng)域數(shù)據(jù)來自傳感器收集的局限性,數(shù)據(jù)圖片常伴隨有缺失值和模糊噪聲,因此Doukari 等[26]針對無人機/傳感器等獲取的天氣預(yù)報數(shù)據(jù)(即風速、云量、降水概率等)進行關(guān)于圖像去噪去霧等方面的研究,并使用BRISQUE(Blind/Referenceless Image Spatial QUality Evaluator)[27-29]、RankIQA(Rankings for no-reference Image Quality Assessment)[30]等無參考圖像質(zhì)量評估方法[31]進行定量評估。目前尚未有直接將此類方法應(yīng)用于天氣預(yù)報結(jié)果評估的研究,但由于氣象圖像變化復(fù)雜性,無法獲取原始可參考圖像,因此在后續(xù)研究中可以綜合考慮無參考圖像的質(zhì)量評價方法應(yīng)用于天氣圖像預(yù)報的評價。

        表4 總結(jié)了天氣預(yù)報領(lǐng)域問題的經(jīng)典案例中所使用的深度學習模型及其評估模型性能時所用到的評價指標。

        表4 天氣預(yù)報問題和對應(yīng)評價指標Tab.4 Weather forecasting problems and corresponding evaluation metrics

        2 深度學習在天氣預(yù)報領(lǐng)域的應(yīng)用現(xiàn)狀

        天氣預(yù)報領(lǐng)域問題可以分為天氣現(xiàn)象分類問題、天氣要素預(yù)測問題、極端與異常天氣模式檢測與識別這3 個方面,分別總結(jié)深度學習在各個方面的應(yīng)用如下。

        2.1 天氣現(xiàn)象分類問題

        近年來,基于計算機視覺和深度學習的天氣自動分類研究引來廣泛關(guān)注。Yildirim 等[32]使用了深度學習、支持向量機(Support Vector Machine,SVM)分類器和最大相關(guān)最小冗余算法(minimum Redundancy-Maximum Relevance,mRMR)特征選擇的混合方法,對陰天、霧天、雨天、陽光和日出這5個類別的天氣狀況分類;Xie 等[33]首次嘗試將天氣分類視為一項無監(jiān)督任務(wù),即從沒有標簽的單個圖像中分類天氣狀況;Mishra 等[34]在使用圖像數(shù)據(jù)實現(xiàn)天氣分類的同時,還比較分析了機器學習分類技術(shù),證明基于深度學習的卷積神經(jīng)網(wǎng)絡(luò)明顯優(yōu)于傳統(tǒng)機器學習方法;此外,經(jīng)典的以GoogleNet及其衍生網(wǎng)絡(luò)為基礎(chǔ)的神經(jīng)網(wǎng)絡(luò)框架[35-36]也已經(jīng)被用于天氣現(xiàn)象分類任務(wù),并且獲得了高達92%的分類準確率。

        吳昆等[37]提出了一種基于3D-CNN 與LSTM 融合的混合模型預(yù)測短臨降水。將歷史數(shù)據(jù)按時序輸入卷積模塊中提取特征,然后將提取的高階特征信息輸入LSTM 模塊預(yù)測降水量,并通過大量實驗優(yōu)化模型的網(wǎng)絡(luò)參數(shù),解決了過擬合和特征學習不充分的問題。

        天氣預(yù)報領(lǐng)域的分類問題也存在需要依賴檢測技術(shù)的應(yīng)用[38],例如,極端氣象分析工具包(the Toolkit for Extreme Climate Analysis,TECA)[39]是使用啟發(fā)式方法對氣象數(shù)據(jù)進行大規(guī)模模式檢測的應(yīng)用?;赥ECA 分析的輸出,Liu等[40]利用深度卷積網(wǎng)絡(luò)預(yù)測兩種極端天氣事件類型的分類標簽,通過考慮從二維多通道圖像中對中心、裁剪的斑塊進行二元分類任務(wù)。

        另外,Zhou 等[41]開發(fā)了基于數(shù)值天氣預(yù)報數(shù)據(jù)的強對流天氣深度學習預(yù)測解決方案,包括對短時大雨、冰雹、對流陣風和雷暴的檢測與分類。劉新偉等[42]基于LightGBM(Light Gradient Boosting Machine)算法,利用甘肅3 個地區(qū)的雷達回波和地面觀測數(shù)據(jù),對3 類極端天氣狀況(冰雹、雷暴大風、短時強降雨)分類,實驗得到的整體誤判率僅為4.9%。

        2.2 天氣要素預(yù)測問題

        Shi 等[19]提出一種用于降水實時預(yù)報的ConvLSTM,該網(wǎng)絡(luò)在輸入到狀態(tài)和狀態(tài)到狀態(tài)的轉(zhuǎn)換中都具有卷積結(jié)構(gòu),由編碼網(wǎng)絡(luò)和預(yù)測網(wǎng)絡(luò)組成。與全連通LSTM 相比,ConvLSTM的編碼部分對氣象數(shù)據(jù)的時空關(guān)系進行了編碼,有助于提高預(yù)報精度;然而,ConvLSTM 的卷積遞歸結(jié)構(gòu)是位置不變的。為了研究一個更一般的預(yù)測框架,Wang 等[43]提出了PredRNN(Predictive RNN),在遞歸過程中的相鄰時間步之間增加了額外連接,利用雙存儲器機制在統(tǒng)一的存儲池中同時提取和存儲序列的空間和時間變化。此后,Wang 等[44]又提出了PredRNN++來解決深層時間結(jié)構(gòu)和消失梯度之間的時空預(yù)測學習問題,并將PredRNN 及其變體成功地推廣到了降水實況預(yù)報[45]。

        針對通過雷達回波圖預(yù)測降水的問題,Zamo 等[46]將它歸結(jié)為輸入和預(yù)測目標都是圖像序列的視頻預(yù)測問題,將LSTM 與卷積編解碼網(wǎng)絡(luò)(U-Net)結(jié)合以捕捉時空相關(guān)性,獲得了有意義的預(yù)測結(jié)果。黃興友等[47]針對傳統(tǒng)雷達回波外推方法中存在資料信息利用率不足和外推時效有限的問題,通過利用預(yù)測神經(jīng)網(wǎng)絡(luò)模型進行2 h 以內(nèi)的回波變化預(yù)報分析結(jié)果,發(fā)現(xiàn)預(yù)測神經(jīng)網(wǎng)絡(luò)對強回波的預(yù)報能力高于光流法,且在預(yù)報時效性和準確性上更好。Li 等[48]基于互信息(Mutual Information,MI)特征提取方法和不平衡數(shù)據(jù)采樣方法(Adaptive Synthetic Sampling),構(gòu)建了自適應(yīng)合成和互信息提取矩陣(Adaptive Synthesis and Mutual Information extraction Matrix,ASMI-M),并通過一種基于深度學習的卷積神經(jīng)網(wǎng)絡(luò)和長短期記憶(CNN-Long Short-Term Memory,CNN-LSTM)模型預(yù)測蘭州市3 h 內(nèi)的降水量,得到了更好的預(yù)測性能。Gorooh 等[49]開發(fā)了一種名為深度神經(jīng)網(wǎng)絡(luò)高時空分辨率降水估計(Deep neural network high SpatioTemporal resolution Precipitation Estimation,Deep-STEP)的CNN 算法,能可靠地檢索高空間分辨率的地表降水。

        針對其他天氣要素的預(yù)測問題,馬景奕等[50]通過神經(jīng)網(wǎng)絡(luò)的前向訓練、長短時記憶反饋學習,經(jīng)過多隱藏層的自主訓練,對溫度、風速、風向和壓力等6 項氣象信息實現(xiàn)準確預(yù)測;對于更為特殊的海表面溫度預(yù)測問題,張雪薇等[51]采用卷積門控循環(huán)單元(Convolutional Gated Recurrent Unit,ConvGRU)深度學習神經(jīng)網(wǎng)絡(luò)模型,分析研究了西北太平洋部分海域的海表面溫度預(yù)測,預(yù)測準確率達到99.64%。

        考慮風速屬性和時空相關(guān)性的預(yù)測建模同樣對人類生產(chǎn)(例如風電并網(wǎng))有著較大的影響。潘超等[52]通過CNN 降維風速信息并提取空間特征,再由雙層記憶神經(jīng)網(wǎng)絡(luò)進行多位置多步超短期預(yù)測,實現(xiàn)了對實際風電場的風速預(yù)測。修春波等[53]也針對風速預(yù)測問題設(shè)計了由多個LSTM 和卷積網(wǎng)絡(luò)組成的預(yù)測模型,并利用誤差動態(tài)補償方法校正預(yù)測值;Li 等[54]提出了一種混合時空注意網(wǎng)絡(luò)和多層感知器的集成模型(Ensemble of Spatial-Temporal Attention Network and Multi-Layer Perceptron,E-STAN-MLP)同時預(yù)測風速和風向,模型主要由一個時空注意遞歸神經(jīng)網(wǎng)絡(luò)和一個多層感知器結(jié)構(gòu)組成,實驗結(jié)果證明E-STAN-MLP 模式在風速與風向方面獲得了比NWP 更好的效果。

        2.3 極端與異常天氣模式檢測與識別

        極端天氣(如臺風、強降水、雷暴等)探測對于自然災(zāi)害管理、防災(zāi)和應(yīng)急決策至關(guān)重要。數(shù)據(jù)驅(qū)動的數(shù)值預(yù)報方法可以在接收到新數(shù)據(jù)后的幾分鐘內(nèi)提供預(yù)報,比傳統(tǒng)的理論驅(qū)動的數(shù)值預(yù)報方法更適合高響應(yīng)性預(yù)報服務(wù)。另一方面,有監(jiān)督和半監(jiān)督的深度學習方法能夠突破傳統(tǒng)基于閾值的檢測方法的局限性。

        Wang 等[55]提出了一種將自動氣象站數(shù)據(jù)和單極化S 波段雷達數(shù)據(jù)與圖形模型和隨機森林耦合的算法用于短期強降水檢測預(yù)警,以2015—2016 年華北地區(qū)的數(shù)據(jù)實現(xiàn)了79.2%的檢測概率(POD)和68.3%的關(guān)鍵成功指數(shù)(CSI)。Peterson 等[56]為GOES 地球靜止閃電測 繪儀(Geostationary Lightning Mapper,GLM)觀測開發(fā)了一種根據(jù)閃電數(shù)據(jù)中與非對流電荷結(jié)構(gòu)的相互作用特征識別雷暴中對流/非對流區(qū)域的算法,并通過提供與閃電物理學相關(guān)的當代評估補充其他云型檢索。針對高原地區(qū)數(shù)值預(yù)測法建模復(fù)雜、雷達回波外推法易產(chǎn)生累積誤差且模型參數(shù)難以設(shè)置的問題,張永宏等[57]針對小目標和非平衡數(shù)據(jù)集,提出了一種基于改進DeepLab v3 網(wǎng)絡(luò)模型的西藏地區(qū)降雨云團的分割方法,可以更準確地分割降雨云團,為降雨云團監(jiān)測預(yù)警提供參考。

        為了解決熱帶氣旋、溫帶氣旋、熱帶低壓和大氣流等極端天氣的多類檢測和定位問題,Mudigonda 等[58]提出了一種三維(高度、寬度、時間)多通道時空卷積編碼解碼器,首次將深度自編碼架構(gòu)應(yīng)用于邊界盒回歸的半監(jiān)督學習,通過對未標記數(shù)據(jù)重構(gòu)訓練,有效地克服了氣象數(shù)據(jù)集標記的困難。Tong 等[59]提出了一種基于深度卷積神經(jīng)網(wǎng)絡(luò)技術(shù)識別熱帶氣旋的方法,在西北太平洋盆地200 多個熱帶氣旋的測試數(shù)據(jù)中,達到96%的識別準確率。耿逍懿等[60]提出了一種以LSTM 為基礎(chǔ)構(gòu)架的熱帶氣旋路徑集成預(yù)報方法,集成直接預(yù)報和通過路徑間接預(yù)報的結(jié)果進行綜合預(yù)報,并通過實驗驗證了所提出的方向預(yù)報因子、集成方法在熱帶氣旋路徑預(yù)報問題中的有效性。同樣在預(yù)測熱帶氣旋軌跡和強度的問題方面,Na 等[61]提出了一種用于預(yù)測西北太平洋盆地的遞歸神經(jīng)網(wǎng)絡(luò)模型——熱帶氣旋預(yù)測的水庫計算,用于預(yù)測熱帶氣旋的4 個屬性,即緯度、經(jīng)度、最大持續(xù)風速和最小海平面水平壓力。

        為減輕臺風可能造成的巨大生命財產(chǎn)損失,Chen 等[62]提出了一個CNN-LSTM 混合模型,用于預(yù)測臺風的形成和強度。考慮到臺風是一個受多個相關(guān)氣象屬性影響的強對流天氣過程,作者設(shè)計了一個由3 個部分組成的混合模型:使用一個2D-CNN 從前一個特征圖的局部鄰域中提取特征,并將它分為3 個部分用于分析二維海面變量;使用一個帶三維濾波器的CNN,用于捕捉三維大氣變量(如風和氣壓)之間的空間相關(guān)性;使用一個LSTM 用于捕捉時間相關(guān)性。該混合模式的預(yù)報效果優(yōu)于以往的臺風預(yù)報方法,包括臺風的形成和強度。錢奇峰等[63]以ResNet 模型為基礎(chǔ),在預(yù)訓練后應(yīng)用遷移學習技術(shù),以西北太平洋和南海臺風的衛(wèi)星云圖為樣本,設(shè)計了一種自動且客觀的臺風強度估測技術(shù)。陳睿[64]提出了一種基于深度學習的臺風時空深度混合預(yù)測模型,在24 h 臺風形成預(yù)測實驗中,最高準確率為85.2%,展現(xiàn)了機器學習在極端天氣中短期預(yù)測中的強大能力。

        3 深度學習與數(shù)值模式結(jié)合預(yù)報最新進展

        在天氣預(yù)報方面,氣象科學家一直致力于通過對物理機制的理解提高預(yù)報的準確性,試圖應(yīng)用數(shù)據(jù)驅(qū)動的計算范式挖掘氣象數(shù)據(jù)元素之間復(fù)雜的時空關(guān)系。因此,將深度學習(Deep Learning)與數(shù)值天氣預(yù)報(NWP)結(jié)合的DLWP(Deep Learning Weather Prediction)已成為研究熱點[65]。圖4 展示了數(shù)值天氣預(yù)報模式與人工智能技術(shù)結(jié)合的整體概念,在預(yù)測前使用深度學習技術(shù)分析參數(shù)不確定性,在預(yù)測過程中融合特征信息進行綜合預(yù)報,并在NWP 模型輸出后對預(yù)測結(jié)果進行偏差訂正。

        圖4 NWP與深度學習結(jié)合的天氣預(yù)測Fig.4 NWP combined with deep learning for weather forecasting

        目前,將數(shù)值模擬與深度學習相結(jié)合的方法有很多,典型的方式有兩種:一是提高DLWP 的解釋能力,二是提高數(shù)值預(yù)報的準確性和時效性。

        DLWP 使數(shù)值模擬和觀測數(shù)據(jù)在多個方面更緊密地結(jié)合,從整個系統(tǒng)建模的角度,有4 個深度學習與數(shù)值模式的結(jié)合方向:1)使用深度學習技術(shù)改進數(shù)值模式物理參數(shù);2)使用深度學習模型替換數(shù)值模式子模塊;3)使用深度學習技術(shù)訂正數(shù)值模式輸出與真實值間可能存在的偏差;4)利用數(shù)值模式輸出的科學先驗知識作為約束條件訓練深度學習模型。

        3.1 用數(shù)值理論知識增強深度學習模型

        經(jīng)典數(shù)值模式由一組原始方程描述,這些方程基于理論物理原理,包括牛頓第二運動定律、質(zhì)量守恒定律、熱力學第一定律、理想氣體定律和靜水力學定律。因此,數(shù)值預(yù)報模式不僅可以同時捕捉多個氣象要素的時空動態(tài),而且可以考慮不同變量之間的相關(guān)性。觀測到的天氣要素的許多重要方面可以通過數(shù)值模式重現(xiàn),但完全由數(shù)據(jù)驅(qū)動的深度學習模型本身難以從觀測數(shù)據(jù)中發(fā)現(xiàn)因果關(guān)系[66],也不能模擬整個復(fù)雜的天氣系統(tǒng),因此將數(shù)值模式輸出的科學先驗知識作為約束條件編碼于模型中,有助于保證模型的物理一致性和可解釋性。

        Frnda 等[67]利用數(shù)值模式的知識訓練深度神經(jīng)網(wǎng)絡(luò),將天氣預(yù)報問題轉(zhuǎn)化為端到端的深度學習問題,并提出一種有效的信息融合機制,從歷史數(shù)據(jù)中學習包含NWP 先驗知識的歷史數(shù)據(jù),可以預(yù)報多種氣象變量。Zhuo 等[68]提出了一種名為DeepTCNet 的深度學習方法,該方法由熱帶氣旋的先驗知識增強,在性能上超越了多平臺熱帶氣旋表面風分析技術(shù)(Multiplatform Tropical Cyclone Surface Wind Analysis,MTCSWA),在風半徑估計方面平均提高了32%。Chen 等[69]基于物理的深度學習框架中提出了一種名為PGnet 的溫度預(yù)測方法,其中生成神經(jīng)網(wǎng)絡(luò)部分將掩碼作為精細預(yù)測的先驗,并通過掩碼損失和跳躍模式策略訓練生成神經(jīng)網(wǎng)絡(luò),避免時間序列預(yù)測期間的誤差累積,從而更精確地預(yù)測溫度。

        3.2 通過深度學習改進數(shù)值模式

        隨著氣象數(shù)據(jù)量的快速增長和模型分辨率的不斷提高,數(shù)值預(yù)報的計算需求急劇增加,導(dǎo)致數(shù)值預(yù)報效率低下。深度學習模型可以“學習”系統(tǒng)的復(fù)雜行為并快速建模,避免了求解復(fù)雜的偏微分方程,同時對于傳統(tǒng)預(yù)報方法難以預(yù)測的突發(fā)性天氣現(xiàn)象,深度學習與數(shù)值模式結(jié)合預(yù)報可以更及時準確地得到預(yù)測結(jié)果[70]。而經(jīng)過歷史觀測數(shù)據(jù)或模式模擬運行輸出數(shù)據(jù)訓練后的深度學習模型,也可以直接用于模擬數(shù)值天氣模式的一個模塊或過程,同樣可以提高混合模型的預(yù)測準確度和預(yù)報及時性。這種通過深度學習技術(shù)改進數(shù)值天氣預(yù)報模式的方式可以從以下3 種途徑進行。

        3.2.1 深度學習方法改進數(shù)值模式參數(shù)化

        理論驅(qū)動的物理數(shù)值模式需要的參數(shù)存在很大的不確定性,且復(fù)雜不易推導(dǎo),而深度學習方法可以學習參數(shù)化,并以最佳方式描述觀察或生成的基本事實。為了提高子網(wǎng)格參數(shù)化的精度,Rasp 等[71]通過學習多尺度模型訓練深度神經(jīng)網(wǎng)絡(luò)表示混合機器學習-物理大氣環(huán)流模型(General Circulation Model,GCM)中的所有大氣子網(wǎng)格過程,使用訓練后的深度學習模型替代GCM 中傳統(tǒng)的子網(wǎng)格參數(shù)化,實驗結(jié)果證明模型整體的預(yù)測過程更快,結(jié)果更準確。在GCM 中模擬具有不同輸出的超參數(shù)化方面,Wang 等[72]設(shè)計了一組具有強非線性擬合能力的殘差深度神經(jīng)網(wǎng)絡(luò)(Residual-Deep Neural Networks,ResDNNs),首次使用基于神經(jīng)網(wǎng)絡(luò)的參數(shù)化在現(xiàn)實世界的地理邊界條件下實現(xiàn)長達十年的穩(wěn)定真實世界氣候模擬,展示了在氣候模擬中使用機器學習參數(shù)化的新興潛力。

        3.2.2 數(shù)值天氣預(yù)報模式輸出結(jié)果的偏差訂正

        雖然近年來數(shù)值模式不斷朝著精細化方向發(fā)展,但是由于它采用理想化數(shù)值假設(shè)模擬混沌大氣系統(tǒng),輸出結(jié)果不可避免地會出現(xiàn)偏差,因此可以通過深度學習技術(shù)快速、準確地識別和校正偏差。Peng 等[73]提出模式距平積分預(yù)報訂正方法(Anomaly Numerical-correction with Observations,ANO),通過計算多年的平均氣候態(tài)訂正數(shù)值模式系統(tǒng)性誤差,這是早期經(jīng)典的偏差訂正方法之一。在此基準訂正方法之上,Han 等[74]使用基于U-Net 改進的CU-Net 模型,針對ECMWF(European Centre for Medium-range Weather Forecasts)的偏差訂正,訂正效果相較于傳統(tǒng)的 ANO 有較大提升。張延彪等[75]通過引入稠密卷積優(yōu)化CU-Net 模型,又融合多種氣象要素和地形特征信息構(gòu)建了Fuse-CUnet,最終進行了不同模型的偏差訂正實驗和對比分析。

        Sayeed 等[76]研究了使用計算高效的CNN 作為改進中尺度天氣研究和預(yù)報(Weather Research and Forecasting,WRF)一日模擬的輸出,對 2018 年全年 WRF 模型計算的幾個氣象參數(shù)進行了偏差校正,在模擬地表風速和風向、降水、相對濕度、地表壓力、露點溫度時減小了這些偏差。為了對所生成多步預(yù)測結(jié)果進行偏差校正,Sha 等[77]將模擬集成(Analog Ensemble,AnEn)和CNN 結(jié)合,提出了名為AnEn-CNN 的集合降水預(yù)報后處理方法,可生成長達7 d 的經(jīng)過概率校準和物理現(xiàn)實的網(wǎng)格化降水預(yù)報序列。

        在總結(jié)評估偏差訂正模型方面,Wang 等[78]使用GCM 每日平均、最高和最低溫度在CMIP6(Coupled Model Intercomparison Project phase 6)中全面評估了用于氣候降尺度和偏差校正的超分辨率深度殘差網(wǎng)絡(luò)(Super Resolution Deep Residual Network,SRDRN)深度學習模型。為了基于本地數(shù)據(jù)同化和預(yù)測系統(tǒng)進行總結(jié)評估,Cho 等[79]比較了各種單獨的后處理模型——多線性回歸、支持向量回歸、門控循環(huán)單元和卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)化效果,并提出了多模型集成方法,得到了比單個模型更可靠、更穩(wěn)健的結(jié)果。

        3.2.3 利用深度學習模擬數(shù)值模式的物理過程或動力框架

        如果數(shù)值模式子模塊的函數(shù)形式理論基礎(chǔ)不足,可以使用足夠數(shù)量的觀察值訓練機器學習模型替換原子模塊。例如,Scher 等[80]設(shè)計了一個直接利用端到端的深層卷積神經(jīng)網(wǎng)絡(luò)完全模擬并替代GCM,神經(jīng)網(wǎng)絡(luò)以GCM 的完整模型狀態(tài)為輸入,學習仿真其動力學框架并預(yù)測下一個模型狀態(tài),結(jié)果證實了該模型可以在保證預(yù)報準確率的情況下有效提高計算效率。類似地,De Bézenac 等[81]使用深度學習模型有效地模擬海洋中的水的運動并預(yù)測海面溫度(Sea Surface Temperature,SST)。在此基礎(chǔ)上,Weber 等[82]探討了 用CanESM2(Canadian Earth System Model2)模擬的1pctCO2(二氧化碳濃度每年增加1%)運行97 年的輸出訓練的卷積神經(jīng)網(wǎng)絡(luò),作為降水場替代模型的應(yīng)用,這種替代后的混合模型即使在預(yù)測長度延長至120 個月時,性能也沒有顯著下降。

        4 現(xiàn)存挑戰(zhàn)與未來工作展望

        盡管深度學習模型已經(jīng)通過各種方式被廣泛應(yīng)用于天氣預(yù)報的研究中,但是由于氣象數(shù)據(jù)本身復(fù)雜度高、數(shù)據(jù)量大和格式多樣的特點,用于時空數(shù)據(jù)的預(yù)測問題的深度學習模型仍然面臨挑戰(zhàn),例如高緯度多通道的天氣數(shù)據(jù)帶來的龐大的算力需求、深度學習模型本身的可解釋性、以及觀測數(shù)據(jù)自身的復(fù)雜和不確定性。目前針對這些挑戰(zhàn)的解決方案,也已經(jīng)有了一定的研究進展。

        4.1 龐大的算力需求

        天氣預(yù)報這類科學問題的高計算成本一直是一個巨大的技術(shù)挑戰(zhàn),氣象機構(gòu)每天都必須以幾乎實時的方式處理萬億字節(jié),通常精度也非常高,因此在深度學習模型上應(yīng)用并行技術(shù)已成為一種必然趨勢。模型在訓練時可能被挖掘的并行性能也應(yīng)是深度學習應(yīng)用于天氣預(yù)報領(lǐng)域需要考慮的問題,而對于深度學習模型本身的計算性能提升也已經(jīng)有了一定的研究基礎(chǔ)。

        使用CUDA(Compute Unified Device Architecture)利用GPU 強大的并行計算能力處理深度網(wǎng)絡(luò)的這個思想最早在ResNeXt[83]中被提 出。Huang 等[84]將分組 思想應(yīng)用于DenseNet,提出了優(yōu)化后的CondenseNet。后續(xù)也有不少研究者指出傳統(tǒng)的組卷積存在需要手動設(shè)置組數(shù)、分組方式不確定等不足,并提出了針對這些問題的優(yōu)化方法[85-86]。

        上述研究都證實了CNN 的可并行性,但是幾乎所有的序列預(yù)測問題上都有良好表現(xiàn)的RNN 在每個時間步上的計算結(jié)果之間都存在依賴關(guān)系,意味著所有基于LSTM 的模型都難以直接并行。因此,解決問題的主要思路就是拋開RNN 作序列建模。

        例如,Transformer[87]充分利用了注意力機制,在編碼器的內(nèi)部使用自注意力與前饋神經(jīng)網(wǎng)絡(luò)聯(lián)合建模進行訓練,在編碼器和解碼器連接處使用注意力機制作映射,最終達到了優(yōu)于RNN 的效果。Bai 等[88]以加入殘差塊的CNN 為基礎(chǔ),首次提出了一種時域卷積網(wǎng)絡(luò)(Temporal Convolutional Network,TCN)。TCN 的卷積層結(jié)合了因果卷積與空洞卷積,其中因果卷積保證了前面時間步的預(yù)測不會使用未來步的信息,空洞卷積則可以在不做池化的情況下迅速擴大感受野(Receptive Field)。隨后,Yan 等[89]發(fā)表了有關(guān)TCN 用于天氣預(yù)報任務(wù)的研究成果,通過TCN 和LSTM 的對比實驗,證實TCN 在計算效率和預(yù)測準確度上都表現(xiàn)良好。近期,Hewage 等[90]進一步提出具有LSTM 和TCN 層的深度學習網(wǎng)絡(luò),在多輸入多輸出和多輸入單輸出兩種不同的回歸分析中進行了評估,并表明與復(fù)雜WRF 模式相比,這種輕量級天氣預(yù)報模式也可以擁有很好的預(yù)報效果。

        4.2 深度學習模型的“黑箱”問題

        提升預(yù)測準確度的同時將結(jié)果可視化供人類分析的可解釋性也是至關(guān)重要的,而深度學習模型的可解釋性被認為是它的一個潛在弱點[91]。鑒于氣象科學問題的復(fù)雜性,研究人員在實踐中很難獲得模型訓練過程中的假設(shè),因此也限制了模型的可解釋性。深度學習技術(shù)可以通過建立更復(fù)雜的函數(shù)擬合觀測值,但是觀測數(shù)據(jù)的偏差和訓練過程中的誤差都是不可避免的,所以預(yù)測結(jié)果也可能出現(xiàn)與物理理論不一致或結(jié)果不可信的情況[9]。通過對深度學習模型進行特征分析與可解釋研究,不僅有助于人們理解模型的推理過程以便于更有針對性地優(yōu)化預(yù)報模型,同時還有助于提取有效的科學信息以更好地理解地球系統(tǒng)。

        目前已經(jīng)有不少研究者開始探索利用“可解釋人工智能”解決機器學習和深度學習在氣象領(lǐng)域的可解釋性問題。Manandhar 等[92]通過特征選擇方法找到對降水具有較大影響的特征,并基于這些特征優(yōu)化機器學習方法,在降水量預(yù)測上有效降低虛警率。Gagne 等[93]使用CNN 基于上層空氣動力場和熱力場進行冰雹預(yù)測,并通過對CNN 特征重要性的解釋與分析綜合了對冰雹生成過程的理解,最終實驗結(jié)果證明模型預(yù)測結(jié)果優(yōu)于其他模型。Toms 等[94]優(yōu)化了特征可視化和層間相關(guān)傳播(Layer-wise Relevance Propagation,LRP)方法,并分析探討了厄爾尼諾現(xiàn)象季節(jié)性預(yù)報相關(guān)的可解釋性問題。Yuan 等[95]提出了一種基于雙因素注意力機制的預(yù)報模型,從時間信息和先驗知識這兩個方面學習訓練注意力權(quán)重,并在公共天氣預(yù)報數(shù)據(jù)集上得到了更高的預(yù)報精度。

        4.3 復(fù)雜且不確定的數(shù)據(jù)

        雖然各種傳感技術(shù)的發(fā)展能夠收集并保存大量可供學習的地球數(shù)據(jù),但是不同的傳感器觀測獲得并轉(zhuǎn)化生產(chǎn)的數(shù)據(jù)圖片形狀和統(tǒng)計信息的內(nèi)容和物理意義都不同,并且觀測數(shù)據(jù)也不可避免地伴隨著各種噪聲、不確定性和缺失;因此集成處理、消納利用這些數(shù)據(jù)且是一個非常大的挑戰(zhàn),而且在這個過程中往往需要采用復(fù)雜和不確定的數(shù)據(jù)機器學習方法。Chakraborty 等[96]通過研究NCEP/NCAR、MERRA-2和ERA5這幾種全球再分析數(shù)據(jù)集,發(fā)現(xiàn)它們的月平均入射輻射都存在不同程度的低估,散射輻射同時存在被低估或高估的情況,并通過實驗證明隨機森林方法可在一定程度上改善這一誤差。

        此外,集成多傳感器數(shù)據(jù)在天氣預(yù)報領(lǐng)域也是一項挑戰(zhàn),因為從不同的傳感器獲取的內(nèi)容和信息不同,統(tǒng)計數(shù)據(jù)的空間和時間分辨率和物理意義也不同。不過資料同化技術(shù)已經(jīng)發(fā)展多年,目前已有逐步訂正、最優(yōu)插值和卡爾曼濾波等較為基礎(chǔ)的同化技術(shù)。Peyron 等[97]將深度學習方法整合到數(shù)據(jù)同化框架中,利用自動編碼器提供的潛在結(jié)構(gòu)設(shè)計潛在空間中具有模型誤差的集成變換卡爾曼濾波器(Ensemble Transform Kalman Filter,ETKF),這種新穎的算法可以準確地表示觀察的動態(tài),既降低了計算成本,又提供了比ETKF-Q 等先進算法更好的準確性。Wang 等[98]則通過使用正壓渦量方程展示深度學習增強數(shù)據(jù)同化的潛力,通過以粗略的“預(yù)測”分辨率訓練具有長時間模擬的卷積自動編碼器,將空間上不完整的觀察映射到具有完全空間覆蓋和分辨率的模型狀態(tài),最終得到了令人滿意的重建性能。

        除了以上研究,更具挑戰(zhàn)性的就是如何從深度模型的訓練過程中獲得對地球體統(tǒng)本身的理解,并實現(xiàn)從數(shù)據(jù)中最大限度地學習模型的同時,將物理、生物、氣象和地質(zhì)等原理知識也納入考慮范圍。目前主流的將這些要素綜合考慮的方法是將數(shù)值模式與深度學習結(jié)合建立混合模型。下文總結(jié)了綜合研究可能的研究方向與問題。

        數(shù)據(jù)和模型的選擇與融合 對于同一個氣象任務(wù),可以收集到的數(shù)據(jù)格式和可選擇的深度學習模型都是不唯一的。例如,針對氣象觀測站點的多維數(shù)據(jù),可以將預(yù)測問題的目標數(shù)值直接建模為一個時空序列,使用RNN+CNN 進行預(yù)測;也以可將各個站點建模為圖,融合圖卷積建模。如何正確選擇或者融合深度學習模型和時空數(shù)據(jù)目前還缺乏更深入的研究。

        更綜合的評價標準 很多模型通過堆疊各種現(xiàn)有的時空預(yù)測技術(shù)以得到更好的預(yù)測性能,大部分的文章也通過消融實驗證明了所提模型架構(gòu)的每一部分的有效性;但是重用多種深度學習技術(shù)構(gòu)造的復(fù)雜的深度學習模型同時也會帶來巨大的時間和空間復(fù)雜度。這種用“大量的訓練時間”和“巨大的顯存占用”換取“精度的提升”的平衡是否值得的問題尚且沒有全面的研究,也沒有一個綜合精度與計算性能的評估標準評價模型的綜合性能。

        總之,氣象相關(guān)的地球科學問題需要處理大量、快速增長的數(shù)據(jù),為了能夠更進一步完成更精準的預(yù)測、更科學的建模,并在研究中理解復(fù)雜地球系統(tǒng),研究者需要繼續(xù)探索將融合了時間與空間信息編碼能力的深度學習模型進行優(yōu)化,并考慮與基于過程的物理模式相結(jié)合,以提供更準確、不確定性更小、物理上一致的推斷。

        5 結(jié)語

        本文主要總結(jié)了深度學習在天氣預(yù)報領(lǐng)域的發(fā)展歷程,將天氣預(yù)報問題與其他典型深度學習應(yīng)用問題進行了類比研究,回顧與總結(jié)了天氣預(yù)報領(lǐng)域的深度學習的發(fā)展過程,也對比了深度學習評價指標在天氣預(yù)報領(lǐng)域的融合以及應(yīng)用場景。目前,正在興起且具有一定前景和潛力的基于過程和深度學習模型相結(jié)合的方法尚有許多問題和挑戰(zhàn)等待解決和深入探究。天氣預(yù)報中完全通過數(shù)據(jù)驅(qū)動的機器學習方法短時間內(nèi)不會取代由物理原理構(gòu)建的數(shù)值模式,但卻是對數(shù)值模式的有力補充,并且能夠有效優(yōu)化預(yù)報效率,所以二者間的協(xié)同作用是不可忽略的。對于天氣預(yù)報領(lǐng)域,最終目標是通過混合建模使得模型能夠自適應(yīng)數(shù)據(jù),且遵守物理定律,具有一定的可解釋性。通過綜合分析和總結(jié)研究現(xiàn)狀中存在的不足和空白點,本文最后提出了對未來可行研究方向的展望,旨在為本領(lǐng)域研究者梳理亟待研究的問題并為后續(xù)研究工作提供參考。

        猜你喜歡
        天氣預(yù)報氣象數(shù)值
        氣象
        天氣預(yù)報員
        用固定數(shù)值計算
        氣象樹
        數(shù)值大小比較“招招鮮”
        《內(nèi)蒙古氣象》征稿簡則
        天氣預(yù)報的前世今生
        大國氣象
        中期天氣預(yù)報
        基于Fluent的GTAW數(shù)值模擬
        焊接(2016年2期)2016-02-27 13:01:02
        久久综合色鬼| 大地资源高清在线视频播放 | 国产午夜无码视频免费网站| 亚洲www视频| 久久青青草原一区网站| 国产精品亚洲专区无码不卡| 亚洲午夜精品a片久久www慈禧| 成年女人免费v片| 用力草我小逼视频在线播放| 一本色道久久亚洲加勒比| 亚洲成av人影院| 伊人久久成人成综合网222| 亚洲中文字幕无码不卡电影| av一区二区在线网站| 粗大的内捧猛烈进出小视频| 女人夜夜春高潮爽a∨片传媒| av天堂线上| 国产高潮迭起久久av| 亚洲日韩欧美一区、二区| 色欲aⅴ亚洲情无码av蜜桃| A亚洲VA欧美VA国产综合| 精品成人av人一区二区三区| 国产无夜激无码av毛片| 精品人体无码一区二区三区 | 亚洲一区有码在线观看| 国产极品美女高潮无套| 亚洲色大成网站www久久九| 午夜精品一区二区三区无码不卡| 日本高清一区二区三区不卡| 最美女人体内射精一区二区 | 国产中文制服丝袜另类| 亚洲精品99久91在线| 亚洲丁香婷婷久久一区二区| 97久久香蕉国产线看观看| 老熟女熟妇嗷嗷叫91| 黑丝美腿国产在线观看| 亚洲国产精品久久电影欧美| 色窝窝在线无码中文| 亚洲春色视频在线观看| 日韩精品亚洲一区二区| 国产免费无码一区二区三区|