趙玉娟,李宗飛,陳凱華,王 彥,朱男男,李祥海,姜罕盛
(1.天津市氣象信息中心,天津 300074;2.天津市人工影響天氣辦公室,天津 300074;3.天津海洋中心氣象臺,天津 300074)
臨近預報通常指未來0~2 h的天氣預報。強對流天氣包括雷雨大風、冰雹等天氣,因其歷時短、破壞性強、演變規(guī)律復雜,是臨近預報的重點和難點。海洋強對流天氣臨近預報在海洋氣象災害防御中具有重要地位。海上大風及其引發(fā)的次生災害是導致海洋氣象災害的主要因素。為了提升海上大風等海上強對流天氣預報能力,氣象工作者持續(xù)在開展大風天氣特征及預報方法等方面的探索。多普勒天氣雷達是氣象部門用于大氣監(jiān)測的重要設備,能夠提供高時空分辨率的精細監(jiān)測產(chǎn)品,在災害性、突發(fā)性天氣監(jiān)測預警中是極為重要的參考指標,因此,許多學者開展了分析雷達回波在雷暴大風天氣條件下特征的研究,為相關領域天氣預報能力提升提供支撐。王彥等[1]利用天津地區(qū)46次雷暴大風過程統(tǒng)計分析了雷達回波在雷暴大風天氣過程下的特征,得出了影響渤海西部的雷暴大風在雷達回波形態(tài)方面有弓狀、帶狀、陣風鋒等四種類型,弓狀回波對應的雷暴大風天氣最強烈等結論;郭慶利等[2]通過對煙臺北部沿海5年的雷雨大風天氣個例分析,得到了渤海海峽雷雨大風天氣下雷達反射率因子的回波強度多在45 dbz以上,形狀大致分帶狀、弓形等5類的結論。郭鴻鳴等[3]綜合運用6部天氣雷達拼圖、WRF模式物理場等資料分析了強對流系統(tǒng)入海前后的時空變化規(guī)律。王亞南等[4]利用海島、平臺、浮標等站點加密觀測資料,分析了渤海西部雷雨大風的統(tǒng)計特征。陳明軒等[5]、俞小鼎等[6]、程叢蘭[7]等則論述了強對流天氣臨近預報方法。
雷達回波外推結果是臨近預報主要參考數(shù)據(jù)之一。如何快速、準確地生成雷達回波預測數(shù)據(jù)是近年來氣象領域研究熱點之一。傳統(tǒng)雷達外推方法包括交叉相關法(COTREC)[8]、光流法等[9-10]。交叉相關法和光流法均是假定雷達反射率因子的運動符合拉格朗日守恒規(guī)律,在穩(wěn)定性降水預報中效果較好[11],但對于局地強對流天氣,因雷達回波演變快,不滿足守恒條件,預報效果則會隨著時間快速下降[12-13]。
探索雷達回波外推新方法,高效、準確地生成雷達回波預測數(shù)據(jù),對提升海上強對流天氣臨近預報和服務能力具有重要意義。深度學習算法可自動學習海量數(shù)據(jù)中蘊含規(guī)律,且無需較多先驗知識,因此在氣象領域應用日益廣泛,諸多學者開展了相關方法在短臨天氣預報方面研究。郭尚瓚等[14]開展了多層感知器在短時降雨預測方面的探索。Shi等[15]利用帶卷積的長短時記憶單元構建RNN,將其在雷達外推預報方面應用取得了較好效果。施恩[16]提出了基于輸入的動態(tài)卷積神經(jīng)網(wǎng)絡模型,卷積核含有當前輸入的特征,網(wǎng)絡模型測試期間還可基于輸入圖像變化,輸入、輸出圖像的強相關性得到保證,利用南京、杭州、廈門三地雷達CAPPI圖像數(shù)據(jù)作為樣本試驗的結果表明,所提方法較傳統(tǒng)雷達回波外推方法,預測圖像準確率和外推時效均有所提高。郭瀚陽[17]等借助基于自編碼的卷積GRU網(wǎng)絡,利用雷達拼圖數(shù)據(jù)訓練得到了可利用歷史0.5 h數(shù)據(jù)預測未來1 h回波的雷達回波外推模型。試驗結果證明其所提方法在預測精度上明顯優(yōu)于傳統(tǒng)方法。黃興友[18]等采用Causal-LSTM單元構建神經(jīng)網(wǎng)絡模型實現(xiàn)雷達回波外推,并使用帶權重的損失函數(shù)進行模型訓練,測試集及個例檢驗表明其構建的模型在強回波預報方面優(yōu)于光流法。
目前基于深度學習的雷達回波外推研究多面向降水預報,針對海上大風天氣的研究較少。本研究面向海上大風臨近預報需求選取雷達數(shù)據(jù),并從輸入數(shù)據(jù)格式、損失函數(shù)兩方面進行改進,構建了基于自編碼的ConvLSTM網(wǎng)絡,利用滄州雷達站4年的歷史觀測數(shù)據(jù)對其進行訓練,得到了雷達回波外推模型,可利用近1 h雷達反射率因子數(shù)據(jù)預測未來1 h雷達反射率因子數(shù)據(jù)。測試集及典型天氣個例對模型預測效果進行檢驗的結果表明,改進后模型較傳統(tǒng)ConvLSTM模型在強回波預測方面效果更好。
本研究擬通過學習歷史雷達數(shù)據(jù)時空變化規(guī)律,預測未來雷達回波序列,屬于時間序列預測問題,循環(huán)神經(jīng)網(wǎng)絡在相關領域應用較多。不同于一般神經(jīng)網(wǎng)絡不同層神經(jīng)元節(jié)點互相獨立,循環(huán)神經(jīng)網(wǎng)絡各隱藏層節(jié)點不僅依賴當前輸入,還依賴前一時刻中間狀態(tài),處理新數(shù)據(jù)時,也可記憶歷史計算結果。卷積長短時記憶單元ConvLSTM是應用較廣的循環(huán)神經(jīng)網(wǎng)絡模型之一,通過輸入門、遺忘門及輸出門實現(xiàn)信息流動控制,可防止有價值信息因為預測序列長度的增大而被丟,還能選擇性地實現(xiàn)“更新”和“遺忘”。ConvLSTM工作原理如式(1)~(5)所示,it表示輸入門,ft表示遺忘門,ot表示輸出門,算子(o)表示矩陣對應元素相乘,“*”表示卷積操作,“σ”表示Sigmoid函數(shù),Wx-,Wh-是二維卷積核,輸入X1,…,Xt和單元狀態(tài)C1,…,Ct,隱藏狀態(tài)H1,…,Ht及it、ft、ot均為3維張量。
it=σ(Wxi*Xt+Whi*Ht-1+WciοCt-1+bi)
(1)
ft=σ(Wxf*Xt+Whf*Ht-1+WcfοCt-1+bf)
(2)
Ot=σ(Wxo*Xt+Who*Ht-1+WcoοCt+bo)
(3)
Ct=ftοCt-1+itοtanh(Wxc*Xt+Whc*Ht-1+bc)
(4)
Ht=Otοtanh(Ct)
(5)
循環(huán)神經(jīng)網(wǎng)絡還能作為基本單元構建更復雜網(wǎng)絡。本研究借鑒了郭瀚陽等[17]研究思路,亦采用自編碼模型構建網(wǎng)絡,不同之處在于本文采用基于自編碼的ConvLSTM網(wǎng)絡進行雷達回波序列預測,通過多層堆疊ConvLSTM,增強模型學習能力。自編碼模型包含編碼、解碼兩階段。編碼階段先用最后輸入的隱藏層狀態(tài)代表所有輸入序列信息,再將編碼最后一步隱藏層狀態(tài)用于初始化解碼階段隱藏層的狀態(tài)。解碼階段先用編碼輸入的最后一幀作為第一個輸入得到第一個預測輸出,再用第一個預測輸出作為輸入得到第二個預測輸出,持續(xù)迭代此過程得到所有預測輸出,該方法具備可產(chǎn)生變長預測序列的優(yōu)勢。本研究的編碼和解碼階段均采用三層堆疊ConvLSTM來學習數(shù)據(jù)特征。
不同天氣狀況下,雷達反射率因子強度具有明顯差異。天氣雷達實時觀測到的回波強度是判斷強對流天氣的重要參考數(shù)據(jù)。預報經(jīng)驗和已有對海上強對流大風天氣的雷達回波特征分析研究表明,雷達反射率因子包含較多強回波情況下,發(fā)生海上強對流大風天氣的概率相對更高[19-22],王福俠等[21]利用天氣雷達和自動站資料研究統(tǒng)計2006~2008年河北省中南部地區(qū)28次雷暴大風過程中出現(xiàn)地面大風的262個觀測站上空的雷達回波特征發(fā)現(xiàn),一般雷暴大風的反射率因子都在50 dbz以上,但干對流雷暴大風的反射率因子一般只有40 dbz左右。強回波預測準確與否對預報效果影響更大,提高強回波預測準確率是提升預報效果的關鍵。
ConvLSTM模型常規(guī)采用的是均方差損失函數(shù)MSE,均方差損失函數(shù)先計算真實數(shù)據(jù)與預測數(shù)據(jù)所有對應點誤差平方的總和,再計算其均值,對于不同大小的真實值權重一樣,對于雷達回波數(shù)據(jù)則表現(xiàn)為對不同強度回波的權重一樣。對于雷達回波預測應用而言,希望較大的回波值能夠具有更高的預測準確率,為提升強回波預測能力,本文改進了損失函數(shù),將損失函數(shù)構造為原始MSE損失函數(shù)和加權重的MSE函數(shù)兩部分的組合,兩部分的系數(shù)各為0.5,對于加權重的MSE損失函數(shù),在利用均方差損失函數(shù)計算真實值與預測值差值基礎上增加回波真實值作為權重,強回波的值較大權重會更高,弱回波值較小則權重會更低,從而實現(xiàn)提升強回波預測準確率的目標。改進后損失函數(shù)如式(6)所示,其中pred代表預測值集合,label代表實際觀測值集合,N代表系數(shù),改進后損失函數(shù)在label值較大即觀測值為強回波時將產(chǎn)生更大影響,lossfunction為MSE函數(shù),計算公式如式(7)所示,其中yi代表實際觀測值集合label中的第i個真實觀測值,yip代表第i個觀測值在預測值集合pred中對應的預測值?;诠?6)、(7)可推導得出公式(8),由公式(8)可見,改進后的損失函數(shù)增加了N2yi2作為真實值與預測值差值的權重系數(shù),當預測值與真實值存在差異且真實觀測值較大時,改進后損失函數(shù)計算得出的數(shù)值較改進前更大,因此能夠?qū)崿F(xiàn)增大強回波權重,提升強回波預測效果的目的。
loss=0.5*lossfunction(pred,label)+
0.5*lossfunction(N*label*label,N*pred*label)
(6)
(7)
(8)
氣象部門長期存儲的主要是二進制格式的雷達基數(shù)據(jù),該類數(shù)據(jù)無法直接用于深度學習訓練,已有研究多采用基數(shù)據(jù)生成圖像文件方式作為輸入數(shù)據(jù),而單個圖像文件僅能保存1個仰角的觀測數(shù)據(jù)。天氣雷達是對一定空間范圍內(nèi)降水回波的觀測,一個體掃包含多個仰角觀測數(shù)據(jù)。大氣流體運動變化過程是在三維空間中進行,每個高度層均與其附近高度層有較強相關性[23]。在每個時刻輸入相鄰多個仰角觀測數(shù)據(jù)有助于解決單層雷達回波圖像外推局限性。數(shù)組是在程序設計中,為了處理方便,把具有相同數(shù)據(jù)類型的若干元素按有序的形式組織起來的一種數(shù)據(jù)組織方式,是用于儲存多個相同類型數(shù)據(jù)的集合。每個觀測時次,天氣雷達單個仰角對一定空間范圍的觀測數(shù)據(jù)可抽象為二維數(shù)組,多個仰角的雷達觀測數(shù)據(jù)可抽象為三維數(shù)組,npy文件是Python語言針對多維數(shù)組(Ndarray)的科學計算庫NumPy專用的二進制文件格式,能夠保存任意維度的NumPy數(shù)組,可滿足存儲多仰角雷達觀測數(shù)據(jù)的需求,而且NumPy庫提供了save、load函數(shù)為便捷地將數(shù)組數(shù)據(jù)存儲到npy文件和從npy文件讀取數(shù)組內(nèi)容提供了有力支撐,因此,本文對深度學習模型的雷達輸入數(shù)據(jù)存儲格式進行改進,將同一個觀測時次多個仰角的雷達反射率觀測數(shù)據(jù)定義為(n,x,y)形式的三維數(shù)組進行存儲,n代表觀測仰角個數(shù),x代表經(jīng)度方向的觀測數(shù)據(jù)點個數(shù),y代表緯度方向的觀測數(shù)據(jù)點個數(shù),并利用numpy庫的save函數(shù)將其存儲在同一個npy文件中,N個觀測時次的觀測數(shù)據(jù)轉(zhuǎn)化為N個npy文件存儲,為后續(xù)實現(xiàn)多仰角輸入數(shù)據(jù)訓練打下基礎,實際訓練時可按需靈活提取npy文件中的1個或多仰角的雷達觀測數(shù)據(jù)用于訓練。
深度學習雷達數(shù)據(jù)集構建主要包括雷達數(shù)據(jù)篩選、數(shù)據(jù)預處理、深度學習樣本組構造三個步驟,流程如圖1所示。
圖1 雷達數(shù)據(jù)深度學習數(shù)據(jù)集構建流程
雷達數(shù)據(jù)時段選取強對流大風發(fā)生較多的5~9月。首先使用渤海西部有代表性的地面自動氣象站、海上平臺站逐小時觀測資料,根據(jù)王亞男等[4]提出的指標選取強對流天氣導致的雷暴大風過程,然后依據(jù)大風過程日期挑選雷達數(shù)據(jù)。強對流天氣導致雷暴大風過程選取標準如下:
代表站瞬時風速(或最大風速)≥17 m/s,相應海域出現(xiàn)雷電天氣(為消除系統(tǒng)性大風過程,對于瞬時風速(或最大風速)≥17 m/s且持續(xù)時間大于3小時的過程予以去除)。當多個觀測站在不超過12小時范圍內(nèi)先后監(jiān)測到雷雨大風并受同一天氣系統(tǒng)影響時,記為一次過程。
雷達基數(shù)據(jù)預處理包括數(shù)據(jù)解碼、坐標轉(zhuǎn)換等步驟。CINRAD-SA型多普勒天氣雷達基數(shù)據(jù)文件為二進制格式,存儲的數(shù)據(jù)采用極坐標系,存儲內(nèi)容包括反射率、速度、譜寬等。數(shù)據(jù)解碼步驟負責按照雷達基數(shù)據(jù)文件格式,完成雷達觀測描述信息和反射率觀測數(shù)據(jù)的提取并按不同信息的數(shù)據(jù)類型完成格式轉(zhuǎn)換,坐標轉(zhuǎn)換步驟首先建立極坐標和經(jīng)緯度坐標的對應關系,然后將以極坐標形式存儲的反射率等數(shù)據(jù),投影到經(jīng)緯度坐標系,得到反射率數(shù)據(jù)的格點矩陣。坐標轉(zhuǎn)換步驟中建立極坐標和經(jīng)緯度坐標對應關系的過程如下:雷達觀測徑向剖面圖如圖2所示,∠φ代表雷達觀測仰角,d代表雷達站點與觀測位置的徑向距離。建立以地球中心為原點的三維直角坐標系,雷達站點r的坐標為(x1,y1,z1),雷達觀測任意點位置為p,其在地球表面投影為p’(x2,y2,z2),Δlon,Δlat為投影點與雷達站點的經(jīng)緯度差,觀測點p在地球表面投影p’坐標利用式(9)計算得到。通過式(10),計算得到任意p’位置(lon,lat)的極坐標值(∠A,∠φ,d),其中∠A,d通過計算得到,∠φ為已知值,∠A代表雷達觀測方位角。
圖2 雷達觀測徑向剖面圖
(9)
(10)
坐標轉(zhuǎn)換后單個仰角的觀測數(shù)據(jù)為400*400的格點矩陣,直接用于訓練計算開銷較大,為提高處理效率,本研究對數(shù)據(jù)進行了抽樣處理,提取以雷達站點為中心±2度經(jīng)緯度范圍的格點數(shù)據(jù),抽樣處理后單個仰角觀測數(shù)據(jù)的格點分辨率為100*100,數(shù)據(jù)量降低為抽樣前的1/16。
在特定環(huán)境下,雷達觀測受地物雜波、晴空回波等諸多因素影響,將產(chǎn)生非降水回波干擾。地物雜波已在雷達RPG中進行了處理,為進一步去除無效回波干擾,質(zhì)量控制方面,本研究主要通過去除10 dbz以下晴空回波以保障模型訓練效果。
雷達數(shù)據(jù)因觀測設備故障、維護等原因存在缺測,導致數(shù)據(jù)存在時間間隔不等的問題,為去除時間不連續(xù)數(shù)據(jù),按以下步驟構造觀測數(shù)據(jù)文件時間間隔相同的深度學習數(shù)據(jù)集:
1)針對預處理得到的文件生成其文件名、觀測時間索引信息。
2)利用索引信息,按照時間連續(xù)原則,篩選構造深度學習樣本組。對符合時間連續(xù)性檢查的數(shù)據(jù)文件使用長度為20的滑動窗口以步長為1進行滑動采樣,得到所有樣本組。每組樣本包含20個觀測時間連續(xù)的雷達數(shù)據(jù)文件{x1,x2,x3,…,x10,y1,y2,y3,…,y10},x1到x10為輸入數(shù)據(jù),對應近一小時10個觀測時間的雷達回波,y1到y(tǒng)10為輸出數(shù)據(jù),代表下一小時10個觀測時間的雷達回波,每個文件時間間隔為6 min。
為驗證本文方法有效性,利用Pytorch實現(xiàn)了深度學習模型,按照本研究方法,基于滄州雷達站2016~2019年5~9月觀測數(shù)據(jù),利用Python語言開發(fā)軟件構建了雷達數(shù)據(jù)深度學習數(shù)據(jù)集,構建的訓練集包含10 640個樣本,測試集包含2 000個樣本。激活函數(shù)是深度學習神經(jīng)網(wǎng)絡模型的重要組成部分,旨在使神經(jīng)網(wǎng)絡模型能更好地擬合數(shù)據(jù)分布,輸出更準確的結果,其選擇對神經(jīng)網(wǎng)絡性能、模型收斂速度有很大影響,本研究激活函數(shù)使用LeakyReLU.LeakyReLU是神經(jīng)網(wǎng)絡常用激活函數(shù)ReLU的變體。對于ReLU函數(shù),當輸入x>0時,輸出為x,當輸入x≤0時,輸出始終為0,導致神經(jīng)元不能更新。為了解決ReLU函數(shù)這一問題,在ReLU函數(shù)的負半?yún)^(qū)引入一個非常小的常數(shù)leak,即當x≤0時,輸出為leak*x,使得輸入信息小于0時,信息沒有被完全丟掉,仍有很小的梯度。由于導數(shù)總是不為零,能減少靜默神經(jīng)元的出現(xiàn),允許基于梯度的學習,解決了ReLU函數(shù)進入負區(qū)間后,導致神經(jīng)元不學習的問題。訓練過程采用反向傳播算法計算誤差,網(wǎng)絡參數(shù)利用Adam算法更新,Adam算法本質(zhì)上是帶有動量項的RMSprop,它利用梯度的一階矩估計和二階矩估計動態(tài)調(diào)整每個參數(shù)的學習率,該算法的優(yōu)點主要在于經(jīng)過偏置校正后,每一次迭代學習率都有確定的范圍,參數(shù)比較平穩(wěn),對內(nèi)存需求少,適用于大數(shù)據(jù)集和高維空間。學習率參數(shù)的設置很重要,學習率取值過小會使網(wǎng)絡收斂緩慢,過大則又會使訓練易陷入局部最優(yōu)解。本研究通過引入動量項加快網(wǎng)絡收斂速度,減少震蕩,使網(wǎng)絡訓練不易陷入局部最優(yōu)解。損失函數(shù)采用原始MSE函數(shù)和帶權重的MSE函數(shù)組合的方式,詳見1.2節(jié),實驗過程對比了N設置為2、3、4情況下和輸入數(shù)據(jù)為1個仰角、2個仰角時的模型預測效果,對比結果表明輸入為1個仰角、N=2時預測效果最優(yōu),最終選定的損失函數(shù)參見式(11)。其他訓練參數(shù)如表1所示,初始學習率采用0.000 1,模型的訓練采用批訓練方式,batch_size設置為20。訓練采用早停策略(Early Stop)方式停止以避免過擬合。最大迭代次數(shù)設置為400次,當10次循環(huán)迭代后訓練集精度提高不超過0.000 1,則訓練結束。訓練完成后,模型能夠根據(jù)雷達近1小時10個觀測時次的回波數(shù)據(jù)作為輸入,預測出未來1小時10個時次的雷達回波數(shù)據(jù)。
表1 雷達數(shù)據(jù)深度學習訓練參數(shù)
loss=0.5*lossfunction(pred,label)+
0.5*lossfunction(2*label*label,2*pred*label)
(11)
采用分閾值評估方式對測試集進行檢驗,閾值分別選取15、20、30、40 dbz,預測時長包括0.5 h和1 h,預報時間間隔為6 min,評價指標采用氣象領域常用指標臨界成功指數(shù)(CSI)、命中率(POD)和虛警率(FAR)。通過逐點對比預測值與觀測值,得出各預測點所屬分類(分類標準參見表2),進而計算得出評估指標。a、b、c分別代表預測數(shù)據(jù)命中數(shù)、空報數(shù)和漏報數(shù),評估指標公式如式(12)~(14):
表2 雷達回波像素點分類標準
(12)
(13)
(14)
表3對比了原模型和本文改進模型對于測試集在15、20、30、40 dBz共4個反射率閾值0.5 h和1 h的預測結果。由表3可知,本文改進模型在4個閾值的CSI、POD指標均明顯優(yōu)于改進前,F(xiàn)AR指標在閾值較小時略有增長,但在閾值較高時優(yōu)于改進前。
表3 模型改進前后在測試集檢驗指標
POD指標方面,閾值為30 dbz及以下時,0.5 h、1 h的預測較改進前分別提高了9%~17%和13%~17%;閾值為40 dbz時,0.5 h、1 h的預測分別提高了8%和2%。CSI指標方面,閾值為30 dbz及以下時,0.5 h、1 h的預測較改進前分別提高了4%~12%和7%~10%;閾值為40 dbz時,0.5 h、1 h的預測較改進前分別提高了6%和1%。FAR指標方面,0.5 h的預測較改進前略有增長,1 h的預測在30、40 dbz較改進前降低。0.5 h的預測在閾值為30 dbz及以下時,較改進前增幅不超過6%,閾值為40 dbz的預測和改進前相當;1 h的預測在閾值為20 dbz及以下時,較改進前增幅不超過4%,在閾值為30、40 dbz時的預測較改進前分別降低1%和13%,優(yōu)于改進前。
文獻[21]研究表明,產(chǎn)生雷暴大風的回波主要為弓形回波、帶狀回波和塊狀回波,其中帶狀回波是產(chǎn)生雷暴大風的主要回波。為更直觀分析預測效果,從測試集和非測試集共選取2019年7月29日、2020年05月21日、2022年06月12日3組發(fā)生強對流大風的個例日期進行雷達回波外推分析,通過回波圖像和預測指標兩方面對比原始ConvLSTM模型和本文改進模型未來1 h雷達回波預測效果,對比圖形包括四行,每行圖像之間的時間間隔為6分鐘,第一行為輸入的近1小時雷達觀測真實回波圖像,第二行為未來1小時雷達實際觀測的真實回波圖像,第三、四行分別為原始ConvLSTM模型和改進模型基于第一行真實雷達觀測預測的未來1小時雷達回波圖像。
圖3為測試集2019年07月29日09點06分到10點00分雷達回波個例預測效果對比,該個例是一次強帶狀回波引發(fā)的海上大風過程。帶狀回波通常是由多個對流回波單體相連排列成帶狀的回波,回波長度遠大于回波寬度,有強回波時,傳播方向與回波帶垂直[22]。由圖3可見,未來1 h的真實回波圖像中在右下方一直存在一條形態(tài)較為明顯、強度較高的帶狀回波,原始模型的預測,尤其在35 min之后的預測,對于帶狀回波的覆蓋區(qū)域、強度方面均與實況有較大差異,而改進后模型預測的回波圖像則整體上與觀測實況更為相似,而且對帶狀強回波的預測效果有更為明顯的提升,能較準確地預測出右下角帶狀回波形態(tài)、強度和移動位置,尤其是后30分鐘的預測效果相比原始模型改進更為明顯,較改進前更完整、清晰地預測了強回波形態(tài)、強度。該個例在閾值為30 dbz時,0.5 h、1 h的預測命中率分別為73%和62%,較改進前分別提升29%、32%;閾值為40 dbz時,0.5 h、1 h的預測命中率分別為37%和17%,較改進前分別提升36%、17%,虛警率皆低于改進前。不過也應注意到,改進后模型雖然在回波細節(jié)預測上優(yōu)于改進前,但與觀測實況仍有一定差距,而且預測細節(jié)與實際圖像的差異隨著預測時間的變長逐漸加大,外推時間越長,細節(jié)丟失也越來越多。
圖4展示了非測試集個例2020年05月21日07點00分到07點54分雷達回波預測效果對比情況,該個例是一次小弓形回波引發(fā)的海上大風過程。弓形回波是指快速移動的向著運動方向凸起的,形如弓的強對流回波。弓形回波的空間尺度大小不一,小的弓形回波長度僅幾十公里,有的可達上百公里.弓形回波是由后側(cè)強烈的下沉氣流造成的。顯著弓形回波在低層反射率因子圖上除了形如弓形外,弓形回波前沿存在高的反射率因子梯度,在較強回波帶后側(cè)有弱回波通道或者后側(cè)入流缺口[21-22]。由圖4中未來1 h的真實回波可見,圖像上方持續(xù)存在一小弓形回波,并逐漸自左向右移動,改進后模型對回波整體形態(tài)預測更為準確,對于圖像上部的回波強度、形態(tài)和移動趨勢預測效果更優(yōu),能夠更為明顯地呈現(xiàn)出小弓形回波的形態(tài)特征和強度。該個例在閾值為30 dbz時,0.5 h、1 h的預測命中率分別為41%和29%,較改進前分別提升13%、11%;閾值為40 dbz時,0.5 h、1 h的預測命中率分別為27%和18%,較改進前分別提升15%、13%,虛警率皆低于改進前。
圖4 模型改進前后2020年05月21日07點00分至07點54分預測效果對比
圖5為非測試集個例2022年06月12日15點00分至15點54分雷達回波預測效果對比,該個例在未來1 h的真實雷達回波中存在兩個小帶狀回波。由圖5中可見,未來1 h的真實雷達回波中左側(cè)帶狀回波形態(tài)較為穩(wěn)定,且維持了較高的強度,右側(cè)的帶狀回波則逐漸變?nèi)?、消散,原始模型預測左側(cè)帶狀回波逐漸消散、右側(cè)回波維持,而改進后模型則較準確地預測了未來1 h左下角回波一直保持較高強度、右下角回波逐漸減弱的變化趨勢,與實況更為一致。該個例在閾值為30 dbz時,0.5 h、1 h的預測命中率分別為76%和73%,較改進前分別提升18%、36%;閾值為40 dbz時,0.5 h、1 h的預測命中率分別為30%和14%,較改進前皆提升6%,0.5 h預測的虛警率與改進前相當,1 h預測的虛警率較改進前分別降低18%、19%。
圖5 模型改進前后2022年06月12日15點00分至15點54分預測效果對比
本文基于深度學習模型ConvLSTM,提出了從輸入數(shù)據(jù)格式和損失函數(shù)兩方面改進的雷達回波外推模型構建思路,通過滄州雷達觀測站4年的歷史數(shù)據(jù)對模型進行訓練得到了可利用近1 h雷達觀測數(shù)據(jù)預測未來1 h雷達回波的模型。測試集和非測試集典型個例檢驗結果表明,改進模型對于強回波的預測能力明顯提升,預測的雷達強回波形態(tài)、強度、位置相比改進前與實況具有更高的相似性,能夠為臨近預報提供一定的參考。但改進模型在回波強度最大值、形態(tài)細節(jié)等方面的預測結果距離雷達真實觀測仍有一定差距,同時,隨著預測時間的增長,預測值與真實觀測值的差異也逐漸加大,而且在外推預報的雷達數(shù)據(jù)產(chǎn)品方面,本研究僅探索了對反射率因子數(shù)據(jù)的預測,對于雷達觀測數(shù)據(jù)中對大風預報也有較好指示意義的徑向速度數(shù)據(jù)的預測尚未涉及。訓練數(shù)據(jù)的質(zhì)量和用于預測的模型均會對預測效果的提升產(chǎn)生影響,更豐富的預報產(chǎn)品也將為預報能力提升提供更好支撐,因此,下一步將繼續(xù)開展基于更豐富和更高質(zhì)量訓練數(shù)據(jù)、增加注意力機制的深度學習模型以及關于雷達徑向速度觀測數(shù)據(jù)產(chǎn)品預測等方面的研究,進一步優(yōu)化預測模型設計,豐富預測產(chǎn)品種類,提升預測效果,以便為大風臨近預報提供更好支撐。