胡家暉 盧楚翰 姜有山 何婧
1 南京信息工程大學(xué)氣象災(zāi)害教育部重點實驗室/氣候與環(huán)境變化國際合作聯(lián)合實驗室/氣象災(zāi)害預(yù)報預(yù)警與評估協(xié)同創(chuàng)新中心,南京 210044
2 南京市氣象局, 南京 210009
對流降水的臨近預(yù)報長期以來一直是天氣領(lǐng)域的一個重要研究課題。目前,制作0~3 小時內(nèi)臨近天氣預(yù)報和發(fā)布災(zāi)害性天氣警報的主要依據(jù)是天氣雷達觀測資料以及結(jié)合快速同化的數(shù)值模型,雷達回波的外推法是臨近預(yù)報的主要手段(俞小鼎等, 2012; 王國榮等, 2019)。 傳統(tǒng)的雷達回波外推法主要是質(zhì)心跟蹤法、交叉相關(guān)法以及變分回波跟蹤算法(陳明軒等, 2007; 韓雷等, 2007; 吳劍坤等,2019),一些計算機視覺技術(shù),如基于光流的方法也可以用于預(yù)測雷達回波圖(韓雷等, 2008; 曹春燕等, 2015)。但傳統(tǒng)的方法對長時間的預(yù)測效果不佳,且不能很好地推演出回波的生消情況。
近年來,深度學(xué)習(xí)模型在處理視頻預(yù)測任務(wù)上有較多應(yīng)用(Oprea et al., 2020),基于雷達的臨近預(yù)報本質(zhì)是一個時空序列預(yù)測任務(wù),同樣也可看成一個視頻預(yù)測任務(wù),以過去序列雷達回波圖作為輸入,預(yù)測未來的雷達回波圖,因而通過深度學(xué)習(xí)的技術(shù)來解決臨近預(yù)報問題是一個很好的思路。Shi et al.(2015)使用ConvLSTM模型(Convolutional Long-Short Term Memory)在降水臨近預(yù)報中獲得顯著效果,該模型的時空相關(guān)性更優(yōu)于FC-LSTM(Graves, 2013),且模型相對于傳統(tǒng)的基于光流的模型有一定的優(yōu)勢。在后續(xù)的改進中,Shi et al.(2017)考慮了雷達回波旋轉(zhuǎn)特性,通過動態(tài)改變隱狀態(tài)間的連接結(jié)構(gòu)提出TrajGRU(Trajectory Gated Recurrent Unit),并為深度學(xué)習(xí)模型在臨近預(yù)報的應(yīng)用提供了極具參考意義的基準對比試驗。韓豐等(2019)使用ST-LSTM 單元組成的循環(huán)神經(jīng)網(wǎng)絡(luò)進行雷達臨近預(yù)報試驗,其預(yù)報結(jié)果比交叉相關(guān)法在各項指標(biāo)上要表現(xiàn)的更好,但雷達強回波中心預(yù)報效果不太理想。施恩等(2018)使用動態(tài)卷積神經(jīng)網(wǎng)絡(luò)模型在雷達回波外推任務(wù)中進行了嘗試,相對于傳統(tǒng)的外推方法有一定提升。郭瀚陽等(2019)的試驗表明深度學(xué)習(xí)模型較之傳統(tǒng)外推法在準確率上有明顯的提升。近年來,模型結(jié)構(gòu)構(gòu)建與改進的嘗試逐步得以開展,通常雷達回波外推模型采用多層編碼—解碼結(jié)構(gòu),而模型的改進一般分兩種。一種是對編解碼結(jié)構(gòu)進行修改擴充,如在編碼解碼端連接處加入注意力模塊,或如Star-BridgeNet(Cao et al., 2019)在解碼端改造每個輸出時間步之間的連接方式。另外,也有對基本的循環(huán)神經(jīng)網(wǎng)(RNN)模塊改造如針對回波的平穩(wěn)和非平穩(wěn)隨機過程建模的MIM(Wang et al., 2019)。
需指出的是,當(dāng)前大部分深度學(xué)習(xí)模型結(jié)構(gòu)主要基于RNN 和卷積神經(jīng)網(wǎng)(CNN),受限于卷積核的大小,普通的卷積層只能提取到有限范圍且固定的信息,對于范圍較大的系統(tǒng)性回波刻畫能力往往受到限制。對于RNN模型,預(yù)測的效果往往隨時間變差,一方面由于大氣的混沌和高度非線性難以預(yù)測,另一方面RNN 的預(yù)測依賴于上一時間步的輸出,誤差將會增加和累積。生成式對抗網(wǎng)絡(luò)(GAN)是另一個在計算機視覺任務(wù)中常用的模型,它通過生成器和判別器的博弈學(xué)習(xí)數(shù)據(jù)真實的分布。而Woo et al.(2018)提出利用嵌入式的注意力模塊,可以提高神經(jīng)網(wǎng)絡(luò)的不同尺度特征提取能力,關(guān)注重要的特征抑制不重要的特征。另一方面,盡管光流法對系統(tǒng)生消以及時效有其局限性,但其對已知時刻的回波系統(tǒng)的位置變化以及運行特征有較強的刻畫能力,因此能否在深度模型編碼階段(預(yù)報因子構(gòu)建)融入光流法刻畫信息,從而提升模型的預(yù)報性能?為此,針對上述兩個問題本文嘗試使用雙流注意力生成對抗網(wǎng)(Two-stream Attention GAN,TAGAN),通過加入計算機視覺任務(wù)中常用的注意力模塊并且融入帶有運動信息的光流場,使用過去1 h 的雷達回波拼圖數(shù)據(jù)預(yù)測未來1 h 的回波演變,將此模型與Woo and Wong(2017)提出的Rover 變分光流法(Real-time Optical flow by Variational methods for Echoes of Radar)和基于3D 卷積原理的3D U-Net(簡稱3DUnet )模型進行對比檢驗,給出了測試集上的對比檢驗結(jié)果和回波過程個例可視化結(jié)果,并分析了導(dǎo)致預(yù)測效果差異的原因。
本文使用的數(shù)據(jù)集是深圳市氣象局與香港天文臺根據(jù)近年的雷達數(shù)據(jù)共同建立的“標(biāo)準雷達數(shù)據(jù)集2018”(https://tianchi.aliyun.com/competition/entrance/231662/information [2021-01-05])。該 數(shù)據(jù)集由32 萬組連續(xù)雷達回波圖像組成。在本次實驗中取前1 h 間隔6 min 共10 幀的回波圖(反射率因子),預(yù)測后1 h 共10 幀回波圖,挑選出了具有明顯回波過程(即樣本中至少一個時次含有10 dBZ以上的數(shù)據(jù)占比20%以上)的樣本(共2.2 萬組序列樣本),將缺測值用相鄰四個不為缺測的格點數(shù)值取平均后填充,分別在數(shù)據(jù)集的訓(xùn)練組和測試組上用長度為20、步長為10 的滑窗進行切割獲得輸入部分不相交的序列樣本,在訓(xùn)練組上切割出本次試驗的訓(xùn)練集和驗證集,在測試組上切出測試集。其中訓(xùn)練集和驗證集一共2 萬組序列樣本比例為8:2,測試集一共2000 組序列樣本。為濾除回波噪聲,對訓(xùn)練和測試數(shù)據(jù)進行中值濾波(即將每一個像素點的值設(shè)置為窗口內(nèi)所有像素點的中值),濾波會對圖像有一定的模糊化。之后進行歸一化處理。整套所用數(shù)據(jù)中,10~20 dBZ、20~30 dBZ、30~40 dBZ和大于40 dBZ的格點頻率分別為28%、37%、29%、5.7%。
2.2.1 TAGAN模型
在搭建TAGAN模型的過程中基本預(yù)測模型采用3 層編碼—解碼結(jié)構(gòu)的RNN,RNN 基本單元使用Ballas et al.(2015)提出的ConvGRU(Convolutional Gated Recurrent Unit),ConvGRU 的公式如下:
其中,*表示卷積操作, ?表示哈達瑪積操作。Zt為GRU 單元的更新門,Rt為GRU 單元的重置門,σ為激活函數(shù),為上一時刻的隱狀態(tài)、經(jīng)重置門的數(shù)據(jù)、輸入數(shù)據(jù)Xt計算而成的。而最終輸出的Ht為經(jīng)過更新門更新的隱狀態(tài)。ConvGRU 是基于門控的循環(huán)單元,將其進行堆疊可以擴大頂層的感受野捕捉到更大范圍的回波從而更好的學(xué)習(xí)到雷達回波演變特征。具體編碼解碼結(jié)構(gòu)共有三層(如圖1),每一層都由RNN(ConvGRU 單元)、注意力模塊和卷積層組成,卷積層一方面用來對數(shù)據(jù)進行上、下采樣,從而讓模型訓(xùn)練的顯存控制在可以接受的范圍內(nèi),另一方面可以提取到回波數(shù)據(jù)的低維到高維的信息。其中編碼端和解碼端ConvGRU 單元的卷積核數(shù)量分別為64、192、192。輸入數(shù)據(jù)在編碼端經(jīng)過多層信息提取,被壓縮成隱狀態(tài)輸入到解碼端,經(jīng)過解碼端解碼成預(yù)測的雷達回波數(shù)據(jù),編碼解碼結(jié)構(gòu)對稱,在編碼解碼連接端每一層的解碼器接受對應(yīng)層編碼器輸出的隱狀態(tài)數(shù)據(jù)。
圖1 TAGAN模型生成器模型圖Fig. 1 TAGAN model generator model diagram
如圖2 所示模型訓(xùn)練框架基于生成對抗網(wǎng)絡(luò)(Goodfellow et al., 2014),包括生成器(Generator)和判別器(Discriminator)兩部分,訓(xùn)練過程中生成器與鑒別器交替訓(xùn)練,最終達到平衡時生成器可以生成接近真實的數(shù)據(jù)。模型內(nèi)部的卷積層均由2D 卷積層、批量歸一化層、LeaklyReLU(負斜率設(shè)置為0.2)激活函數(shù)組成。GAN 的原理如公式(5)所示:
圖2 TAGAN模型結(jié)構(gòu)圖Fig. 2 TAGAN model structure diagram
其中,生成器的目的是生成更為真實的雷達回波序列從而騙過判別器,判別器的目的是盡可能地區(qū)分出來自生成器和來自真實的雷達回波序列。c表示輸入雷達回波序列,D(x|c)表示鑒別器對真實數(shù)據(jù)輸出的概率,D(G(x|c))表示鑒別器對生成器預(yù)測數(shù)據(jù)輸出的概率。
雷達回波的預(yù)測由生成器(編解碼結(jié)構(gòu))完成,以往的大多數(shù)模型試驗中輸入部分只有雷達回波數(shù)據(jù),而TAGAN 在回波數(shù)據(jù)進入模型時加入了其對應(yīng)時刻的光流圖,因此模型接受的數(shù)據(jù)不僅是過去時刻的回波圖。其目的一方面在于融入了預(yù)測因子(前序回波圖)的額外光流信息,另一方面光流圖又起到了約束的作用,使模型做預(yù)測的時候能在更小的范圍里進行選擇?;夭ㄐ蛄袌D和光流圖分別經(jīng)過對應(yīng)的卷積層(第一層)進行特征融合,之后數(shù)據(jù)流經(jīng)過卷積層下采樣通過注意力模塊進入ConvGRU 單元,在訓(xùn)練的過程中嘗試了在卷積層中加入若干殘差塊(He et al., 2016),提高卷積層提取信息的能力。判別器使用若干卷積層組成,后使用sigmoid 函數(shù)激活,數(shù)值范圍在0~1 之間。
此外,生成器的前兩層采用CBAM(Convlutional Block Attention Module)注意力模塊(圖3),該模塊是Woo et al.(2018)提出的輕量級注意力模塊,它可以自由地嵌入到卷積網(wǎng)絡(luò)中從而提高網(wǎng)絡(luò)的特征提取能力,對重要特征起突顯作用。例如,在不同種類貓圖像分類的任務(wù)中,對于分類結(jié)果影響最大的部分就是圖像中貓形態(tài)的特征而非背景,注意力模塊可以賦予圖中貓部分高權(quán)重和背景低權(quán)重。CBAM 包含通道注意力和空間注意力兩個部分,通道和空間注意力模塊采用全局平均池化和最大池化來計算注意的權(quán)重系數(shù),將兩者順序組合成CBAM 后嵌入TAGAN 中,在數(shù)據(jù)流入CBAM模塊時可以學(xué)到相對整個過程中需要更加注意的區(qū)域。
圖3 CBAM模塊結(jié)構(gòu)圖,包含通道注意力模塊(左部)和空間注意力模型(右部)Fig. 3 CBAM module structure diagram, including the channel attention module (left part) and the spatial attention model (right part)
最后,在模型的最后一層采用self-attention 自注意力模塊(Zhang et al., 2019),該模塊的結(jié)構(gòu)圖如圖4 所示。該模塊與CBAM模塊的作用類似,其也是強調(diào)在原始特征中何處需要加強注意從而更好的提高網(wǎng)絡(luò)特征提取與變換的能力,模塊中原特征圖經(jīng)過三個1×1 的卷積后分別得到三個特征圖,通過前兩個特征圖計算出attention 權(quán)重系數(shù)在與第三個特征圖作矩陣乘法運算得到注意力特征圖,最后將注意力特征圖與原特征圖相加得到最終輸出的特征圖,自注意力模塊可以學(xué)到任意位置的依賴關(guān)系。由于自注意力的計算開銷比較大,所以放在編碼和預(yù)測模塊的底層(最后一層)。
圖4 Self-attention模塊結(jié)構(gòu)圖, ?表示矩陣乘法運算Fig. 4 Self-attention module structure diagram ( ?: matrix multiplication operation)
基于上述的模型,完整的回波數(shù)據(jù)進入模型到預(yù)測的過程如下:10 幀回波數(shù)據(jù)和對應(yīng)光流場依次經(jīng)過第一層卷積層融合后進入CBAM 注意力模塊接著進入ConvGRU 單元,繼而以相同方式進入第二層和第三層,但第三層的注意力模塊為Selfattention模塊。其中第一個時間步的ConvGRU 單元隱狀態(tài)初始化為0,數(shù)據(jù)在編碼端最終被壓縮成3 個張量(最后一個時間步3 層ConvGRU 輸出的隱狀態(tài)),這三個張量包含著從低維到高維10 幀回波圖像以及對應(yīng)光流場演變的信息,以此作為初始化的隱狀態(tài)進入解碼端對應(yīng)的ConvGRU 中,在解碼端的計算首先從第三層開始,第三層ConvGRU的輸入初始化為0,隱狀態(tài)來自對應(yīng)層的編碼端ConvGRU,數(shù)據(jù)流方向與編碼端相反,卷積層使用轉(zhuǎn)置卷積進行上采樣將尺寸較小的特征圖重構(gòu)為預(yù)測的回波圖像,在后續(xù)預(yù)測的時間步中計算依據(jù)上一時刻輸出的隱狀態(tài),這種方式可以預(yù)測變長序列。最終解碼端將會輸出10 幀預(yù)測的回波圖像,接著預(yù)測的回波數(shù)據(jù)和真實回波數(shù)據(jù)分別拼接輸入回波數(shù)據(jù)交替進入判別器進行訓(xùn)練,判別器反向傳播的梯度也會進入生成器(編碼解碼結(jié)構(gòu))幫助生成器更好的預(yù)測,理想的判別器輸出概率應(yīng)為0.5,即生成器生成的回波數(shù)據(jù)達到了以假亂真的效果,使得判別器不能以較大的概率判定其是真是假,生成器和判別器達到納什平衡。
2.2.2 損失函數(shù)
在雷達回波預(yù)測的任務(wù)中,常用的損失函數(shù)有平均平方誤差(MSE)和平均絕對誤差(MAE),但該兩個損失函數(shù)容易造成預(yù)測圖像的模糊化,為了更好的生成圖像和更精確的預(yù)測還引入了圖像梯度差損失函數(shù)(GDL)和結(jié)構(gòu)相似性損失函數(shù)(SSIM)。
SSIM 是計算兩張圖片的相似度的函數(shù),其定義如下:
其中,l(x,y)為亮度相似度,c(x,y)為對比相似度,s(x,y)為結(jié)構(gòu)相似度。μx和μy分別是x和y的平均值,而σx和σy則是x和y的方差,σxy是x和y的協(xié)方差。C1、C2、C3是維持數(shù)值計算穩(wěn)定的常數(shù)。訓(xùn)練過程中使用的SSIM 損失函數(shù)(Zhao et al.,2017)如下:
訓(xùn)練過程中的圖像梯度差損失函數(shù)如下所示:
其中,i和j為坐標(biāo),在訓(xùn)練過程中α取1。
對抗損失函數(shù)如下:
其中Lbce為二分類交叉熵損失函數(shù),D為鑒別器。
最后本次試驗中使用的損失函數(shù)如下:
關(guān)于對抗損失函數(shù)Ladv的參數(shù)設(shè)置,訓(xùn)練步驟請詳細參考Mathieu et al.(2016)和Isola et al.(2017),Lp是帶權(quán)重的MSE 和MAE,越高的回波值賦予越高的權(quán)重。
2.2.3 對比模型
U-Net 是圖像分割領(lǐng)域常用的模型,其多尺度融合的結(jié)構(gòu)常用于高分辨率圖像分割任務(wù)。作為本次試驗的對比模型我們采用了圖5 基于三維卷積的3DUNet模型(?i?ek et al., 2016),在開源模型的基礎(chǔ)上對網(wǎng)絡(luò)深度,卷積核及步長進行修改以適用于本次試驗數(shù)據(jù)。較之于2D 卷積3DUnet模型的卷積操作全部采用3D 卷積,在提取時序信息的功能上更為強大。另一個對比模型是傳統(tǒng)的基于光流的Rover模型。
圖5 3DUnet模型概念示意圖Fig. 5 Conceptual schematic diagram of the 3DUnet model
TAGAN模型訓(xùn)練使用Adam 優(yōu)化器,初始學(xué)習(xí)率根據(jù)繪制不同學(xué)習(xí)率下的損失函數(shù)下降速率圖,選擇合適的學(xué)習(xí)率,學(xué)習(xí)率衰減采用每2 個輪次減0.7。在訓(xùn)練過程中采用l2 正則約束,訓(xùn)練策略采用早停策略,當(dāng)驗證集損失函數(shù)值連續(xù)1 個epoch 不下降后停止訓(xùn)練,在試驗過程中批量大小分別選擇2 進行訓(xùn)練,效果在卷積層不使用批量歸一化層時較好。在訓(xùn)練過程中嘗試了DCGAN(Radford et al., 2015),WGAN-GP(Gulrajani et al., 2017)等不同GAN 的損失函數(shù)和訓(xùn)練方式,發(fā)現(xiàn)對抗損失的權(quán)重系數(shù)對訓(xùn)練結(jié)果至關(guān)重要,單獨只使用對抗損失函數(shù)訓(xùn)練時非常容易導(dǎo)致訓(xùn)練失敗,需要模型訓(xùn)練初期以MSE 與MAE 損失函數(shù)為主導(dǎo)損失函數(shù),然后再將對抗損失函數(shù)作為主導(dǎo)損失函數(shù)進行訓(xùn)練。作為基線對比模型3DUnet 只使用帶權(quán)重的平均平方誤差和平均絕對誤差作為損失函數(shù),驗證集結(jié)果最優(yōu)的TAGAN 迭代了10 萬次,3DUNet 迭代了6 萬次。
測試集上的檢驗指標(biāo)采用氣象中常用的命中率(POD)、虛警率(FAR)也稱誤報率以及臨界成功指數(shù)(CSI),以及HSS(Heidke Skill Score)技巧評分(Hogan et al., 2010)。各檢驗指標(biāo)的計算公式如下:
其中,TP 表示觀測回波大于閾值且預(yù)測回波大于閾值,F(xiàn)N 表示觀測回波大于閾值且預(yù)測回波小于閾值,F(xiàn)P 表示觀測回波小于閾值且預(yù)測回波大于閾值,TN 表示觀測回波小于閾值且預(yù)測回波也小于閾值。相應(yīng)的混淆矩陣如表1 所示。根據(jù)不同閾值下的混淆矩陣,按上述公式計算檢驗指標(biāo)。為了更全面的對比模型預(yù)測的效果還計算了MSE、MAE 以及空間相關(guān)系數(shù)。
表1 混淆矩陣Table 1 Confusion matrix
表2 的檢驗結(jié)果顯示,本文所設(shè)計的TAGAN模型在10~40 dBZ閾值下的臨界成功指數(shù)、命中率和HSS 評分基本高于傳統(tǒng)光流法,而對于虛警率FAR 這一指數(shù)兩種深度學(xué)習(xí)模型均低于傳統(tǒng)光流法。特別地,TAGAN模型在未來30 min 和60 min的預(yù)測評分上明顯優(yōu)于3DUnet模型。另外,由表3顯示,深度學(xué)習(xí)模型尤其TAGAN模型在測試集上的6~60 min 整體平均的平方誤差和絕對誤差數(shù)值也明顯低于光流法,同時空間相關(guān)系數(shù)TAGAN模型也為最高,這表明TAGAN模型性能在本文的三種方法中最優(yōu)。需指出的是,在40 dBZ閾值下三種模型的預(yù)測效果均很差,這可能與訓(xùn)練樣本中強回波數(shù)據(jù)稀少有關(guān),盡管在數(shù)據(jù)預(yù)處理時已經(jīng)對數(shù)據(jù)集樣本進行過篩選,但受限于整個數(shù)據(jù)集里的強回波樣本稀少(5.7%),導(dǎo)致模型對強回波預(yù)測的能力欠佳。
表2 測試集檢驗對比Table 2 Test set comparison
表3 測試集檢驗對比Table 3 Test set comparison
為進一步顯示三種不同方法對于強降水過程的預(yù)測性能,圖6 分別給出了30 dBZ閾值樣本子集的三種模型FAR 和HSS 測試集平均得分在6~60 min的時間變化。可以清晰的看出,30 dBZ閾值下三種方法的平均FAR 及其離散度均隨時間逐漸增加,平均FAR 由低至高依次為TAGAN、3DUnet 和光流法。三種方法的平均HSS 隨時間則逐漸降低,同時離散度隨時間而增加,TAGAN 平均HSS 評分最高,而3DUnet 在前30 min 優(yōu)于光流法,但30 min后性能差于光流法??傮w看,TAGAN模型的強降水過程預(yù)測性能依然明顯好于其他兩種方法。
圖6 30 dBZ 閾值下三種模型FAR 和HSS 測試集平均得分隨時間變化(折線),陰影上下界代表測試集所有樣本得分的上下四分位數(shù)Fig. 6 Average scores of the False Alarm Rate and Heidke Skill Score test sets of the three models under 30 dBZ threshold change over time (broken line): the upper and lower bounds of the shade represent the upper and lower quartiles, respectively, of the scores of all samples in the test set
為了更加直觀和定量化的展示不同模型之間的差異,選取四組個例并對它們6~60 min 預(yù)測的效果作詳細分析。圖7 首先給出了這四組個例在最后一幀(60 min)的三種不同方法與真實場的回波分布情況,總體上三種方法能較好地預(yù)測這四個個例未來一小時的回波系統(tǒng)位置以及強度。從清晰度看,光流法的清晰度最高,但圖像有扭曲現(xiàn)象,其次為3DUnet,TAGAN 相對模糊。兩種深度方法的清晰度均弱于光流法,主要是由于深度學(xué)習(xí)模型預(yù)測過程中使用了平均平方誤差(MSE)和平均絕對誤差(MAE),這兩個損失函數(shù)容易造成預(yù)測圖像的模糊化,且圖像模糊情況隨著時間增加,它們更趨向一個“平均”的結(jié)果。但是,如果仔細對比這些個例的強回波區(qū)(如大于30 dBZ區(qū)域)的位置以及強度,會發(fā)現(xiàn)TAGAN 的預(yù)測情況較光流法和3DUnet 更接近真實的回波分布,即光流法和3DUnet 對于強回波的區(qū)域的預(yù)測存在部分偏移以及局部地區(qū)系統(tǒng)把握不準所致,導(dǎo)致FAR 偏高。而TAGAN模型的圖像更為平滑,回波形狀與真實形狀相符合,F(xiàn)AR 更低。為更細致地刻畫三種方法對強回波的預(yù)測效果,圖8 進一步給出了四組個例對預(yù)測的10 個時次逐次計算的FAR 和HSS 得分??梢钥吹?,TAGAN 在6~60 min時段預(yù)報的虛警率明顯低于光流法和3DUnet,與此同時TAGAN的HSS 評分也明顯高于其余兩種方法。并且,隨著時間的推移,其他兩種方法相對TAGAN 的性能差距進一步拉大。相對而言,光流法和3DUnet 對這四個個例的6~60 min 預(yù)測評分接近。
圖7 四組預(yù)測個例最后一幀對比。(a–d)分別為四組回波過程,每一列分別為真實過程、Rover、TAGAN、3DUnet 在四組預(yù)測個例中的最后一幀F(xiàn)ig. 7 Comparison of the last frame of the four sets of prediction cases, where (a–d) are the four sets of echo processes, and each column is the last frame of the real process, Rover, TAGAN, and 3DUnet in the four sets of process predictions
圖8 四組預(yù)測個例三種模型(紅色:3DUnet,綠色:Rover,藍色:TAGAN)6~60 min 30 dBZ 閾值的FAR(實線)和HSS(虛線)技巧評分Fig. 8 Four groups of prediction cases and three models (red: 3DUnet; green: Rover; and blue: TAGAN) under 6–60 min of 30 dBZ threshold FAR(solid line) and HSS (dashed line) skill scores
此外,為進一步對比三種方法個例中強回波區(qū)隨時間的演變,分別計算了四個個例大于30 dBZ強回波主體(圖9 紅框區(qū)域)質(zhì)心在6~60 min 的變化(圖10),可以清晰地看出TAGAN模型對強回波主體隨時間變化的預(yù)測與真實情況更為接近。以個例4 為例(圖10d),TAGAN模型預(yù)測的強回波區(qū)移動以西南—東北向為主,與真實情況相接近,而光流法則是以西南—東北偏南為主,3DUnet 的偏移更大,以偏北移動為主。從這四個個例強回波質(zhì)心的相對移速和60 min 的質(zhì)心位置看,TAGAN模型仍然優(yōu)于其它兩種方法。
圖9 四組預(yù)測個例第一幀回波圖真實值,其中紅框為計算質(zhì)心的范圍(覆蓋未來9 幀回波主體范圍),藍線輪廓為回波值大于30 dBZ 的回波主體Fig. 9 True value of the first frame of the four groups of prediction cases: the red box represents the range of the calculated centroid covering the range of the echo subject of the next nine frames), while the blue line outline is the echo subject with an echo value greater than 30 dBZ
圖10 四組預(yù)測個例10 個時次回波值大于30 dBZ 回波主體的質(zhì)心移動軌跡。其中,紅色:真實回波;棕色:3DUnet;灰色:Rover;綠色:TAGANFig. 10 Four groups of prediction cases during the 10 times the echo value is greater than 30 dBZ. Center of mass movement trajectory of the echo subject: real echo (red); 3DUnet (brown); Rover (gray); TAGAN (green)
其中雷達質(zhì)心的計算方式如下:
式中,m(i,j)為橫縱坐標(biāo)為(i,j)的網(wǎng)格上回波反射率大于30 dBZ的值。
因此,綜合以上四個個例的結(jié)果分析表明,TAGAN模型在三種方法中性能最優(yōu),盡管光流法和3DUnet 的圖像清晰度高于TAGAN,但更容易出現(xiàn)扭曲和偏差現(xiàn)象,導(dǎo)致誤報率明顯上升以及預(yù)報準確率的下降。另外,在TAGAN模型的訓(xùn)練和預(yù)測過程中發(fā)現(xiàn),對于TAGAN 在訓(xùn)練過程中如果提高對抗損失函數(shù)的權(quán)重,生成的圖像也會相對更加“銳化”,但卻會出現(xiàn)圖像清晰后回波位置準確度明顯降低的現(xiàn)象,從而導(dǎo)致檢驗評分下降的情況,因此超參數(shù)的設(shè)置對最終預(yù)測圖像的效果至關(guān)重要。3DUnet 的預(yù)測性能相對較差可能與其模型參數(shù)量小有關(guān),雖然3D 卷積在處理時空序列數(shù)據(jù)時比2D 卷積有強大的優(yōu)勢,Unet 多尺度融合的結(jié)構(gòu)也常用來生成高分辨率的圖像,但參數(shù)量小可能會導(dǎo)致模型的泛化能力大大下降,在預(yù)測復(fù)雜多變的任務(wù)時效果會欠佳。
雷達回波外推為短時臨近預(yù)報提供了重要的指導(dǎo),本文使用TAGAN模型進行臨近預(yù)報試驗和多模型對比檢驗。該模型在傳統(tǒng)的多層編碼解碼結(jié)構(gòu)的基礎(chǔ)上將兩種注意力模塊組合嵌入結(jié)構(gòu)中,在輸入的雷達回波數(shù)據(jù)中融合對應(yīng)時刻的光流數(shù)據(jù),并在訓(xùn)練時結(jié)合對抗生成損失函數(shù)、權(quán)重的MSE 和MAE 等多種損失聯(lián)合訓(xùn)練模型,以此提升模型的預(yù)測能力。研究結(jié)果表明, TAGAN 在多種檢驗指標(biāo)的評分上優(yōu)于基于卷積神經(jīng)網(wǎng)絡(luò)的3DUnet模型和傳統(tǒng)Rover 光流法模型??傮w上,雖然光流法的預(yù)測圖像清晰度高于TAGAN 和3DUnet 深度學(xué)習(xí)
模型,但在各項評分指標(biāo)上深度學(xué)習(xí)模型尤其是TAGAN 優(yōu)于光流法。相較而言,3DUnet 和光流法在未來一小時的預(yù)報場上會更多出現(xiàn)回波圖像扭曲和偏差現(xiàn)象,對強回波系統(tǒng)執(zhí)行的移動描述能力有待提高。另外,TAGAN 的超參數(shù)設(shè)置對預(yù)測效果作用明顯,隨著損失函數(shù)中對抗損失函數(shù)權(quán)重的提高,圖形清晰度隨之提高,但清晰度到達一定程度后其整體評分反而會出現(xiàn)下降的情況。
需指出的是,試驗過程中我們嘗試了不同損失函數(shù)的組合。發(fā)現(xiàn)如只用MSE 和MAE 損失函數(shù),清晰度明顯較光流法預(yù)測差,主要原因是在使用MSE 損失函數(shù)的時候假設(shè)數(shù)據(jù)是高斯分布的,但在梯度反傳的時候,損失函數(shù)計算的是拼接在一起的序列預(yù)測值與真實序列值,于是對空間上出現(xiàn)的不連續(xù)回波區(qū)和時間上的旋轉(zhuǎn)和耗散擬合不夠,導(dǎo)致訓(xùn)練的結(jié)果是在總體上的距離與真實分布相近,因此預(yù)測的結(jié)果就會出現(xiàn)直觀上的一個“平均”現(xiàn)象。另一方面,但是如果只使用對抗損失或者以對抗損失為主導(dǎo)的損失函數(shù),則容易出現(xiàn)模式崩塌現(xiàn)象。例如,預(yù)測的數(shù)據(jù)本應(yīng)局限在有雷達回波的位置,但卻覆蓋了整個空間并出現(xiàn)明顯的不連續(xù)以及不合理回波區(qū)。這主要是由于GAN 訓(xùn)練過程中,目標(biāo)映射可能不在生成器的可表示泛函空間之中,導(dǎo)致了收斂困難。因此,有必要同時結(jié)合MAE、MSE 和對抗損失進行模型構(gòu)建。
需指出的是,近年來機器學(xué)習(xí)在氣象領(lǐng)域應(yīng)用廣泛,而利用深度學(xué)習(xí)方法進行雷達回波外推及短時預(yù)測作為當(dāng)前的一個研究熱點仍存在三個亟待解決的問題:(1)雷達回波或降水?dāng)?shù)據(jù)集歷史積累不夠,樣本量需要進一步擴大。傳統(tǒng)的解決辦法包括但不限于:針對數(shù)據(jù)集過采樣、欠采樣、使用帶權(quán)重的損失函數(shù)以分割數(shù)據(jù)集訓(xùn)練不同的模型訓(xùn)練然后集成。但試驗中發(fā)現(xiàn)效果提升不明顯,反映在模型預(yù)測中強回波過程的強度和落區(qū)不能很好地表現(xiàn)出來,一些強回波過程諸如臺風(fēng),因訓(xùn)練集中樣本較小導(dǎo)致預(yù)測效果很差。此外,機器學(xué)習(xí)嚴重依賴數(shù)據(jù)集的質(zhì)量和特征工程,數(shù)據(jù)集的質(zhì)量直接決定了預(yù)測效果的下限,如何從氣象的角度出發(fā)構(gòu)建清洗數(shù)據(jù)集并提高數(shù)據(jù)質(zhì)量,針對包括雷達回波外推在內(nèi)的氣象預(yù)測任務(wù)做出更對應(yīng)的特征工程亟待解決。(2)預(yù)測圖像模糊,這是當(dāng)前雷達回波外推深度學(xué)習(xí)乃至視頻預(yù)測領(lǐng)域的難題,當(dāng)圖像的尺寸較小時效果尚佳,但當(dāng)做高分辨率預(yù)測時模糊的問題尤其凸顯,本次試驗也對改善此問題做了一定的嘗試。除了引入改善圖像的損失函數(shù)外,另一解決辦法就是將高分辨率圖像分割成尺寸較小的不同塊訓(xùn)練,在預(yù)測時再拼接回去,但這樣會造成整體圖像不連續(xù)拼接痕跡明顯。(3)預(yù)測效果隨時間變差,PredRNN++(Wang et al., 2018)的設(shè)計結(jié)構(gòu)以及其使用的CausalLSTM 單元對此問題有一定的改善。綜上,深度學(xué)習(xí)方法對降水臨近預(yù)報業(yè)務(wù)的提升具有一定的科學(xué)意義和較好的應(yīng)用,但仍有待進一步探索和研究。
致謝感謝深圳市氣象局與香港天文臺根據(jù)近年的雷達數(shù)據(jù)共同建立的“標(biāo)準雷達數(shù)據(jù)集2018”。感謝審稿專家和編輯對本文的改進提出的寶貴意見。