蔡金圻 譚桂容* 牛若蕓
1)(南京信息工程大學(xué)氣象災(zāi)害教育部重點實驗室/氣候與環(huán)境變化國際合作聯(lián)合實驗室/氣象災(zāi)害預(yù)報預(yù)警與評估協(xié)同創(chuàng)新中心, 南京 210044)2)(國家氣象中心, 北京 100081)
我國地理位置特殊,受青藏高原熱力與動力作用影響顯著,是復(fù)雜的季風(fēng)氣候區(qū)域[1-2]。江淮地處雨量豐沛的南方和干旱少雨的北方過渡地帶,降水的年際和季節(jié)變率大,影響因素復(fù)雜。在全球氣候變暖背景下,近50年我國降水強度普遍趨于增加,而降水日數(shù)除西北地區(qū)外其他大部分地區(qū)顯著減少[3],局地持續(xù)性暴雨事件主要發(fā)生在江南和華南地區(qū),以6月為最多[4]。20世紀80年代后全國暴雨極端事件除華北外其他地區(qū)均呈頻數(shù)增加、強度增大的特點[5],給國民經(jīng)濟、社會發(fā)展以及人民生活帶來巨大損失及影響。
受夏季風(fēng)影響,我國旱澇降水與雨帶位置密切相關(guān),而雨帶位置又與背景環(huán)流場密不可分[6-7]。大尺度環(huán)流異常、阻塞高壓等系統(tǒng)的作用引起干冷、暖濕空氣交匯是發(fā)生極端強降水的重要原因[8-12]。馬嵐等[13]利用衛(wèi)星資料進行輻射亮度溫度(TBB)反演計算,分析得出季風(fēng)爆發(fā)并與北方南下冷空氣的結(jié)合是造成我國東南部地區(qū)出現(xiàn)大范圍長時間強降水的必要條件。Chen等[14]研究發(fā)現(xiàn),中高緯地區(qū)主要存在兩種影響中國極端降水的環(huán)流型,即兩脊一槽型和一槽一脊型;低緯度地區(qū)有3條低層季風(fēng)環(huán)流將水汽輸送至中國。暴雨區(qū)主要位于200 hPa高空急流入口區(qū)右側(cè),南亞高壓北緣和中緯度脊前輻散氣流中[15]。江淮地區(qū)強降水發(fā)生次數(shù)多,持續(xù)時間長,與西太平洋副熱帶高壓的穩(wěn)定控制有密切關(guān)系[4]。極端強降水不是單一環(huán)流發(fā)生發(fā)展的結(jié)果,而是對流層高、中、低不同層次多個關(guān)鍵系統(tǒng)相互配置、共同影響形成的[14,16]。許多學(xué)者通過討論環(huán)流與降水的關(guān)系,將關(guān)鍵區(qū)環(huán)流相似方法運用到降水預(yù)報中[17-21]。譚桂容等[22]將場相似方法運用到江淮地區(qū)強降水環(huán)流場分型及期降水預(yù)報中,結(jié)果表明:不同時效得到的強降水發(fā)生日環(huán)流與實測環(huán)流相關(guān)顯著,且在獨立預(yù)報試驗中,該方法在3 d 以上大到暴雨的預(yù)報效果優(yōu)于模式。Zhou等[23]利用帶有權(quán)重的余弦相似方法建立基于關(guān)鍵影響系統(tǒng)的模擬模型(key influential systems based analog model,KISAM)并對持續(xù)性強降水進行預(yù)測,結(jié)果表明:KISAM較模式直接預(yù)報(direct model output,DMO)能夠更早識別持續(xù)性極端降水且預(yù)測位置和強度更準確,尤其是3 d以上的預(yù)報。
人工神經(jīng)網(wǎng)絡(luò)很早就被應(yīng)用到氣象領(lǐng)域[24-25],如降水分類預(yù)報,孫照渤等[26]根據(jù)雨型與前期(冬季)環(huán)流和海溫關(guān)系,利用人工神經(jīng)網(wǎng)絡(luò)方法對我國夏季的雨型進行模擬預(yù)報,建立分類預(yù)報模型。隨著深度學(xué)習(xí)的發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)具有適用性強、泛化能力強、全局優(yōu)化訓(xùn)練參數(shù)少等優(yōu)點[27],相較于傳統(tǒng)的圖像分類方法,不再需要人工對目標圖像進行特征描述和提取,而是通過網(wǎng)絡(luò)自主地從訓(xùn)練樣本中學(xué)習(xí)特征,近年也被逐漸應(yīng)用到天氣預(yù)報及氣候預(yù)測上。陳程[28]參考ConvLSTM(convolutional long short-term memory)結(jié)構(gòu)提出一種結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和GRU(gated recurrent unit)的ConvGRU(convolutional gated recurrent unit)模型,將雷達回波數(shù)據(jù)作為輸入應(yīng)用于降水短時臨近預(yù)報。Ham等[29]采用深度學(xué)習(xí)方法的統(tǒng)計預(yù)測模型可以得出有效期長達1年半的ENSO預(yù)測,還可以更好地預(yù)測海面溫度的精細空間分布。Liu等[30]將深度學(xué)習(xí)應(yīng)用于氣候極端事件檢測,開發(fā)了深度卷積神經(jīng)網(wǎng)絡(luò)分類系統(tǒng),在檢測極端事件(熱帶氣旋、大氣河流和天氣鋒)方面準確率達到89%~99%。He等[31]提出殘差神經(jīng)網(wǎng)絡(luò)(residual networks,ResNet),通過在卷積網(wǎng)絡(luò)中引入殘差單元,解決加深網(wǎng)絡(luò)深度的過程中出現(xiàn)的退化問題。殘差網(wǎng)絡(luò)相比于傳統(tǒng)卷積網(wǎng)絡(luò),具有更易優(yōu)化、參數(shù)更少的優(yōu)點。殘差網(wǎng)絡(luò)在圖像分類上效果好,而在此之前的關(guān)鍵區(qū)環(huán)流相似方法主要通過相似系數(shù)實現(xiàn)。因此,本文選取江淮(26°~36°N,110°~123°E)作為研究區(qū)域,利用余弦相似系數(shù)(COS)、相似量(R)以及網(wǎng)絡(luò)深度為18層的殘差神經(jīng)網(wǎng)絡(luò)(ResNet18)3種方法對全國持續(xù)性強降水個例日進行客觀分型,比較各方法的分型效果,并建立強降水分型模型庫,為進一步的強降水預(yù)報提供參考。
本文所用資料包括:1981—2018年NCEP/NCAR全球再分析逐日位勢高度場(水平分辨率為2.5°×2.5°),1981—2018年全國區(qū)域持續(xù)性強降水過程歷史個例數(shù)據(jù)集,國家氣象中心提供的1981—2018年我國2474個國家級地面氣象站逐日降水量。
1981—2018年全國區(qū)域持續(xù)性強降水歷史個例數(shù)據(jù)集是牛若蕓等[32]以天氣過程為單元,采用長序列加密觀測的降水量資料和客觀識別與主觀分析相結(jié)合,建立的中國95°E以東地區(qū)及各子區(qū)內(nèi)的區(qū)域性暴雨過程個例譜,該數(shù)據(jù)集具有時間序列長、主客觀相結(jié)合、充分考慮氣象資料統(tǒng)計日界等優(yōu)點。具體判識方法:①基于逐日累計降水量格點資料,逐時次客觀識別出成片暴雨(大雨)區(qū)(日累積降水量達到暴雨(大雨)以上量級(大于50 mm(25 mm))的格點數(shù)不低于15個且相連成片)。相連成片指該區(qū)域內(nèi)的每個格點都至少有另一個格點與之相連(含對角相連)。②以成片暴雨區(qū)出現(xiàn)時間為基點,繪制其前后鄰近時段(各3~7 d)不同層次天氣分析圖并疊加對應(yīng)時刻日累積降水量和成片暴雨(大雨)區(qū);依據(jù)天氣學(xué)原理,主觀考察、分析暴雨過程及其影響系統(tǒng)的演變歷程,“同一次天氣過程中,任一時次出現(xiàn)成片暴雨區(qū)即可記為一次區(qū)域性暴雨過程”。以“首次(末次)出現(xiàn)成片大雨區(qū)的日累積降水量起始時刻(終止時刻)”為該次區(qū)域性暴雨過程起始時刻(終止時刻)。
基于各地行政區(qū)劃和天氣氣候特征,將中國95°E以東地區(qū)分為6個子區(qū),建立各子區(qū)區(qū)域性暴雨過程個例譜。
本文采用經(jīng)驗正交分解(EOF)對持續(xù)性強降水歷史個例集中6個子區(qū)之一的江淮地區(qū)極端持續(xù)性強降水個例進行分析,提取江淮地區(qū)強降水典型模態(tài),以500 hPa典型模態(tài)環(huán)流場作為建立分型模型和環(huán)流客觀分型的基礎(chǔ)。
基于典型模態(tài)環(huán)流場,對所有持續(xù)性強降水個例進行環(huán)流客觀分型。用于比較的分型方法有3種:
①采用余弦相似系數(shù)(COS)進行計算,任意兩個樣本xj和xk看作m維空間的兩個向量,則余弦相似系數(shù)就是這兩個向量夾角的余弦,用cosθjk表示為
(1)
式(1)中,j,k=1,2,…,n。cosθjk=1,表示xj和xk互相平行,方向相同,完全相似。cosθjk=-1,表示xj和xk互相平行但方向相反,完全不相似。
②采用相似量(R)[33-34]進行計算,表達式為
(2)
式(2)中,0≤Rij≤1。當Rij=1時,表示兩個樣本最為相似;當Rij=0時,表示不相似。
③采用經(jīng)過遷移學(xué)習(xí)的殘差神經(jīng)網(wǎng)絡(luò)模型(下文簡稱遷移CNN)[31]進行計算。殘差網(wǎng)絡(luò)通過擬合殘差映射達到網(wǎng)絡(luò)訓(xùn)練的目的。本文采用的是深度為18層的殘差網(wǎng)絡(luò),即卷積層和全連接層,不包括池化層和BN(batch normalization)層。網(wǎng)絡(luò)中的卷積層均由殘差學(xué)習(xí)單元堆疊而成,在一個單元中,假設(shè)原始映射為H(x),殘差網(wǎng)絡(luò)擬合的映射為F(x)=H(x)-x。殘差單元的輸出H(x)=F(x)+x分為兩部分,一部分由網(wǎng)絡(luò)的輸入x經(jīng)過直連路徑恒等映射得到,另一部分由殘差F(x)經(jīng)過網(wǎng)絡(luò)訓(xùn)練得到。
由于樣本量較少,為了盡量避免訓(xùn)練過程中發(fā)生過擬合,使網(wǎng)絡(luò)更快收斂,采用遷移學(xué)習(xí)的方法進行訓(xùn)練。所謂遷移學(xué)習(xí)就是將某個領(lǐng)域或任務(wù)上學(xué)習(xí)到的知識或模式應(yīng)用到不同但相關(guān)的領(lǐng)域或問題中,可有效解決目標領(lǐng)域或問題中僅有少量樣本的學(xué)習(xí)問題。相關(guān)研究表明:在小規(guī)模圖像數(shù)據(jù)集上,運用遷移學(xué)習(xí)方法與直接在目標數(shù)據(jù)集上訓(xùn)練模型相比,圖像識別準確率提高,模型魯棒性增強[35]。
采用合成分析、相關(guān)分析等方法比較以上3種分型方法在客觀分型以及獨立樣本分型上的優(yōu)劣。
本文客觀分型采用1981—2015年資料,獨立樣本檢驗采用2016—2018年資料。
為了提取強降水典型模態(tài),得到用于遷移CNN訓(xùn)練及測試樣本庫資料,這里選擇1981—2015年夏季發(fā)生在江淮地區(qū)的72個極端持續(xù)性強降水個例(共296 d,去掉重復(fù)日期) 進行EOF分解,極端持續(xù)性強降水過程能夠更好地體現(xiàn)江淮強降水特征,在一定程度上確保各降水類型的典型性和準確性。根據(jù)方差貢獻率得到EOF分解的主要模態(tài)(圖1)。由圖1可見,第1模態(tài)呈江淮降水全區(qū)一致的變化趨勢,降水大值中心位于江淮中部略偏南;第2模態(tài)呈南北反向的空間分布;第3模態(tài)呈中部與南北反向變化的趨勢。這3個模態(tài)分別約解釋總方差的25.8%,10.9%和7.1%。取標準化時間系數(shù)大于1的個例日作為該模態(tài)對應(yīng)的基本降水類型(每個個例日只屬于一種類型),并按照3個模態(tài)時間系數(shù)分別選出83 d,79 d 和53 d個例日(共215 d)并對其降水和環(huán)流場進行合成,得到江淮強降水的典型模態(tài)降水分布(圖2)及環(huán)流場,作為進一步客觀分型的基礎(chǔ)。
圖1 江淮地區(qū)持續(xù)性強降水個例EOF分解的前3個模態(tài)Fig.1 Three leading EOF models of persistent heavy rain in Jianghuai Region
圖2 根據(jù)時間系數(shù)合成的江淮地區(qū)典型模態(tài)降水分布Fig.2 Composite rainfall of typical mode patterns from EOF time coefficient in Jianghuai Region
應(yīng)用第2章分析得到的3種模態(tài)個例日83 d,79 d和53 d共215 d進行訓(xùn)練,訓(xùn)練集的損失函數(shù)和準確率在訓(xùn)練開始后很快收斂,但從測試集結(jié)果看,損失函數(shù)基本保持不變,無下降趨勢,準確率同樣在57%左右振蕩,無升高趨勢,說明模型在訓(xùn)練過程中很可能發(fā)生過擬合,從而導(dǎo)致在測試集效果不理想(圖3a和圖3b)。為了避免過擬合發(fā)生,在模型訓(xùn)練過程中加入遷移學(xué)習(xí)的方法,并通過增加樣本進一步提高模型泛化能力,將1981—2015年全國1009個持續(xù)性強降水個例共3179 d(去掉重復(fù)日期)投影到典型模態(tài)[36],并按照第2章時間系數(shù)的標準又選取169 d,共384個樣本。
圖3 遷移CNN訓(xùn)練集與測試集的損失函數(shù)和準確率(a)增加訓(xùn)練樣本前損失函數(shù),(b)增加訓(xùn)練樣本前準確率,(c)增加訓(xùn)練樣本后損失函數(shù),(d)增加訓(xùn)練樣本后準確率Fig.3 The loss and accuracy of training dataset and test dataset of the transfer learning CNN model(a)the loss before adding training samples,(b)the accuracy before adding training samples,(c)the loss after adding training samples,(d)the accuracy after adding training samples
本文在對遷移CNN進行訓(xùn)練時,遷移學(xué)習(xí)應(yīng)用包含兩個部分(圖4) :第1部分是通過在正式訓(xùn)練前加入預(yù)訓(xùn)練模型實現(xiàn)參數(shù)的遷移,預(yù)訓(xùn)練模型的訓(xùn)練樣本即為下文3次遷移訓(xùn)練中第1次所用的284 d,加載基于ImageNet數(shù)據(jù)集訓(xùn)練的ResNet18模型,凍結(jié)卷積層參數(shù),只更新全連接層的參數(shù),這樣預(yù)訓(xùn)練模型既保留了良好的圖像特征提取及特征學(xué)習(xí)的能力,又能夠適用于特定的任務(wù)或問題。在正式訓(xùn)練時直接加載預(yù)訓(xùn)練模型的參數(shù),而不使用隨機初始化的參數(shù),使網(wǎng)絡(luò)能夠更快地收斂。第2部分主要在于3次訓(xùn)練過程,即將訓(xùn)練樣本中隨機挑選的90 d分為3部分,分次投入模型進行訓(xùn)練,第1次訓(xùn)練投入的樣本量為284 d,結(jié)束后保留模型訓(xùn)練得到的相應(yīng)參數(shù)值,帶入到下一次訓(xùn)練,作為模型訓(xùn)練時的初值;第2次訓(xùn)練增加30 d,即訓(xùn)練樣本量達314 d,同理,將第2次訓(xùn)練之后的結(jié)果又帶入第3次訓(xùn)練中;第3次訓(xùn)練再增加30 d使訓(xùn)練樣本量達到344 d,模型訓(xùn)練結(jié)束保留相應(yīng)參數(shù),并統(tǒng)計各型輸出最小值(閾值),測試集樣本量均為40 d。從增加樣本后的訓(xùn)練結(jié)果(圖3c和圖3d)看,測試集損失函數(shù)逐漸下降,準確率逐漸上升,與之前相比有較大提高,遷移CNN和R分型、COS分型在測試集上的準確率分別為85%和70%,77.5%。
圖4 遷移CNN的訓(xùn)練流程Fig.4 Frame of training of transfer learning CNN model
遷移CNN模型建好后,將分型日相應(yīng)環(huán)流場資料輸入模型,得到相應(yīng)的輸出,當輸出最大值不小于閾值則得到相應(yīng)的降水類型,否則為3種降水之外的類型(圖5)。遷移CNN和R分型、COS分型3種方法入選各型的閾值分別為0.995,0.777和0.871。對1981—2015年全國持續(xù)性強降水個例共3179 d進行客觀分型,得到Ⅰ型、Ⅱ型、Ⅲ型分別為724 d,364 d和297 d共1385 d。需要說明的是,這里3179 d是全國區(qū)域的持續(xù)性強降水個例,并非江淮地區(qū)持續(xù)性強降水個例,所以其中有很多不屬于本文所列3種降水類型。為了比較遷移CNN的分型效果,分別應(yīng)用R分型、COS分型方法對樣本進行分型,分別得到3種降水類型個例日為595 d,301 d,489 d和602 d,337 d,446 d。
圖5 遷移CNN分型Fig.5 Frame of pattern classification of the transfer learning CNN model
圖6為1981—2015年3種方法客觀分型后得到的3類強降水的合成分布。由圖6可見,3種方法得到各型強降水的空間分布與EOF典型模態(tài)(圖2)類似,只是強度稍弱。從降水分布看,3種方法Ⅰ型強降水的中心位置較典型模態(tài)均略向南偏移;遷移CNN分型得到的Ⅱ型強降水中心與典型模態(tài)對應(yīng)更好,而COS分型得到的強降水中心位置向南偏移;由遷移CNN分型得到的Ⅲ型強降水的空間分布明顯表現(xiàn)出南北多、中間少的降水空間分布特征,而R分型和COS分型得到的降水在江淮北部的中心不明顯??傮w而言,遷移CNN分型得出的強降水空間分布與典型模態(tài)更為接近。表1為3種方法與典型模態(tài)之間各型強降水的相關(guān)系數(shù),3種方法各型降水合成場平均與圖2典型模態(tài)降水的相關(guān)系數(shù)(平均場相關(guān))均達到0.05顯著性水平,在各型所有個例日與圖2中相應(yīng)典型模態(tài)降水模態(tài)相關(guān)系數(shù)的顯著性檢驗中,遷移CNN和R分型、COS分型達到0.05顯著性水平的個例日分別為1082 d,1018 d,1022 d,這些個例日相關(guān)系數(shù)的平均即為個例日相關(guān),可以發(fā)現(xiàn)遷移CNN得到的各型強降水平均場和個例日的相關(guān)系數(shù)均高于R分型和COS分型的結(jié)果,說明由遷移CNN分型得到的各型個例日的降水分布更符合典型模態(tài)的特征,遷移CNN分型效果更好。
圖6 遷移CNN,R分型和COS分型得到的江淮地區(qū)強降水分布Fig.6 Composite heavy rain patterns in Jianghuai Region by the transfer learning CNN model,R typing and COS typing
表1 遷移CNN,R分型和COS分型得到的各型與典型模態(tài)強降水之間的相關(guān)系數(shù)Table 1 The correlation coefficients between the transfer learning CNN model,R typing,COS typing and heavy rainfall of typical mode patterns
從500 hPa環(huán)流場的演變特征看,3種方法的分型結(jié)果類似(圖略)。圖7為3種方法各型高度場之間的方差,可以看到各時效遷移CNN分型的方差均高于R分型和COS分型,而R分型和COS分型的方差基本相同,說明由遷移CNN得到的各型高度場之間差異更加明顯,遷移CNN能更好地區(qū)分不同強降水類型的環(huán)流場。
為了進一步比較遷移CNN和R分型、COS分型的效果,根據(jù)1981-2015年3種方法客觀分型結(jié)果,選取至少兩種方法分型結(jié)果不一致的個例日共240 d進行比較。分別對不同方法各型降水及環(huán)流進行合成,并計算降水相關(guān)系數(shù)及各型與降水典型模態(tài)500 hPa高度場的方差進行比較。圖8給出3種方法各型與典型模態(tài)環(huán)流場的方差,發(fā)現(xiàn)遷移CNN的方差在Ⅰ型超前4~10 d,Ⅱ型超前0~3 d,Ⅲ型超前0~4 d,略大于R分型和COS分型,總體而言3種方法的方差差別不大,數(shù)值接近。但從降水相關(guān)系數(shù)(表2)看,不論平均場相關(guān),還是個例日相關(guān),遷移CNN的結(jié)果均明顯高于R分型和COS分型,3種方法分別有204 d,174 d,178 d個例日與典型模態(tài)的相關(guān)系數(shù)達到0.05顯著性水平。遷移CNN分型得到的各型的降水平均場相關(guān)系數(shù)分別為0.88,0.98和0.98,均達到0.05顯著性水平,個例日相關(guān)系數(shù)分別為0.35,0.24和0.47。在R分型和COS分型的結(jié)果中,除Ⅱ型強降水的平均場相關(guān)系數(shù)相對較高外,其余數(shù)值均小于0.1,COS分型的Ⅰ型降水合成場甚至為小于-0.5的負相關(guān),R分型的Ⅰ型和Ⅲ型、COS分型的Ⅲ型均未達到0.05顯著性水平。從降水的空間分布(圖9)也可以發(fā)現(xiàn),只有遷移CNN能非常顯著地表現(xiàn)出江淮地區(qū)3種強降水類型的分布特征;而R分型、COS分型的結(jié)果只有Ⅱ型的特征相對符合,Ⅰ型的形態(tài)分布與典型模態(tài)中的Ⅲ型相近,但北方的降水中心位置又與典型模態(tài)相差較大,R分型、COS分型得到的Ⅲ型僅1個中心,不似典型模態(tài)的雙中心形態(tài)分布。結(jié)合對環(huán)流以及降水的分析可見,遷移CNN分型效果明顯優(yōu)于R分型和COS分型。
圖7 遷移CNN,R分型和COS分型得到的各型500 hPa高度場的方差Fig.7 The variance between 500 hPa geopotential height fields of different rainfall types of transfer learning CNN model,R typing and COS typing
圖8 個例日樣本中遷移CNN,R分型和COS分型得到的各型與典型模態(tài)500 hPa高度場的方差Fig.8 The variance of geopotential height field at 500 hPa between transfer learning CNN model,R typing,COS typing and typical mode patterns in samples
為了進一步驗證遷移CNN在客觀分型上的優(yōu)勢,運用3種方法對2016—2018年共1096 d進行客觀分型。這里是針對2016—2018年所有日進行分型,而非針對持續(xù)性強降水個例集的日數(shù)進行分型。首先根據(jù)當日環(huán)流及閾值判斷該日是否屬于區(qū)域強降水相關(guān)的3種類型環(huán)流。當方法輸出小于閾值,表明為非3種類型的強降水環(huán)流,否則根據(jù)輸出判定當日環(huán)流類型。將1096 d個例日的500 hPa環(huán)流場輸入遷移CNN模型,得到相應(yīng)的輸出結(jié)果,并依據(jù)閾值得到Ⅰ型、Ⅱ型、Ⅲ型降水個例日分別為117 d,63 d,55 d共235 d。同樣,應(yīng)用R分型和COS分型得到各型分別為68 d,56 d,59 d共183 d和92 d,66 d,57 d共215 d。在試驗中,隨機選取130 d無降水的500 hPa環(huán)流場輸入遷移CNN模型,發(fā)現(xiàn)其輸出結(jié)果均小于閾值0.995,即不屬于3種降水類型中的任何一種,符合實際情況。對3種方法各型個例日進行比較,得到各型遷移CNN和R分型、COS分型方法結(jié)果均相同的個例日分別為27 d,13 d,8 d共48 d,將相同部分的個例日剔除,計算剩余個例日的各型與典型模態(tài)降水相關(guān)系數(shù)(表3),可以發(fā)現(xiàn)遷移CNN各型的平均場相關(guān)及個例日相關(guān)均高于R分型、COS分型(3種方法平均場相關(guān)均達到0.05顯著性水平,通過檢驗的個例日分別為140 d,85 d,108 d),遷移CNN和COS分型的Ⅲ型平均場相關(guān)相對Ⅰ型、Ⅱ型較小,且COS分型出現(xiàn)負值,而R分型的Ⅱ型平均場相關(guān)明顯小于遷移CNN和COS分型。在3種方法的分型結(jié)果中,分別有115 d,90 d,96 d包含在2016—2018年的77個持續(xù)性強降水個例中。由于歷史個例集為區(qū)域持續(xù)性強降水個例,對持續(xù)日數(shù)有要求,所以用于各方法分型的個例日存在不屬于持續(xù)性強降水的個例日。通過對歷史強降水個例集外遷移CNN分型得到的各型降水合成可見,江淮區(qū)域內(nèi)存在較大的降水,且其分布型跟圖1和圖2中的降水分布相似,由此可見遷移CNN對于非持續(xù)性的強降水環(huán)流型也存在一定的分辨能力。
表2 個例日樣本中遷移CNN,R分型和COS分型得到的各型與典型模態(tài)強降水之間的相關(guān)系數(shù)Table 2 The correlation coefficients between the transfer learning CNN model,R typing,COS typing and heavy rainfall of typical mode patterns in samples
圖9 個例日樣本中遷移CNN,R分型和COS分型3種方法得到的江淮地區(qū)強降水分布Fig.9 Composite heavy rain patterns in Jianghuai Region by the transfer learning CNN model,R typing and COS typing in samples
表3 不同部分樣本中遷移CNN,R分型和COS分型得到的各型與典型模態(tài)強降水之間的相關(guān)系數(shù)Table 3 The correlation coefficients between transfer learning CNN model,R typing,COS typing and heavy rainfall of typical mode patterns in samples of different part
本文運用EOF分解方法對1981—2015年夏季江淮地區(qū)72個極端持續(xù)性強降水個例進行分析并提取江淮強降水及環(huán)流場典型模態(tài),然后運用遷移CNN和R分型、COS分型3種方法對1981—2015年所有個例進行客觀分型,通過合成分析、個例分析比較不同方法在客觀分型上的優(yōu)劣,并對2016—2018年個例進行獨立檢驗。主要結(jié)論如下:
1) 提取典型模態(tài)環(huán)流及降水分布。從江淮持續(xù)性強降水模型庫中選取72個典型個例進行EOF分解,提煉出江淮強降水典型模態(tài)環(huán)流場和降水分布。將個例日降水投影到降水典型模態(tài)得到相應(yīng)的時間系數(shù),由時間系數(shù)確定訓(xùn)練和測試集樣本。
2) 建立江淮持續(xù)性強降水遷移CNN分型模型。運用3次遷移學(xué)習(xí)訓(xùn)練建立遷移CNN分型模型,在模型測試集分型中,遷移CNN和R分型,COS分型的準確率分別為85%,70%,77.5%,以遷移CNN分型準確率最高。
3) 利用3種方法對1981—2015年所有持續(xù)性強降水個例客觀分型結(jié)果的統(tǒng)計分析表明:遷移CNN分型效果較好。遷移CNN得到的各型高度場間方差最大,對各型所有樣本以及不一致樣本的分析表明:各型與典型模態(tài)降水間的相關(guān)系數(shù)遠高于R分型、COS分型方法,且不一致型樣本中,遷移CNN分型得到的各型降水分布具有明顯典型模態(tài)強降水的特征,但R分型、COS分型的型降水除Ⅱ型外幾乎與典型模態(tài)相反。在2016—2018年獨立樣本客觀分型中,遷移CNN方法得到各型與典型模態(tài)降水的相關(guān)系數(shù)高于R分型、COS分型,遷移CNN具有一定分型優(yōu)勢,且對于非持續(xù)性強降水環(huán)流型也存在一定的分辨能力。
本文運用遷移CNN,根據(jù)關(guān)鍵區(qū)域500 hPa 高度場特征,對1981—2015年所有持續(xù)性強降水個例進行客觀分型,并對2016—2018年逐日環(huán)流樣本進行獨立檢驗,結(jié)果表明該方法相較于傳統(tǒng)相似系數(shù)存在一定的優(yōu)越性。在此分型基礎(chǔ)上可得到江淮持續(xù)性強降水對應(yīng)的前期到同期不同層次環(huán)流演變,建立天氣學(xué)概念模型;同時,可進一步結(jié)合模式產(chǎn)品,實現(xiàn)模式對江淮持續(xù)性強降水預(yù)報的訂正等[37]。但以往的研究表明:江淮地區(qū)持續(xù)性強降水在發(fā)生發(fā)展過程中同時受到多層次不同關(guān)鍵系統(tǒng)的影響,除500 hPa中高緯度阻塞高壓、西風(fēng)槽、低緯度西太平洋副熱帶高壓等之外,還有如高空西風(fēng)急流、南亞高壓、低空急流等高低空不同系統(tǒng)的影響,若是將不同層次關(guān)鍵影響因子加入到遷移CNN中,有望進一步提高分型效果,完善區(qū)域歷史強降水模型庫。本文以江淮持續(xù)性強降水事件為例實施遷移CNN分型,該方法也可應(yīng)用到其他天氣事件的分類診斷與預(yù)報中。