亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        三種機(jī)器學(xué)習(xí)方法在廣東雷暴大風(fēng)自動(dòng)識(shí)別的應(yīng)用效果評(píng)估

        2023-10-27 06:34:12蘭宇羅聰伍志方唐思瑜吳林程興國(guó)陳蝶聰
        熱帶氣象學(xué)報(bào) 2023年2期
        關(guān)鍵詞:雷暴大風(fēng)決策樹

        蘭宇,羅聰,伍志方,唐思瑜,吳林,程興國(guó),陳蝶聰

        (1. 廣東省氣象臺(tái)(南海海洋氣象預(yù)報(bào)中心),廣東 廣州 510641;2. 中國(guó)氣象局龍卷風(fēng)重點(diǎn)開放實(shí)驗(yàn)室,廣東 廣州 510641;3. 華南理工大學(xué),廣東 廣州 510641;4. 廣東省生態(tài)氣象中心,廣東 廣州 510641)

        1 引言

        雷暴大風(fēng)是強(qiáng)烈的大氣對(duì)流現(xiàn)象,常造成較大范圍的嚴(yán)重影響[1]。廣東一年四季都可發(fā)生雷暴大風(fēng)?;洷薄蓮V交界的山區(qū)及沿海一帶均是雷暴大風(fēng)多發(fā)區(qū),尤其人口稠密的珠江三角洲地區(qū)是受影響極重的區(qū)域。雷暴大風(fēng)具有生消快、移速快、易致災(zāi)等特點(diǎn),對(duì)人類威脅極大。因此深入研究雷暴大風(fēng)的識(shí)別預(yù)報(bào)和提升短臨預(yù)警能力是十分緊要的。

        新一代天氣雷達(dá)觀測(cè)是雷暴大風(fēng)監(jiān)測(cè)和臨近預(yù)警的主要手段,對(duì)雷暴大風(fēng)的臨近預(yù)報(bào)預(yù)警主要基于雷達(dá)回波特征。俞小鼎等[2-3]指出低層大風(fēng)區(qū)(≥13 m/s)、弓形回波、近地層輻散、中氣旋對(duì)雷暴大風(fēng)具有較好的指示作用。伍志方等[4]研究發(fā)現(xiàn)80%的雷暴大風(fēng)包括下?lián)舯┝髟诙嗥绽账俣葓D上表現(xiàn)為大風(fēng)區(qū)型和近地層輻散型,還有較少比例的中氣旋型大風(fēng)。此外,雷暴大風(fēng)在反射率因子強(qiáng)度及高度、回波移速、垂直累積液態(tài)水含量等特征與強(qiáng)降水的雷達(dá)特征差異明顯[5-6]。

        近年來,機(jī)器學(xué)習(xí)方法在分類識(shí)別、雷達(dá)回波外推等氣象領(lǐng)域取得了很好的應(yīng)用效果,其中傳統(tǒng)機(jī)器學(xué)習(xí)方法在人工選取特征的基礎(chǔ)上,能在數(shù)據(jù)量較小的場(chǎng)景下建立模型。早在2014 年,李國(guó)翠等[7]通過統(tǒng)計(jì)多個(gè)雷達(dá)特征指標(biāo),利用模糊邏輯算法建立了基于多因子的雷暴大風(fēng)自動(dòng)識(shí)別算法,周康輝等[8]在此基礎(chǔ)上通過增加閃電、衛(wèi)星資料來有效識(shí)別雷暴大風(fēng)。此外,國(guó)內(nèi)外學(xué)者也相繼使用決策樹、支持向量機(jī)等傳統(tǒng)機(jī)器學(xué)習(xí)方法開展冰雹和雷暴大風(fēng)的自動(dòng)識(shí)別研究[9-11]。

        隨著觀測(cè)資料不斷豐富、計(jì)算機(jī)性能持續(xù)優(yōu)化,以深度學(xué)習(xí)為代表的人工智能方法在氣象上應(yīng)用逐漸增多。深度學(xué)習(xí)省略了傳統(tǒng)機(jī)器學(xué)習(xí)方法中人為選取特征的過程,基于海量數(shù)據(jù)基礎(chǔ)上,通過多隱層的層次結(jié)構(gòu)式神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,深度挖掘特征,從而構(gòu)建出性能好的學(xué)習(xí)模型。香港科技大學(xué)的學(xué)者率先提出卷積長(zhǎng)短期記憶單元網(wǎng)絡(luò)算法(ConvLSTM)優(yōu)于普通的光流法外推預(yù)報(bào)[12],Wang 等[13-15]先 后 提 出 PredRNN、PredRNN++、MIM 等算法用于臨近預(yù)報(bào)均有較好效果。陳元昭等[16]研究發(fā)現(xiàn)基于生成對(duì)抗網(wǎng)絡(luò)的臨近預(yù)報(bào)方法對(duì)于中等強(qiáng)度回波預(yù)報(bào)效果較好,顧建峰等[17]運(yùn)用Traj-GRU建立強(qiáng)對(duì)流雷達(dá)回波預(yù)報(bào)模型,并利用U-net建立了雷暴大風(fēng)和冰雹的智能識(shí)別模型。由此看來,目前在氣象領(lǐng)域中,深度學(xué)習(xí)方法多應(yīng)用于短臨外推預(yù)報(bào),雷暴大風(fēng)智能識(shí)別方面研究尚較少,華南地區(qū)相應(yīng)研究有待進(jìn)一步深入開展。

        因此,本文分別選取傳統(tǒng)機(jī)器學(xué)習(xí)方法(決策樹)和深度學(xué)習(xí)方法(CNN 和YOLO)等3 種方法,利用廣東省地面自動(dòng)站所觀測(cè)的雷暴大風(fēng)記錄及相對(duì)應(yīng)的雷達(dá)拼圖數(shù)據(jù),分別建立3種雷暴大風(fēng)自動(dòng)識(shí)別模型,并針對(duì)3 種模型開展檢驗(yàn)評(píng)估,以對(duì)比傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法在廣東雷暴大風(fēng)識(shí)別上的應(yīng)用效果,確立最優(yōu)識(shí)別模型并最終實(shí)現(xiàn)識(shí)別算法的業(yè)務(wù)化運(yùn)行,為建設(shè)廣東雷暴大風(fēng)實(shí)時(shí)監(jiān)測(cè)體系、提高預(yù)警預(yù)報(bào)的準(zhǔn)確率、提升預(yù)警提前量提供技術(shù)和產(chǎn)品支撐。

        2 數(shù)據(jù)與方法

        2.1 數(shù)據(jù)資料

        選取廣東省2012—2020年全年雷暴大風(fēng)天氣過程中自動(dòng)氣象站5 min加密瞬時(shí)風(fēng)觀測(cè)數(shù)據(jù),及對(duì)應(yīng)的廣東省反射率因子、組合反射率因子、回波頂高、垂直累積液態(tài)水含量等雷達(dá)拼圖數(shù)據(jù),拼圖數(shù)據(jù)為廣東省氣象局業(yè)務(wù)化應(yīng)用拼圖,已經(jīng)過雜波抑制、孤立噪聲過濾、中值濾波和雙線性插值填補(bǔ)等數(shù)據(jù)質(zhì)量控制,數(shù)據(jù)來源于廣東省11 部S 波段天氣雷達(dá)數(shù)據(jù)。拼圖數(shù)據(jù)空間分辨率為1 km×1 km,格點(diǎn)數(shù)為1 050×880,時(shí)間分辨率6 min,垂直方向共21層。

        雷暴大風(fēng)自動(dòng)站觀測(cè)實(shí)況的篩選條件為:自動(dòng)站觀測(cè)瞬時(shí)風(fēng)速≥17.2 m/s(下文中大風(fēng)均代表風(fēng)力達(dá)到8 級(jí)以上),同時(shí)周圍10 km 范圍內(nèi)存在雷電活動(dòng)及反射率因子大于30 dBZ,并剔除了站點(diǎn)海拔高于200 m、海上浮標(biāo)站及強(qiáng)冷空氣過程、臺(tái)風(fēng)直接影響等引起的大風(fēng)記錄。由于相比一般性天氣而言,雷暴大風(fēng)觀測(cè)記錄較少,在廣東全省范圍內(nèi)屬小概率事件,雷暴大風(fēng)正、負(fù)樣本比例需適宜,以避免出現(xiàn)樣本失衡和數(shù)據(jù)偏差,兼顧模型運(yùn)行所耗計(jì)算資源、訓(xùn)練效率和識(shí)別效果,最終挑選了17 470個(gè)大風(fēng)正樣本和34 950個(gè)無大風(fēng)負(fù)樣本,正、負(fù)樣本比例為1∶2。(注:一次雷暴大風(fēng)觀測(cè)記錄(即符合雷暴大風(fēng)判定條件的觀測(cè)數(shù)據(jù))記為一個(gè)正樣本,反之則作為負(fù)樣本。)

        2.2 標(biāo)簽集制作

        讀取雷暴大風(fēng)觀測(cè)數(shù)據(jù)中的經(jīng)緯度,將其轉(zhuǎn)換成以拼圖左上角為起始點(diǎn),右下角為結(jié)束點(diǎn)的圖像坐標(biāo)系(圖1)中的坐標(biāo),考慮到自動(dòng)站觀測(cè)范圍代表性,制作標(biāo)簽時(shí)設(shè)定雷暴大風(fēng)影響范圍為16 km,在此條件下,獲得如(Xt,Yt,16,16)的標(biāo)簽,其中(Xt,Yt)為該雷暴大風(fēng)記錄點(diǎn)在新坐標(biāo)系中的橫縱坐標(biāo),(16,16)為雷暴大風(fēng)的矩形影響范圍;將與出現(xiàn)雷暴大風(fēng)對(duì)應(yīng)時(shí)刻(或相鄰最近時(shí)刻)的各類拼圖數(shù)據(jù)轉(zhuǎn)換為圖像產(chǎn)品并標(biāo)記為class,最終得到用于機(jī)器學(xué)習(xí)模型的標(biāo)簽集(class,Xt,Yt,16,16),按照一定比例隨機(jī)選取將標(biāo)簽集分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。

        圖1 用于機(jī)器學(xué)習(xí)的雷暴大風(fēng)標(biāo)簽集制作

        2.3 訓(xùn)練與檢驗(yàn)

        本文共采用2012—2019 年共52 420 個(gè)數(shù)據(jù)集,并按照7∶2∶1 比例劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集用于算法建模,其中訓(xùn)練集用于訓(xùn)練模型,驗(yàn)證集用于模型參數(shù)調(diào)整和優(yōu)化,測(cè)試集不參與特征選取、參數(shù)調(diào)整等訓(xùn)練,只用于測(cè)試模型對(duì)雷暴大風(fēng)的識(shí)別能力。通過訓(xùn)練、驗(yàn)證和調(diào)參不斷循環(huán)使識(shí)別模型達(dá)到最優(yōu)識(shí)別效果后,模型參數(shù)方案即最終確立不再更改,后續(xù)的檢驗(yàn)評(píng)估均沿用此方案。鑒于雷暴大風(fēng)的小概率事件特性,而日常預(yù)報(bào)預(yù)警業(yè)務(wù)中針對(duì)其高致災(zāi)性常采用寧空勿漏的防御策略,因此在本文中訓(xùn)練和評(píng)價(jià)模型能力同時(shí)采用了命中率POD、虛警率FAR 以及臨界成功指數(shù)CSI 作為訓(xùn)練和評(píng)價(jià)指標(biāo)進(jìn)行定量檢驗(yàn)[18],旨在避免漏報(bào)的情形下盡量減少空?qǐng)?bào),提高命中。

        本文中,命中并非時(shí)間和空間嚴(yán)格點(diǎn)對(duì)點(diǎn),而是根據(jù)自動(dòng)站觀測(cè)間隔,T時(shí)刻算法識(shí)別到大風(fēng)落在[T-5 min,T+5 min]時(shí)間窗內(nèi)、真實(shí)實(shí)況大風(fēng)標(biāo)簽16 km×16 km 范圍內(nèi)即記為命中,算法識(shí)別到大風(fēng)但未落在相應(yīng)范圍內(nèi)或無大風(fēng)實(shí)況則記為空?qǐng)?bào),存在大風(fēng)實(shí)況而無識(shí)別結(jié)果相對(duì)應(yīng)則記為大風(fēng)漏報(bào)。命中率POD、虛警率FAR、臨界成功指數(shù)CSI的計(jì)算公式如下:

        說明:NA 為命中數(shù),NB 為空?qǐng)?bào)數(shù),NC 為漏報(bào)數(shù)。

        3 模型介紹

        3.1 決策樹模型

        3.1.1 決策樹模型結(jié)構(gòu)

        決策樹(Decision Tree)是一種基本的分類與回歸方法,決策樹模型呈樹形結(jié)構(gòu),在分類中表示基于特征對(duì)實(shí)例進(jìn)行分類的過程[19]。其主要優(yōu)點(diǎn)是:模型具有可讀性,分類速度快。學(xué)習(xí)時(shí)利用訓(xùn)練數(shù)據(jù),根據(jù)損失函數(shù)最小化原則建立決策樹模型。決策樹學(xué)習(xí)通常包括三個(gè)步驟:特征選擇、決策樹的生成、決策樹的修剪(圖2)。

        圖2 決策樹模型結(jié)構(gòu)示意圖

        決策樹由結(jié)點(diǎn)和有向邊組成,決策樹模型構(gòu)建過程:先構(gòu)建根結(jié)點(diǎn),將所有訓(xùn)練數(shù)據(jù)都放在根結(jié)點(diǎn)。選擇一個(gè)最優(yōu)特征,按照這一特征將訓(xùn)練數(shù)據(jù)集分割成子集,使得各個(gè)子集有一個(gè)在當(dāng)前條件下最好的分類。如果這些子集已經(jīng)能夠被基本正確分類,那么構(gòu)建葉結(jié)點(diǎn),并將這些子集分配到對(duì)應(yīng)的葉結(jié)點(diǎn)中去;如果還有子集不能夠被基本正確分類,那么對(duì)這些子集選擇最優(yōu)特征,繼續(xù)對(duì)其進(jìn)行分割,構(gòu)建相應(yīng)的結(jié)點(diǎn)。如此遞歸下去,直至所有訓(xùn)練數(shù)據(jù)子集被基本正確分類或者沒有合適的特征為止。最后每個(gè)子集都被分到葉結(jié)點(diǎn)上,即都有了明確的類,從而生成了一棵決策樹。

        3.1.2 特征因子選取

        通過結(jié)合以往的雷暴大風(fēng)特征研究以及預(yù)報(bào)員日常值班中經(jīng)驗(yàn)總結(jié),歸納總結(jié)了以下對(duì)雷暴大風(fēng)識(shí)別預(yù)警具有指示意義的特征因子,用于建立決策樹模型。

        (1) 組合反射率因子強(qiáng)度。該因子是雷達(dá)一個(gè)體掃中不同高度反射率因子的最大值。有研究發(fā)現(xiàn)回波中心強(qiáng)度低于55 dBZ 時(shí),出現(xiàn)大風(fēng)的概率很小[20];周康輝等[8]通過統(tǒng)計(jì)也發(fā)現(xiàn),雷暴大風(fēng)的反射率因子強(qiáng)度主要分布均超過30 dBZ,峰值分布于53 dBZ。因此,反射率因子強(qiáng)度對(duì)于雷暴大風(fēng)具有很高指示意義。

        (2) 反射率因子強(qiáng)度梯度。通常雷暴大風(fēng)出現(xiàn)在雷達(dá)回波強(qiáng)且伴有強(qiáng)梯度的區(qū)域,尤其當(dāng)回波形態(tài)上具有典型帶狀、弓狀或者鉤狀特征時(shí),地面大風(fēng)多出現(xiàn)在強(qiáng)度梯度大值區(qū)域[21-22]。

        (3) 垂直累積液態(tài)水含量(后文統(tǒng)稱VIL)。該因子表示的是將反射率因子數(shù)據(jù)轉(zhuǎn)換成等價(jià)的液態(tài)水值,并且假定反射率因子是完全由液態(tài)水反射得到的。有研究對(duì)雷暴大風(fēng)出現(xiàn)前的VIL 進(jìn)行統(tǒng)計(jì)發(fā)現(xiàn),VIL值達(dá)到30 kg/m2是地面災(zāi)害大風(fēng)出現(xiàn)的閾值,VIL值達(dá)到或超過40 kg/m2可以作為地面災(zāi)害大風(fēng)的一個(gè)預(yù)報(bào)指標(biāo);且VIL 值快速下降也常表征雷暴大風(fēng)的出現(xiàn)[23]。

        (4) 回波頂高。已有學(xué)者在多個(gè)雷暴大風(fēng)個(gè)例的回波特征研究中發(fā)現(xiàn)雷暴大風(fēng)通常與較高回波頂高相對(duì)應(yīng)[24]。李國(guó)翠等[7]統(tǒng)計(jì)結(jié)果表明雷暴大風(fēng)與回波頂高具有較好的正相關(guān)關(guān)系,可以用作雷暴大風(fēng)識(shí)別的一個(gè)特征因子。

        (5) 50 dBZ 高度。華南短時(shí)強(qiáng)降水多暖云降水,其回波中心高度常常位于0 ℃層高度附近或以下,而產(chǎn)生雷暴大風(fēng)的雷暴體對(duì)流往往發(fā)展更為旺盛,強(qiáng)回波垂直伸展高度可達(dá)-20 ℃層以上,在華南地區(qū)-20 ℃層常高于7 km[25]。與此同時(shí),當(dāng)反射率因子強(qiáng)度低于50 dBZ 時(shí)雷暴大風(fēng)出現(xiàn)概率較低,因此,可選取50 dBZ 回波出現(xiàn)的高度作為雷暴大風(fēng)的特征因子用于識(shí)別[26]。

        考慮到雷達(dá)特征因子與地面雷暴大風(fēng)的出現(xiàn)時(shí)刻并非完全嚴(yán)格對(duì)應(yīng),且部分雷達(dá)特征隨時(shí)間推移的強(qiáng)度、位置變化更能表征雷暴大風(fēng),因此除提取上述因子T時(shí)刻特征值外,還提取了ΔT(T-6 min,T+6 min)在12 min 內(nèi)的變化值共10 個(gè)因子用于模型建立。

        3.2 CNN模型

        卷積神經(jīng)網(wǎng)絡(luò)(CNN),是一種包含卷積計(jì)算且具有深度結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)的代表算法之一,可以進(jìn)行監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí),是分類識(shí)別主流模型之一[27],在本文中應(yīng)用此模型進(jìn)行監(jiān)督學(xué)習(xí)。CNN的原理為通過一個(gè)特定的濾波器,不斷與圖片做卷積來提取特征,從局部特征到總體特征,從而實(shí)現(xiàn)圖像識(shí)別的功能。其整體結(jié)構(gòu)包含3 種層(layer)。第一層為卷積層(CONV),由濾波器和激活函數(shù)構(gòu)成,涉及到濾波器數(shù)量、大小、補(bǔ)償?shù)瘸瑓?shù)。第二層為池化層(POOL),亦稱下采樣或欠采樣,其功能為特征降維,壓縮數(shù)據(jù)和參數(shù)數(shù)量,減少過擬合同時(shí)提高模型的容錯(cuò)率。第三層為全連接層(FC),亦稱輸出層,全連接層為多個(gè)神經(jīng)元單元排列連接組成,其功能為觀察上一層的輸出并確定所提取的特征與目標(biāo)分類的吻合度,并得到模型識(shí)別輸出[28],模型結(jié)構(gòu)如圖3所示。

        圖3 CNN卷積神經(jīng)網(wǎng)絡(luò)層級(jí)結(jié)構(gòu)示意圖

        3.3 YOLO模型

        YOLO(You only look once)是一種目標(biāo)檢測(cè)模型,用來在一張圖片中尋找某些特定目標(biāo)物體,不需要預(yù)先提取候選區(qū)域,通過一個(gè)網(wǎng)絡(luò)就可以輸出目標(biāo)類別、置信度和坐標(biāo)位置[29]。YOLOv3是YOLO 算法中的第三版,相比于之前的算法,識(shí)別精度有所提升[30]。YOLOv3 是一個(gè)龐大且豐富的深度卷積神經(jīng)網(wǎng)絡(luò)模型,一共有53 個(gè)全連接卷積層,因此又稱為Darknet-53[31](圖4)。

        圖4 YOLOv3網(wǎng)絡(luò)結(jié)構(gòu)圖

        模型首先將輸入圖片統(tǒng)一縮放至416×416 像素,將照片分割為N個(gè)大小相等的網(wǎng)格,并對(duì)每個(gè)網(wǎng)格中的物體進(jìn)行識(shí)別。包括識(shí)別物的中心位置(x,y)、識(shí)別的置信度及識(shí)別物的類別。置信度即為模型識(shí)別物體為目標(biāo)物的自信程度,置信度越高,意味著模型檢測(cè)越嚴(yán)格,對(duì)于識(shí)別結(jié)果也越自信。YOLO 模型可以輸出不同置信度下目標(biāo)識(shí)別結(jié)果,本文中所有YOLO 模型的輸出結(jié)果均是置信度為0.7時(shí)的識(shí)別結(jié)果。

        相較于YOLO的v1、v2版本,YOLOv3版擁有3 個(gè)特征尺度,即可以同時(shí)使用3 個(gè)特征層分別進(jìn)行卷積和預(yù)測(cè)識(shí)別,這意味著模型可以允許同時(shí)輸入3 張不同高度的雷達(dá)回波進(jìn)行識(shí)別。為了使YOLOv3 更好描述雷暴大風(fēng)的空間結(jié)構(gòu)特征,本文在實(shí)際模型訓(xùn)練時(shí),對(duì)原版YOLOv3(后文統(tǒng)一簡(jiǎn)稱YOLO)的網(wǎng)絡(luò)進(jìn)行改進(jìn),將其特征尺度層擴(kuò)展到11 層,即允許同時(shí)將11 層不同高度的雷達(dá)拼圖作為輸入層,從而可以更詳細(xì)地反演雷暴大風(fēng)的空間結(jié)構(gòu)特征供模型提取和學(xué)習(xí)。本文即將1~9 km 高度(高度分別分為1、2、3、4、5、6、7、7.5、8、8.5、9 km)共11 層的雷達(dá)拼圖作為輸入層,用于模型檢測(cè)識(shí)別對(duì)YOLOv3 進(jìn)行訓(xùn)練優(yōu)化,形成YOLOv3版雷暴大風(fēng)識(shí)別模型。

        4 模型算法檢驗(yàn)分析

        4.1 三種模型算法的檢驗(yàn)對(duì)比分析

        4.1.1 批量檢驗(yàn)分析

        為驗(yàn)證三種模型算法的識(shí)別效果,利用測(cè)試集(共5 242 個(gè)樣本)分別對(duì)3 個(gè)模型進(jìn)行批量識(shí)別測(cè)試,測(cè)試結(jié)果如表1 所示。結(jié)果表明:決策樹模型的命中率高于CNN,略低于YOLO,但虛警率偏高,為3個(gè)模型中最高達(dá)到0.57,即空?qǐng)?bào)偏多,導(dǎo)致CSI低于CNN 和YOLO;3 個(gè)模型中YOLO 的表現(xiàn)最為優(yōu)異,POD 和CSI分別為0.994、0.685,均為最高,且CSI 明顯高于其他兩個(gè)模型,表明YOLO 模型相較于另外兩種模型有更好的識(shí)別能力。

        表1 三種模型識(shí)別效果批量測(cè)試對(duì)比

        4.1.2 颮線個(gè)例檢驗(yàn)分析

        2016年4月12日夜間受高空槽配合低渦切變線、低空西南急流影響,華南地區(qū)出現(xiàn)了一次大范圍颮線過程,伴隨著雷暴大風(fēng)、短時(shí)強(qiáng)降水等強(qiáng)對(duì)流天氣,對(duì)流回波于12日20時(shí)(北京時(shí)間,下同)開始自廣西境內(nèi)逐漸東移南壓,東移過程中回波逐漸高度組織化,13 日03 時(shí)左右東移至兩廣交界時(shí)發(fā)展為東北西南走向的颮線,進(jìn)入廣東境內(nèi)后回波發(fā)展旺盛,移速加快達(dá)到100 km/h以上,并逐漸形成弓狀,弓形回波主要影響肇慶、佛山、廣州、東莞一帶,造成上述地區(qū)10級(jí)以上雷暴大風(fēng)天氣,大風(fēng)主要出現(xiàn)在弓形回波附近,弓狀回波凸起經(jīng)過的區(qū)域多個(gè)站次監(jiān)測(cè)到12 級(jí)以上大風(fēng),經(jīng)篩選4月13 日04—06 時(shí)共取得符合標(biāo)準(zhǔn)的大風(fēng)觀測(cè)記錄214個(gè)。

        將4月13日04—06時(shí)相應(yīng)的雷達(dá)回波作為輸入層同時(shí)運(yùn)行3個(gè)模型進(jìn)行識(shí)別,并對(duì)識(shí)別結(jié)果進(jìn)行檢驗(yàn)評(píng)估(表2)。整體來看個(gè)例檢驗(yàn)結(jié)果與批量測(cè)試結(jié)果類似,3個(gè)模型中YOLO對(duì)于此次颮線過程大風(fēng)的識(shí)別效果最好,POD 和CSI 均最高,F(xiàn)AR 最低,分別為0.981、0.667 和0.325,且YOLO模型的CSI 較其他兩個(gè)模型提升較明顯;決策樹的POD 略高于CNN,但CSI 更低,這主要因?yàn)闆Q策樹模型的識(shí)別偏差來源于更多的空?qǐng)?bào)。

        表2 2016年4月13日颮線型雷暴大風(fēng)天氣過程識(shí)別評(píng)估結(jié)果

        4.1.3 混合對(duì)流個(gè)例檢驗(yàn)分析

        2019年3月2—3日,華南地區(qū)有高空槽過境,配合低層850 hPa的切變線和西南急流,廣東自北向南自西向東出現(xiàn)了一次雷暴大風(fēng)、伴隨著短時(shí)強(qiáng)降水等強(qiáng)對(duì)流的天氣過程。2 日夜間(2 日23 時(shí)—3 日02 時(shí))系統(tǒng)主要影響廣東北部的韶關(guān)、清遠(yuǎn)等地區(qū),對(duì)流回波在移動(dòng)過程逐漸密實(shí)呈現(xiàn)塊狀,反射率因子最強(qiáng)達(dá)60 dBZ,移入韶關(guān)中部后組織為線狀對(duì)流并呈弓形,移速加快,引起韶關(guān)地區(qū)降水有所減弱但雷暴大風(fēng)明顯增強(qiáng),整個(gè)過程中韶關(guān)、清遠(yuǎn)出現(xiàn)了8~9級(jí)雷暴大風(fēng),其中韶關(guān)乳源國(guó)家氣象站觀測(cè)到27.2 m/s(10 級(jí))的大風(fēng),經(jīng)篩選3月2 日23 時(shí)—3 日02 時(shí)共取得大風(fēng)觀測(cè)記錄28個(gè)。

        將3 個(gè)模型對(duì)此次過程的識(shí)別結(jié)果進(jìn)行檢驗(yàn)評(píng)估(表3)。對(duì)比來看,3 個(gè)模型在本次過程中的表現(xiàn)與4.1.2 節(jié)的個(gè)例(簡(jiǎn)稱個(gè)例一)類似,YOLO模型識(shí)別效果最好,POD 和CSI 均最高,且其漏報(bào)數(shù)為0;決策樹同樣表現(xiàn)出比CNN 模型更高的POD 和更低的CSI。值得注意的是,相較于個(gè)例一的颮線過程,此次過程中3個(gè)模型均表現(xiàn)出更高的空?qǐng)?bào),造成空?qǐng)?bào)增加的原因主要有兩個(gè):一方面相比于本次由多單體風(fēng)暴引起的大風(fēng)和強(qiáng)降水混合過程,個(gè)例一為典型弓形颮線過程,具有更鮮明的雷暴大風(fēng)特征,更易于捕捉識(shí)別;另一方面,個(gè)例一發(fā)生在全廣東氣象自動(dòng)站分布最密集的珠三角,而本次過程發(fā)生在北部高海拔山區(qū),氣象自動(dòng)站分布相對(duì)稀疏,且部分氣象站觀測(cè)記錄因海拔高達(dá)300~400 m 以上而被剔除,使得實(shí)際出現(xiàn)了大風(fēng)但未被觀測(cè)到或因海拔太高不符合標(biāo)準(zhǔn)被剔除的情況出現(xiàn)。

        表3 2019年3月2日雷暴大風(fēng)、強(qiáng)降水混合天氣過程識(shí)別評(píng)估結(jié)果

        4.2 YOLO模型算法檢驗(yàn)分析

        通過對(duì)3 個(gè)模型識(shí)別能力測(cè)試對(duì)比發(fā)現(xiàn),YOLO 模型識(shí)別能力最好,確立為最優(yōu)模型。進(jìn)而選取廣東省2020 年3—8 月的雷暴大風(fēng)過程,依據(jù)天氣形勢(shì)劃分為局地性雷暴大風(fēng)過程、系統(tǒng)性雷暴大風(fēng)過程兩類分別對(duì)該最優(yōu)模型進(jìn)行檢驗(yàn)評(píng)估,本文定義局地性雷暴大風(fēng)為無明顯天氣系統(tǒng)存在的弱天氣尺度強(qiáng)迫條件下產(chǎn)生的天氣過程,如副高邊緣不穩(wěn)定區(qū)、夏季午后中尺度輻合線觸發(fā)熱對(duì)流等。系統(tǒng)性過程則為高低空有天氣系統(tǒng)配合、存在較強(qiáng)天氣尺度強(qiáng)迫的強(qiáng)垂直不穩(wěn)定條件下產(chǎn)生的天氣過程,如高空槽、切變線過境影響等。

        檢驗(yàn)同樣采用POD、FAR和CSI等3個(gè)指標(biāo)進(jìn)行評(píng)估,其中用于檢驗(yàn)的自動(dòng)站實(shí)況觀測(cè)記錄采用前文2.1 節(jié)所述的篩選條件得到。基于后續(xù)將算法投入業(yè)務(wù)化使用的需求,本文增加了最長(zhǎng)達(dá)30 天連續(xù)時(shí)間段內(nèi)任意天氣的識(shí)別檢驗(yàn),以測(cè)試該模型算法業(yè)務(wù)化識(shí)別能力。

        4.2.1 分類個(gè)例分析

        4.2.1.1 局地性雷暴大風(fēng)過程識(shí)別分析

        2020年7月14日菲律賓以東洋面有熱帶擾動(dòng)發(fā)展并西移進(jìn)入南海,此時(shí)500 hPa副熱帶高壓偏強(qiáng)偏北,廣東東部位于副熱帶高壓南部邊緣不穩(wěn)定區(qū)內(nèi),午后熱力作用和地面輻合線觸發(fā)引起了局地強(qiáng)雷暴發(fā)展,多個(gè)雷暴單體于福建南部生成并逐漸向西南移動(dòng),初始回波較松散,移動(dòng)過程中逐漸加強(qiáng)合并為多單體風(fēng)暴,回波漸呈現(xiàn)為密實(shí)塊狀,反射率因子最強(qiáng)達(dá)60 dBZ。受此影響,粵東地區(qū)夜間20—21 時(shí)出現(xiàn)了8~9 級(jí)雷暴大風(fēng),最大達(dá)10 級(jí)(26.7 m/s),此次過程自動(dòng)站共錄得大風(fēng)20站次。

        對(duì)于此次局地性過程YOLO 算法識(shí)別效果較好(圖5),過程出現(xiàn)的所有8級(jí)以上大風(fēng)均能識(shí)別,無一漏報(bào);但同時(shí)存在2 站次空?qǐng)?bào),其中有一個(gè)站次識(shí)別結(jié)果對(duì)應(yīng)了瞬時(shí)風(fēng)6 級(jí)風(fēng)實(shí)況,其POD、FAR和CSI分別為1.000、0.091和0.909。

        圖5 2020年7月14日20—21時(shí)實(shí)況大風(fēng)與算法識(shí)別結(jié)果分布情況

        4.2.1.2 系統(tǒng)性雷暴大風(fēng)過程識(shí)別分析

        受高空槽、低空切變線和低空急流共同影響,2020年6月5—9日華南地區(qū)出現(xiàn)了一次“龍舟水”過程,雨勢(shì)強(qiáng)烈并伴隨8~9 級(jí)雷暴大風(fēng)。9 日13時(shí)前后強(qiáng)對(duì)流回波主體位于廣東西北部一帶,南部有零散對(duì)流單體發(fā)展,反射率因子強(qiáng)度40~50 dBZ,隨著東北移,其南部回波明顯加強(qiáng)并逐漸組織為短弓形線狀強(qiáng)回波,反射率因子最強(qiáng)達(dá)60 dBZ,弓形回波主要影響珠三角的西部和北部。受此影響,15—17 時(shí)珠三角多個(gè)市縣錄得8~9 級(jí)瞬時(shí)大風(fēng),此次過程經(jīng)篩選共取得大風(fēng)17 站次。YOLO 模型算法對(duì)于此次過程出現(xiàn)的所有大風(fēng)均成功識(shí)別,無漏報(bào)情況(圖6),但相比于7 月14 日過程的識(shí)別結(jié)果,本次過程的虛警站次有所增加,共有7 站次的虛警,究其原因主要為兩方面:一方面本過程發(fā)生在華南“龍舟水”期間,伴隨著局地小時(shí)雨量50~60 mm 的短時(shí)強(qiáng)降水,雷達(dá)特征更加復(fù)雜,識(shí)別難度相對(duì)更高;另一方面,虛警識(shí)別主要出現(xiàn)在清遠(yuǎn)和廣州交界的山區(qū),自動(dòng)站分布相對(duì)稀疏,海拔也較高,部分觀測(cè)站點(diǎn)海拔達(dá)800 m以上。

        圖6 2020年6月9日15—17時(shí)實(shí)況大風(fēng)與算法識(shí)別結(jié)果分布情況

        4.2.2 分類批量檢驗(yàn)

        4.2.2.1 局地性過程批量檢驗(yàn)

        選取廣東省2020 年7 月5 次局地性雷暴大風(fēng)過程共71 個(gè)大風(fēng)樣本進(jìn)行識(shí)別檢驗(yàn),5 次天氣過程均由于處在副熱帶高壓邊緣不穩(wěn)定區(qū),配合低層南風(fēng)和充足的不穩(wěn)定能量而引起。將上述過程相應(yīng)高度的雷達(dá)回波拼圖輸入識(shí)別模型,得到相應(yīng)的識(shí)別結(jié)果并對(duì)其進(jìn)行檢驗(yàn)評(píng)估,結(jié)果表明:YOLO 算法對(duì)于局地性雷暴大風(fēng)過程的大風(fēng)識(shí)別命中率為0.958,相較于測(cè)試集結(jié)果略有下降(表4)。

        表4 基于YOLO的識(shí)別模型對(duì)于局地性天氣過程識(shí)別能力的評(píng)估

        4.2.2.2 系統(tǒng)性過程批量檢驗(yàn)

        選取廣東省2020 年3 月和6 月共5 次系統(tǒng)性天氣過程,其中包含2 次颮線過程,共148 個(gè)大風(fēng)樣本進(jìn)行識(shí)別檢驗(yàn)。5 次天氣過程主要由高空槽過境配合低層切變線影響廣東地區(qū)而出現(xiàn)了雷暴大風(fēng)天氣。檢驗(yàn)評(píng)估表明:相比局地性過程,識(shí)別算法對(duì)于系統(tǒng)性雷暴大風(fēng)過程的識(shí)別效果略有提升,命中率達(dá)0.986,虛警率亦有下降,CSI 較局地性過程提高了0.06(表4);對(duì)比測(cè)試集的檢驗(yàn)結(jié)果,該模型算法的識(shí)別能力略有下降,說明本算法模型仍存在一定過擬合現(xiàn)象。

        4.2.3 YOLO模型算法的業(yè)務(wù)應(yīng)用評(píng)估

        基于識(shí)別算法業(yè)務(wù)化的需要,選取2020 年5月全月(廣東前汛期)和8月全月(廣東后汛期)兩個(gè)長(zhǎng)連續(xù)時(shí)間段進(jìn)行自動(dòng)識(shí)別檢驗(yàn),兩個(gè)時(shí)間段涵蓋了前汛期和后汛期兩類環(huán)流形勢(shì)下、不同環(huán)境條件引起的弱降水過程、強(qiáng)降水、雷暴大風(fēng)和冰雹等強(qiáng)對(duì)流天氣過程,共1 520個(gè)大風(fēng)樣本。

        檢驗(yàn)結(jié)果表明:基于YOLO 模型的識(shí)別算法在長(zhǎng)達(dá)30天連續(xù)時(shí)段內(nèi)任意天氣條件下的雷暴大風(fēng)識(shí)別能力仍較高,其POD 和CSI分別為0.939 和0.601,尤其漏報(bào)比率低,具備投入業(yè)務(wù)化使用的條件(表5)。

        表5 基于YOLO的識(shí)別模型在連續(xù)時(shí)段內(nèi)識(shí)別能力的評(píng)估

        4.3 識(shí)別算法實(shí)時(shí)運(yùn)行效果評(píng)估

        基于YOLO 模型的識(shí)別算法已于2021 年1 月接入實(shí)時(shí)雷達(dá)數(shù)據(jù),并投入業(yè)務(wù)化試運(yùn)行,可根據(jù)實(shí)時(shí)拼圖每6 min 穩(wěn)定更新識(shí)別結(jié)果。經(jīng)收集篩選2021年全年符合條件的雷暴大風(fēng)觀測(cè)記錄共有1 603 個(gè),其中8~9 級(jí)有1 558 個(gè),10 級(jí)及以上有45個(gè)。結(jié)合算法運(yùn)行全年的識(shí)別結(jié)果進(jìn)行評(píng)估分析(表6),在全年實(shí)時(shí)運(yùn)行條件下,識(shí)別算法對(duì)于任意天氣形勢(shì)下產(chǎn)生的雷暴大風(fēng)識(shí)別命中率仍超過90%,CSI 為0.629,與2020 年5 月和8 月全月運(yùn)行的結(jié)果相比,識(shí)別效果略有波動(dòng),但波動(dòng)較小,其中命中率略有下降,同時(shí)虛警率也下降,而CSI有所提升。

        表6 2021年全年雷暴大風(fēng)過程識(shí)別效果評(píng)估結(jié)果

        5 結(jié)論與討論

        本文基于2012—2019年廣東省的雷達(dá)拼圖和加密自動(dòng)氣象站極大風(fēng)觀測(cè)數(shù)據(jù),分別利用決策樹、CNN 和YOLO 三種模型建立了雷暴大風(fēng)自動(dòng)識(shí)別算法,并利用相應(yīng)測(cè)試集對(duì)三者的識(shí)別能力進(jìn)行測(cè)試對(duì)比。測(cè)試結(jié)果表明:深度學(xué)習(xí)方法CNN 和YOLO 的POD、CSI 等指標(biāo)均高于傳統(tǒng)機(jī)器學(xué)習(xí)方法決策樹模型,決策樹模型存在空?qǐng)?bào)較多情況。其中YOLO 識(shí)別能力最佳,其POD、FAR和CSI分別為0.994、0.308和0.685,為最優(yōu)模型。

        同時(shí),針對(duì)YOLO 對(duì)不同天氣類型下的雷暴大風(fēng)識(shí)別能力測(cè)試及業(yè)務(wù)化的需求,分別選取了2020 年3—8 月不同類型天氣過程以及連續(xù)時(shí)段任意天氣進(jìn)行識(shí)別檢驗(yàn)分析,得到以下結(jié)論。

        (1) 基于YOLO 模型的識(shí)別算法無論對(duì)局地性還是系統(tǒng)性雷暴大風(fēng)過程的POD 均高于0.95,CSI 達(dá)到0.6 以上,F(xiàn)AR 低于0.4,表明該識(shí)別算法對(duì)于不同類型的雷暴大風(fēng)均有較高的捕捉識(shí)別能力,且對(duì)于系統(tǒng)性雷暴大風(fēng)的識(shí)別效果略優(yōu)于局地性過程的。

        (2) 基于YOLO 模型的識(shí)別算法在廣東前汛期、后汛期形勢(shì)連續(xù)30 天時(shí)間段內(nèi)任意天氣條件下,對(duì)雷暴大風(fēng)的識(shí)別POD、FAR 和CSI 分別為0.939、0.374、0.601,表明該識(shí)別算法具備業(yè)務(wù)化條件。廣東省氣象臺(tái)于2021 年1 月部署將該識(shí)別算法接入實(shí)時(shí)雷達(dá)數(shù)據(jù),每6 min穩(wěn)定生成廣東省全省范圍、1 km×1 km分辨率的識(shí)別產(chǎn)品。

        (3) 需要注意的是,該算法雖命中率高,但仍存在一定的空?qǐng)?bào)。這與廣東省自動(dòng)站分布不均勻有一定關(guān)系,粵北和粵西的山區(qū)自動(dòng)站分布相對(duì)稀疏,卻是雷暴大風(fēng)的頻發(fā)區(qū),存在由于雷暴單體尺度小處于觀測(cè)空白區(qū)而未被監(jiān)測(cè)到的情況;同時(shí)檢驗(yàn)中發(fā)現(xiàn)部分空?qǐng)?bào)與6 級(jí)、7 級(jí)風(fēng)觀測(cè)實(shí)況對(duì)應(yīng),回看實(shí)況回波亦可見強(qiáng)反射率因子、強(qiáng)回波伸展高、高VIL等雷暴大風(fēng)指示性特征。

        (4) 相較于深度學(xué)習(xí)模型方法,本文中基于人為選取雷達(dá)特征的傳統(tǒng)機(jī)器學(xué)習(xí)方法-決策樹模型的識(shí)別算法表現(xiàn)出更多的漏報(bào)和明顯的空?qǐng)?bào)。這是因?yàn)閭鹘y(tǒng)機(jī)器學(xué)習(xí)方法非常依賴于人為選取的特征因子,需要通過更深入研究獲取到更全面的雷暴大風(fēng)雷達(dá)特征,從而對(duì)算法進(jìn)行補(bǔ)漏消空。

        此外,近地層輻散、大風(fēng)速核、中層徑向輻合等徑向速度特征與雷暴大風(fēng)密切相關(guān),對(duì)于雷暴大風(fēng)的監(jiān)測(cè)識(shí)別具有明顯優(yōu)勢(shì),但利用單站雷達(dá)的徑向速度產(chǎn)品來實(shí)現(xiàn)廣東全省范圍內(nèi)上述速度特征的自動(dòng)識(shí)別難度較大,有待于在后續(xù)的工作中進(jìn)一步深入研究。

        猜你喜歡
        雷暴大風(fēng)決策樹
        新德里雷暴
        一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹算法
        阜新地區(qū)雷暴活動(dòng)特點(diǎn)研究
        綠色科技(2018年22期)2019-01-15 05:36:08
        決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        廣西富川縣雷暴氣候特征分析
        大風(fēng)吹(二)
        幼兒100(2017年31期)2017-11-27 02:37:46
        大風(fēng)吹(一)
        幼兒100(2017年28期)2017-10-27 01:45:49
        人小鬼大狄仁杰
        基于決策樹的出租車乘客出行目的識(shí)別
        基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
        人妻丰满熟妇av无码处处不卡| 中文字幕aⅴ人妻一区二区| 日韩精品人成在线播放| 男人的天堂av网站| 欧美日韩一区二区三区自拍| 日韩在线看片免费人成视频| 色欲aⅴ亚洲情无码av蜜桃| a在线观看免费网站大全| 国产成人户外露出视频在线| 欧洲亚洲综合| 视频精品熟女一区二区三区| 一区二区三区在线乱码| 中文乱码字幕在线亚洲av | 国产一级片毛片| 亚洲天堂色婷婷一区二区| 日本高级黄色一区二区三区| 久久久精品中文字幕麻豆发布| 丰满少妇呻吟高潮经历| 美丽的熟妇中文字幕| 亚洲黄色免费网站| 日韩精品免费一区二区中文字幕 | 成人国产乱对白在线观看| 国产精品自拍网站在线| 手机在线免费av资源网| 国产亚洲一区二区在线观看| 四川老熟妇乱子xx性bbw| 18禁美女裸身无遮挡免费网站| 狠狠色狠狠色综合日日92| 亚洲熟伦在线视频| 亚洲av熟女天堂久久天堂| 日韩精品在线视频一二三| 少妇中文字幕乱码亚洲影视| 免费观看黄网站| 娇妻粗大高潮白浆| 日本超级老熟女影音播放| 乱人伦精品视频在线观看| 精品人妻伦九区久久aaa片69| 99re在线视频播放| 99精品国产闺蜜国产在线闺蜜| 亚洲国产线茬精品成av| 蜜桃tv在线免费观看|