亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于卷積神經(jīng)網(wǎng)絡(luò)的颮線識別算法

        2021-09-03 07:00:46金子琪王新敏鮑艷松路明月
        應(yīng)用氣象學報 2021年5期
        關(guān)鍵詞:模型

        金子琪 王新敏 鮑艷松 栗 晗 魏 鳴 路明月

        1)(中國氣象局·河南省農(nóng)業(yè)保障與應(yīng)用技術(shù)重點開放實驗室/河南省氣象臺,鄭州 450003) 2)(南京信息工程大學氣象災(zāi)害預(yù)報預(yù)警與評估協(xié)同創(chuàng)新中心/中國氣象局氣溶膠與云降水重點開放實驗室/氣象環(huán)境衛(wèi)星工程與應(yīng)用聯(lián)合實驗室,南京 210044) 3)(南京信息工程大學大氣物理學院,南京 210044) 4)(南京信息工程大學地理科學學院,南京 210044)

        引 言

        颮線是由許多雷暴單體側(cè)向排列而形成的強對流云帶,是一種典型的中尺度對流系統(tǒng),其水平尺度長、寬均約幾十至上百千米,持續(xù)時間為幾小時至十幾小時。颮線出現(xiàn)時通常伴有雷暴、大風、冰雹等災(zāi)害性天氣,給人民生活和社會生產(chǎn)帶來極大危害。2004年7月12日蘇南至上海地區(qū)發(fā)生強颮線過程,產(chǎn)生8~11級雷雨大風 ,經(jīng)過閔行華漕地區(qū)時出現(xiàn)龍卷,造成多處房屋倒塌,死亡7人,傷及多人,部分地區(qū)因高壓線損壞停電[1]。2009年6月3—4日河南、安徽等地遭遇罕見強颮線襲擊,導致河南省的商丘、開封和濟源24人死亡,81人受傷,直接經(jīng)濟損失達16.069億元[2]。2017年7月7日下午至午夜,河北西北部與北京中北部發(fā)生一次罕見強颮線過程,導致較大范圍的雷暴大風和短時強降水等強對流天氣;北京全市范圍出現(xiàn)8級以上短時大風,并伴有雷電、冰雹及短時強降雨,延慶、昌平、懷柔、門頭溝、平谷、朝陽出現(xiàn)10~11級短時大風[3]。

        雷達資料具有高時空分辨率的特點,對中尺度對流系統(tǒng)的監(jiān)測和臨近預(yù)報具有獨特優(yōu)勢,借助計算機自動識別包括颮線在內(nèi)的各類短時強對流性天氣,能夠幫助氣象工作者更加及時地分析海量觀測數(shù)據(jù),對天氣形勢做出判斷。目前基于雷達數(shù)據(jù)對中尺度對流系統(tǒng)的自動識別和預(yù)報已發(fā)展出多種算法,如基于交叉相關(guān)法的利用相關(guān)跟蹤雷達回波(tracking radar echoes by correlation,TREC)[4]、基于單體質(zhì)心法的風暴識別、追蹤、分析和臨近預(yù)報(thunderstorm identification,tracking,analysis,and nowcasting,TITAN)[5]以及風暴單體識別、追蹤和預(yù)報算法(storm cell identification and tracking algorithm,SCIT)[6]等,這些算法已成為各短時臨近預(yù)報系統(tǒng)的重要組成部分[7-8]。還有學者提出專門針對颮線的自動識別算法,楊吉等[9]擬合橢圓長軸設(shè)計動態(tài)模板和得分函數(shù),實現(xiàn)雷達拼圖線狀中尺度對流系統(tǒng)的自動識別和跟蹤,其線性得分值能較好地反映中尺度對流系統(tǒng)各階段的線性狀態(tài),但算法在系統(tǒng)分裂與合并時跟蹤效果較差,且不適用于“廠”字型等其他類型的颮線。程凌舟等[10]針對颮線中心強度較強且連接成線的特征,基于小波變換模極大邊緣檢測理論和Hu矩理論計算雷達回波圖像的特征向量,當模板矩特征向量與待匹配圖像矩特征向量的歐氏距離小于設(shè)定閾值時,將目標識別為颮線。李哲等[11]在楊吉等[9]的基礎(chǔ)上提出一種颮線優(yōu)化識別算法,采用4種不同參數(shù)方案,根據(jù)回波強度自動挑選最優(yōu)方案,能夠同時識別不同強度或不同發(fā)展階段的颮線,比單一參數(shù)識別效果明顯改善。上述方法均屬于人工提取特征法,核心思路是提取颮線的若干圖像特征作為因子,將其放入數(shù)學模型,并與事先設(shè)定的閾值進行對比從而識別颮線。

        人工智能自20世紀90年代開始應(yīng)用在氣象領(lǐng)域,如臺風預(yù)報、降水預(yù)報、云分類、大氣廓線反演等[12-16]。深度學習是人工智能中神經(jīng)網(wǎng)絡(luò)算法的一個新分支,常見的深度學習模型有卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)、深度信任網(wǎng)絡(luò)(deep belief network,DBN)、堆棧自動編碼器(stacked auto-encoder,SA)、受限玻爾茲曼機(restricted boltzmann machine,RBM)等。深度學習的概念起源于人工神經(jīng)網(wǎng)絡(luò),本質(zhì)上是堆疊多個隱含層的深度網(wǎng)絡(luò),相比于傳統(tǒng)的人工神經(jīng)網(wǎng)絡(luò)具有更多的隱含層和更復雜的網(wǎng)絡(luò)結(jié)構(gòu),通過組合低層特征增加網(wǎng)絡(luò)深度和非線性變換能力,將原始特征映射為更加抽象的高層特征,以更好地發(fā)現(xiàn)數(shù)據(jù)的有效特征表示[17]。由于層數(shù)深、參數(shù)多、結(jié)構(gòu)復雜,深度學習模型具有很強的學習能力,因此常用于大量樣本數(shù)據(jù)的訓練,挖掘其中隱藏的函數(shù)關(guān)系和物理規(guī)律。在強對流天氣方面,有學者提出基于深度學習的強對流臨近預(yù)報方法[18-19],但基于深度學習的颮線等強對流天氣的自動識別算法目前在國內(nèi)報道較少。

        卷積神經(jīng)網(wǎng)絡(luò)可以提取圖片數(shù)據(jù)特征,在圖像處理特別是目標分類方面效果顯著,已被廣泛應(yīng)用于計算機視覺、自然語言處理等領(lǐng)域[20]。雷達回波圖中目標的自動識別可以看作是一種圖像分類問題,因此本文提出采用卷積神經(jīng)網(wǎng)絡(luò)來識別雷達回波中的颮線,以河南省鄭州和駐馬店雷達為試驗對象,挑選颮線數(shù)據(jù)建立樣本集用于模型的訓練、驗證和測試。針對樣本分類的不平衡問題,提出并測試了不同改進方案對識別效果的效果。

        1 數(shù) 據(jù)

        本文使用的雷達基數(shù)據(jù)來自河南省氣象臺。雷達數(shù)據(jù)來自河南省鄭州和駐馬店SA波段雷達,雷達探測半徑為460 km,徑向分辨率為1 km,2008—2020年雷達共探測到22次颮線過程(表1)(表中時刻均為世界時,下同)。

        表1 颮線過程發(fā)生時間Table 1 Occurrence time of squall line processes

        卷積神經(jīng)網(wǎng)絡(luò)的輸入是圖像,而雷達基數(shù)據(jù)以二進制文件的形式儲存,因此需要對雷達基數(shù)據(jù)進行預(yù)處理。首先提取各仰角層的基本反射率因子計算得到組合反射率因子,然后采用雙線性插值[21]算法將極坐標系下的組合反射率因子插值到笛卡爾坐標,為了便于模型的訓練需適當降低分辨率,最終得到時間分辨率為6 min、空間范圍為920×920 km、格點分辨率為2.5 km、大小為360×360的雷達反射率因子矩陣。

        為了建立用于卷積神經(jīng)網(wǎng)絡(luò)的訓練、檢驗和測試的數(shù)據(jù)集,需對樣本中的雷達回波進行分類和標識:首先挑選發(fā)生颮線過程的22 d雷達體掃數(shù)據(jù),共7188個,然后根據(jù)雷達基數(shù)據(jù)中的基本反射率因子矩陣畫出雷達回波圖,并人工將其分為颮線回波和非颮線回波兩類?;诶走_數(shù)據(jù)進行颮線判別的依據(jù)見表2。參考這些依據(jù),本文將滿足以下條件的雷達回波圖判別為颮線回波:雷達反射率因子大于40 dBZ且連續(xù)長度超過100 km,長寬比超過5:1的回波帶。最終判別颮線回波2067個,非颮線回波5121個。選取由這22 d的颮線個例構(gòu)成模型所需的數(shù)據(jù)集,隨機挑選2008年5月9日—2018年6月13日18次颮線過程雷達回波數(shù)據(jù)的四分之三作為訓練集,用于模型的訓練和調(diào)參,剩余四分之一作為驗證集,用于優(yōu)化模型時評估訓練效果,從而改進模型結(jié)構(gòu),優(yōu)化模型參數(shù)。2018年6月13日—2020年6月24日4次颮線過程的雷達回波單獨構(gòu)成測試集,不參與模型訓練,以客觀驗證模型的時間泛化能力,數(shù)據(jù)集詳細信息見表3。

        表2 颮線判別依據(jù)Table 2 Criteria of squall line discrimination

        表3 數(shù)據(jù)集信息Table 3 Information of datasets

        2 颮線識別算法

        2.1 卷積神經(jīng)網(wǎng)絡(luò)

        雷達識別颮線本質(zhì)是一個圖像分類問題,雷達回波相當于一個二維圖像,圖像顏色對應(yīng)回波強度,颮線回波具有弓形、線狀和強反射率因子等顯著特征,通過提取這些圖像特征并與歷史樣本對比從而識別出颮線。如何有效提取圖像特征并在所提取特征和樣本類別間建立函數(shù)關(guān)系,可采用卷積神經(jīng)網(wǎng)絡(luò)解決該問題。

        卷積神經(jīng)網(wǎng)絡(luò)模型包括輸入層、卷積層、池化層、全連接層和輸出層。模型輸入為原始圖像或經(jīng)過預(yù)處理的圖像。卷積層、池化層和全連接層屬于隱含層。卷積層由一組卷積核組成,卷積核相當于可以自動學習的濾波器,通過滑動窗口對輸入的圖像進行卷積運算后輸出特征圖,不同卷積核的組合能提取圖像的多個特征,在誤差反向傳播中卷積核能夠根據(jù)誤差不斷修改自身的權(quán)值,使分類結(jié)果更加貼近目標。池化層又被稱為降采樣層,輸入的特征圖按一定規(guī)則劃分為若干矩形區(qū)域,取每個區(qū)域的最大值或平均值輸出,這樣能夠減少網(wǎng)絡(luò)的計算量和參數(shù)數(shù)量,降低過擬合的影響,同時盡可能地保留圖像特征,在卷積網(wǎng)絡(luò)的設(shè)計中通常會將池化層穿插在卷積層之間[26]。全連接層類似于傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò),層與層之間所有的神經(jīng)元相連接。圖像在經(jīng)過多層卷積、池化后得到的高層特征輸入全連接層進行映射后連接到輸出層,最終得到輸入圖像的類別所屬概率向量。

        2.2 建立颮線識別模型

        本文采用深度學習框架PyTorch構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)。PyTorch是一個基于Python的科學計算包,提供各類封裝好的函數(shù)和模塊。用戶可以自由靈活地設(shè)計網(wǎng)絡(luò)結(jié)構(gòu)和損失函數(shù),將輸入數(shù)據(jù)導入后網(wǎng)絡(luò)便可自動進行前向傳播和誤差反向傳播的計算,完成網(wǎng)絡(luò)訓練。

        視覺幾何組(visual geometry group,VGG)網(wǎng)絡(luò)由Simonyan等[27]提出,結(jié)構(gòu)非常簡潔,但耗費計算資源較多。相較于其他卷積神經(jīng)網(wǎng)絡(luò),VGG采用多個3×3的卷積核代替較大的卷積核(11×11,7×7,5×5),這樣做的主要原因是在保證具有相同感知野的條件下,多個小卷積核堆積相當于增加了非線性層數(shù),加深網(wǎng)絡(luò)深度保證學習更復雜的模式。由于VGG在圖像分類和目標檢測任務(wù)中表現(xiàn)良好,本文參考VGG設(shè)計網(wǎng)絡(luò)。整個網(wǎng)絡(luò)包含1個輸入層、8個卷積層、5個池化層、5個全連接層和1個輸出層。所有卷積層使用的卷積核均為3×3,步長為1,為了使卷積后的特征圖大小不變,邊緣使用相同像素進行填充。前2層池化層窗為2×2,步長為2,后3層池化層窗口為3×3,步長為3,方式為最大池化。每個卷積層和全連接層后面使用ReLU作為激活函數(shù)。訓練過程的參數(shù)設(shè)置:學習率0.001,優(yōu)化算法為自適應(yīng)矩估計[28],迭代訓練100次,損失函數(shù)為交叉熵函數(shù)。

        網(wǎng)絡(luò)輸入的圖像為360×360分辨率的雷達反射率因子矩陣,經(jīng)過8次卷積和5次池化得到5×5大小、256個通道的特征圖,拉伸為長度為6400的一維向量,經(jīng)過4個全連接層后映射為長度為2的一維向量,分別表示輸入的雷達反射率因子矩陣屬于颮線回波和非颮線回波的概率,選取概率最大值作為分類結(jié)果。

        3 颮線識別試驗

        3.1 識別效果評價方法

        模型輸出雷達回波圖像屬于颮線類別和非颮線類別的概率,取概率最大值作為對應(yīng)的分類結(jié)果,即0/1分類,這將颮線識別問題轉(zhuǎn)化為一個二分類問題。本文在此基礎(chǔ)上采用臨界成功指數(shù)(CSI)、公平風險評分(ETS)、命中率(POD)、誤判率(FAR)定量評價模型的識別效果[29]。CSI和ETS代表了模型對颮線樣本和非颮線樣本的綜合識別能力,POD表示模型對颮線樣本的識別率,F(xiàn)AR表示模型對非颮線樣本的誤識別率。

        需要注意的是,上述評分標準原本用于評估短時臨近預(yù)報效果,而非識別效果,不過在評估預(yù)報效果前也需要設(shè)定閾值將雷達回波轉(zhuǎn)化為0/1分類結(jié)果,兩者相似,同時對于颮線的識別效果目前缺少一個廣泛使用的評價標準,故在此引入。

        3.2 模型優(yōu)化試驗

        使用驗證集對卷積神經(jīng)網(wǎng)絡(luò)的學習效果進行檢驗,識別結(jié)果是CSI為0.59,ETS為0.47,POD為0.77,F(xiàn)AR為0.27(表4原方案),總體看模型能夠較好地分辨颮線和非颮線樣本。經(jīng)過多次試驗,發(fā)現(xiàn)非颮線樣本的識別準確率高于颮線樣本,這說明網(wǎng)絡(luò)對非颮線樣本的識別能力優(yōu)于颮線樣本,本研究認為原因有兩個:①樣本比例不平衡,在訓練樣本集中颮線樣本與非颮線樣本的數(shù)量比例約為2:5,這會導致模型更關(guān)注多數(shù)類(非颮線),從而使少數(shù)類(颮線)樣本的分類性能下降,即總是將樣本放到樣本量較多的分類中;②相對于傳統(tǒng)的圖像分類任務(wù),本文使用的雷達回波圖像分辨率更高,使模型需要更多的層數(shù)降采樣,常見的VGG網(wǎng)絡(luò)一般為16層,而本文設(shè)計的網(wǎng)絡(luò)為20層,其結(jié)構(gòu)更深,過強的學習能力造成過擬合現(xiàn)象。針對以上兩種原因,本文分別提出不同的改進方案。

        表4 改進方案識別結(jié)果Table 4 Identification result of different schemes

        對于樣本組成比例不平衡解決思路[30]如下:①過采樣:通過增加分類中少數(shù)類樣本的數(shù)量實現(xiàn)樣本均衡;②欠采樣:通過減少分類中多數(shù)類樣本的數(shù)量來實現(xiàn)樣本均衡;③給分類中不同樣本數(shù)量的類別賦予不同的權(quán)重,一般小樣本量類別權(quán)重高,大樣本量類別權(quán)重低。本文分別采用過采樣和降采樣的思路,通過增加或減少訓練集中的樣本數(shù)量建立新的訓練集。表5給出新舊訓練集的對比,過采樣重復增加1倍的颮線樣本,使颮線樣本與非颮線樣本的數(shù)量比例由2:5上升至4:5;降采樣則隨機減少1000個非颮線樣本,使兩者的數(shù)量比例由2:5上升至2:3。該操作僅針對訓練集,驗證集和測試集中兩者的比例未改變。對于卷積神經(jīng)網(wǎng)絡(luò)中的過擬合問題,當前主要通過增加網(wǎng)絡(luò)的稀疏性以及隨機性,改善網(wǎng)絡(luò)的泛化性能[31]解決,如作用于全連接層的隨機丟失[32],通過在訓練過程中隨機地忽略一定比例的節(jié)點響應(yīng),增加網(wǎng)絡(luò)的稀疏性;作用于卷積層的最大響應(yīng)激活函數(shù)[33],將其他卷積層的連接全部斷開,只保留上一層節(jié)點向下一層的激勵最大值;作用于池化層的隨機池化[34],依據(jù)概率分布進行隨機的池化操作,給池化過程引入隨機性?;谝陨戏治?,本文嘗試對網(wǎng)絡(luò)結(jié)構(gòu)進行優(yōu)化:在全連接層中加入隨機丟失,隨機忽略50%的神經(jīng)元節(jié)點,同時將全連接層的數(shù)量從5層減少為3層,降低網(wǎng)絡(luò)的深度。

        表5 訓練集對比Table 5 Comparison of training sets

        為了比較不同改進方案的效果,本文設(shè)計4組試驗(表4):①使用過采樣后的訓練集進行訓練,②使用降采樣后的訓練集進行訓練,③使用結(jié)構(gòu)優(yōu)化后的網(wǎng)絡(luò)進行訓練,④同時使用降采樣的訓練集和結(jié)構(gòu)優(yōu)化后網(wǎng)絡(luò)進行訓練。由表4可以看到,與未進行改進的結(jié)果相比,過采樣方案的CSI上升至0.65,ETS上升至0.52,POD上升至0.80,F(xiàn)AR下降至0.26;降采樣方案的CSI上升至0.74,ETS上升至0.63,POD上升至0.93,F(xiàn)AR下降至0.23。說明過采樣和降采樣可緩解樣本比例不平衡問題,過采樣方案的提升幅度比降采樣小,這可能是因為簡單地重復采樣無法有效增加樣本信息,依然會導致過擬合。網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化方案的CSI上升至0.87,ETS上升至0.82,POD上升至0.96,F(xiàn)AR下降至0.10,識別效果顯著提升。其中ETS提升明顯是因為該指標更看重對颮線樣本的識別效果,原方案對颮線樣本的識別能力較弱故評分低,而經(jīng)過網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化的方案對颮線樣本的識別能力大幅提升。同時使用降采樣訓練集和網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化方案的CSI為0.88,ETS為0.83,POD為0.97,F(xiàn)AR為0.10,與僅使用網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化方案的結(jié)果相比無明顯提升。

        分析上述試驗可知,改變樣本組成比例和網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化的方案均能夠明顯提升颮線樣本的識別效果,但前者提升的幅度低于后者。在使用網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化方案的基礎(chǔ)上,再使用降采樣訓練集未能帶來效果的明顯提升,說明對于本文使用的數(shù)據(jù)集優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)已足夠改善樣本比例不平衡的問題,不需要刻意減少非颮線樣本量,因為非颮線樣本中包含多種其他天氣條件下的雷達回波,過多刪除可能導致卷積神經(jīng)網(wǎng)絡(luò)丟失關(guān)于其他天氣樣本的重要信息。

        3.3 識別模型效果評估

        在網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化的基礎(chǔ)上,使用測試集對卷積神經(jīng)網(wǎng)絡(luò)模型的學習效果進行測試。圖1~圖3給出3次颮線過程回波隨時間的變化和識別結(jié)果。

        2018年6月26日鄭州雷達探測到的颮線過程(圖1)。05:12對流初生,位于西南方向,算法識別結(jié)果為非颮線。06:48對流發(fā)展為多個單體排列成線狀,雷達回波最大值達到50 dBZ,自西北向東南移動,算法將其識別為颮線。07:48系統(tǒng)逐漸減弱,正南方向開始生成新的對流單體,識別結(jié)果變?yōu)榉秋R線。08:30正南方向的多個對流單體繼續(xù)發(fā)展排列成線狀,回波最大值達到60 dBZ,原西南方向颮線消亡后殘留的對流單體向正南方向靠近,算法重新將其識別為颮線。10:00西南方向的對流已完全與正南方向的新颮線系統(tǒng)合并,系統(tǒng)緩慢向東北方向移動。11:30正南方向的颮線系統(tǒng)開始減弱,但在東南方向有多個新的對流單體生成。12:36正南方向的颮線系統(tǒng)完全消亡,只留下一片弱回波區(qū),東南方向?qū)α鲉误w繼續(xù)發(fā)展排列成線狀,回波最大值達到55 dBZ,系統(tǒng)向東移動。13:24系統(tǒng)減弱,不再呈線狀,后部生成一個面積較大的對流單體。

        圖1 2018年6月26日鄭州雷達探測颮線過程的識別結(jié)果Fig.1 Identification results of squall line detected by Zhengzhou radar on 26 Jun 2018

        2019年6月3日駐馬店雷達探測到颮線過程(圖2)。11:00對流初生,西北方向有多個對流單體,算法識別結(jié)果為非颮線。12:00對流單體發(fā)展,排列成線狀并向南移動,算法識別為颮線。12:36系統(tǒng)分裂成兩個較短的回波帶,識別結(jié)果為非颮線。13:12兩個回波帶合并,系統(tǒng)發(fā)展旺盛,回波最大值達到65 dBZ,西面生成一個小的對流單體與系統(tǒng)一起移動,算法重新將其識別為颮線。13:48系統(tǒng)逐漸減弱并向東南方向移動,未識別為颮線,可能是因為系統(tǒng)長寬比較低。14:12后系統(tǒng)進入消亡期,排列不再呈線狀,西面的對流單體消散。16:00系統(tǒng)消亡,識別結(jié)果為非颮線。

        圖2 2019年6月3日駐馬店雷達探測颮線過程的識別結(jié)果Fig.2 Identification results of squall line detected by Zhumadian radar on 3 Jun 2019

        續(xù)圖2

        2020年6月24日鄭州雷達探測到颮線過程(圖3)。08:48對流初生,位于東北方向,算法識別結(jié)果為非颮線。09:48對流發(fā)展,回波最大值達到60 dBZ,自北向南移動,算法開始將其識別為颮線。11:00多個對流單體繼續(xù)發(fā)展排列成線狀,颮線系統(tǒng)形成,開始向東南方向移動。12:00系統(tǒng)發(fā)展,長度超過200 km,同時西南方向有新的對流單體生成。13:18系統(tǒng)發(fā)展到鼎盛,長度超過250 km,西南方向的對流單體與系統(tǒng)一起移動但未合并,系統(tǒng)與單體之間發(fā)展出一條短回波帶。14:06系統(tǒng)在向東南方向移動時逐漸減弱,同時西南方向的對流單體和短回波帶也減弱消散。16:00系統(tǒng)進入消亡期,回波強度進一步減弱,對流單體排列不再呈線狀,識別結(jié)果為非颮線。16:42系統(tǒng)完全消亡。

        圖3 2020年6月24日鄭州雷達探測颮線過程的識別結(jié)果Fig.3 Identification results of squall line detected by Zhengzhou radar on 24 Jun 2020

        續(xù)圖3

        由圖1~圖3各時次的識別結(jié)果可以看到,在對流發(fā)展較弱階段,模型能夠正確識別為非颮線,在颮線發(fā)展強盛階段,模型能夠正確識別為颮線,說明經(jīng)過訓練的模型把握了颮線的強回波和線狀特征,且能夠與對流較弱的情況區(qū)分。在颮線消亡或新生階段,回波強度減弱,形狀不規(guī)則,此時模型識別能力下降,這是因為樣本集建立在對颮線的主觀判別、分類和標記上,對于某些颮線特征不明顯,特別是颮線消亡或新生階段的樣本,判別依據(jù)難以把握。

        表6是驗證集和測試集識別結(jié)果的對比,可以看到,測試集的CSI,ETS和POD分別為0.66,0.58和0.86,F(xiàn)AR為0.24,這是因為深度學習模型的建立依賴大量歷史數(shù)據(jù)作為學習樣本,而颮線的歷史個例不足,訓練集的代表性有待提高。不同天氣個例颮線區(qū)域的回波強度和空間分布形態(tài)差異很大,驗證集中的樣本和訓練集來自相同的颮線過程,所以識別效果理想,而測試集中的樣本來自其他未參與訓練的颮線過程,具有訓練集未曾包含的圖像特征,所以識別效果降低。由于訓練后的網(wǎng)絡(luò)已經(jīng)能夠分辨颮線過程典型的強回波和線狀特征,因此模型的識別能力下降不大,具有較好的外延性。

        表6 驗證集與測試集識別結(jié)果Table 6 Identification results of validation set and test set

        4 結(jié) 論

        本文提出基于卷積神經(jīng)網(wǎng)絡(luò)的颮線自動識別方法,使用2008—2020年河南省鄭州和駐馬店雷達的颮線數(shù)據(jù)作為樣本訓練、驗證和測試模型的識別能力,并針對樣本組成比例不平衡提出改進方案,并比較不同方案的識別效果,得到以下結(jié)論:

        1)颮線在各類天氣過程中占比小,建立樣本集時存在樣本組成比例不平衡的問題,這對颮線識別效果有一定影響。改變采樣方式和優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)均能夠緩解樣本不平衡,顯著提升識別效果,但前者提升幅度低于后者,且兩種方法的結(jié)合未帶來識別效果的明顯提升。

        2)模型用于測試集的效果CSI為0.66,ETS為0.58,POD為0.86,F(xiàn)AR為0.24,表明卷積神經(jīng)網(wǎng)絡(luò)能夠提取并學習颮線和非颮線回波的圖像特征,對颮線有良好識別能力,具有較好的外延性。

        深度學習為中尺度對流系統(tǒng)的自動識別提供新思路,但仍存在局限性。深度學習模型的建立依賴于大量歷史數(shù)據(jù)作為學習樣本,人工對樣本進行分類的主觀偏差、樣本集代表性不足等會影響模型的識別效果,可以通過優(yōu)化颮線判別依據(jù)、建立更加具有代表性的樣本集等途徑對模型進行優(yōu)化。

        需要指出的是,本文僅從雷達回波的角度進行分析,實際颮線的判別還需要結(jié)合其他天氣條件。本文用于建模的樣本來自河南省鄭州和駐馬店雷達數(shù)據(jù),在其他地區(qū)的適用性有待研究。

        致 謝:本文計算得到南京信息工程大學高性能計算中心的支持和幫助。

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務(wù)本地化模型
        適用于BDS-3 PPP的隨機模型
        提煉模型 突破難點
        函數(shù)模型及應(yīng)用
        p150Glued在帕金森病模型中的表達及分布
        函數(shù)模型及應(yīng)用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        3D打印中的模型分割與打包
        欧美a级在线现免费观看| 久久中文字幕人妻熟av女蜜柚m | 亚洲天堂精品成人影院| 国产又爽又黄又刺激的视频| 久久精品日韩av无码| 超碰Av一区=区三区| 免费的黄网站精品久久| 久久久天堂国产精品女人| 欲求不満の人妻松下纱荣子| a级毛片100部免费观看| 亚洲成人福利在线观看| 国产一区二区三区白浆在线观看| 久久丝袜熟女av一区二区| 妺妺窝人体色www婷婷| 亚洲精品国产av成拍色拍| 久久夜色精品国产亚洲噜噜| 久久老熟女一区二区三区| 国产日本精品视频一区二区 | 国产三级三级精品久久| 激情久久黄色免费网站| 国产农村熟妇videos| 依依成人精品视频在线观看| 国产一及毛片| 国产伦精品一区二区三区在线| 最新中文字幕人妻少妇| 国产精品老熟女露脸视频| 国产日本在线视频| av天堂亚洲另类色图在线播放| 人人人妻人人澡人人爽欧美一区| 中文字幕日本特黄aa毛片| 亚洲一区二区三区久久不卡| 日本午夜理论一区二区在线观看| 亚洲av无码乱码国产麻豆| 99久久国产福利自产拍| 久久久亚洲精品蜜桃臀| 一区二区三区视频免费观看在线| 日韩一区av二区三区| 7m精品福利视频导航| 99在线精品国产不卡在线观看| 亚洲欧洲日产国码无码av野外| 国产精品视频一区二区久久|