袁靜, 王橋, 楊德賀, 劉芹芹, 澤仁志瑪, 申旭輝
1 防災(zāi)科技學(xué)院, 河北三河 065421 2 應(yīng)急管理部國家自然災(zāi)害防治研究院, 北京 100085
利用電磁衛(wèi)星監(jiān)測地震始于20世紀(jì)80年代,現(xiàn)已探測到了大量的電磁異常信息(Shen et al., 2018;Yan et al., 2018; Larkina, 1983; Chmyrev et al., 1989; Parrot and Mogilevsky, 1989; Pulinets and Legen′ka, 2003; Molchanov, 1993; 蔡軍濤等, 2007),從而為地震電磁擾動提供了新的觀測手段.然而,引起電磁異常擾動的因素很多(尼魯帕爾·買買吐孫和張永仙,2012),大量研究結(jié)果顯示,低層大氣氣象活動中的一些劇烈的天氣現(xiàn)象也會引起電離層擾動,譬如臺風(fēng)、颶風(fēng)、寒潮、龍卷風(fēng)、閃電等 (劉依謀等, 2006; 肖賽冠等, 2007).在眾多的氣象活動中,閃電是發(fā)生最頻繁的一種自然現(xiàn)象,Christian等(2003)使用光學(xué)瞬態(tài)探測器探測到全球閃電頻數(shù)為44 fl/s(fl為flash簡寫,表征閃電發(fā)生的次數(shù)).閃電放電過程中激發(fā)寬頻帶的電磁波,頻率范圍在500 Hz~10 kHz,因類似于口哨的聲音,故被稱為哨聲波(Helliwell, 1965).
閃電哨聲波能夠到達電離層、磁層,是探測空間物理環(huán)境的重要媒介(Helliwell, 1965).Záhlava等(2018)通過分析DEMETER衛(wèi)星和RBSP衛(wèi)星的閃電哨聲波發(fā)現(xiàn)等離子體層內(nèi)部的哨聲波模的縱向依賴性很強.Bayupati等(2012)通過分析AKEBONO衛(wèi)星的閃電哨聲波的色散發(fā)現(xiàn)閃電哨聲波的色散趨勢是確定等離子體層中整體電子密度分布的有力方法.Oike等(2014)分析AKEBONO衛(wèi)星探測的閃電哨聲波發(fā)生頻率證明了電離層中的閃電哨聲波與閃電活動、地球周圍的電子密度分布密切相關(guān).Clilverd等(2002)借助全球閃電定位網(wǎng)(WWLLN)來確定閃電的來源位置,再根據(jù)閃電哨聲波從來源點到觀測點的傳播時間,最后利用傳播理論導(dǎo)出電子密度沿傳播路徑的函數(shù).可見了解閃電哨聲波的物理參數(shù)和位置等是開發(fā)利用閃電的基礎(chǔ),是研究電離層和磁層等空間環(huán)境的重要技術(shù)手段.
閃電哨聲波觀測主要有地基觀測和天基觀測.20世紀(jì)80年代,我國開始探索地基閃電哨聲波觀測,利用自主研發(fā)的地面哨聲波接收機對低緯哨聲波傳播特性進行大量的研究(王挺柱等, 1982;徐繼生等, 1989;夏利東和王友善, 1994;田茂等, 1991),但受限于當(dāng)時模擬電子技術(shù)與計算機技術(shù),哨聲波接收機靈敏度不高,不易存儲(Chen, 2017).武漢大學(xué)于2016年成功研制新型甚低頻接收機系統(tǒng),已在我國低緯地區(qū)進行多站點(隨州、樂山、武漢)聯(lián)合觀測,取得了突破性進展(Chen et al., 2016, 2017; Zhou et al., 2020; Yi et al., 2020).
2018年2月,我國首顆電磁衛(wèi)星張衡一號(ZH-1)發(fā)射成功,具備了天基觀測閃電哨聲波的能力.ZH-1衛(wèi)星覆蓋南北緯65°,在中國大陸及周邊1000 km區(qū)域及全球兩個地震帶(太平洋地震帶和歐亞地震帶)進行詳查模式的觀測,其他區(qū)域為巡查模式.ZH-1衛(wèi)星在軌飛行高度約507 km,其位置接近電離層頂部和等離子層邊界,這個區(qū)域有豐富的ELF/VLF頻段波動事件,如閃電哨聲波、準(zhǔn)周期輻射等(Zhima et al., 2020).ZH-1軌道傾角97.4°,屬于太陽同步軌道,降交點地方時為下午2∶00;軌道回歸周期為5 d,即每5 d星下點軌跡相同;在一個回歸周期內(nèi)能夠?qū)崿F(xiàn)全球約500 km空間分辨率的觀測(袁仕耿等,2018).衛(wèi)星繞地球飛行一圈約94 min,大部分載荷在±65°緯度范圍開機工作,觀測數(shù)據(jù)按升軌(夜晚)和降軌(白天)分別存儲,每半軌(升/降軌)觀測約34 min;在同一天內(nèi)相鄰的升軌(或降軌)空間分辨率約2000 km.所搭載的感應(yīng)磁力儀載荷(SCM),通過法拉第電磁感應(yīng)定律獲得電離層的感應(yīng)磁場數(shù)據(jù),能夠捕獲全球閃電哨聲波信號,其在巡查模式下僅獲得功率譜數(shù)據(jù).到目前為止,ZH-1已經(jīng)在軌觀測3年多,采集了大量的全球電磁場的波形和功率譜數(shù)據(jù),其中SCM的3分量X/Y/Z包含3個頻段ULF/ELF/VLF,頻點范圍ULF:10~200 Hz,ELF:200 Hz~2.2 kHz,VLF:12.5 Hz~20 kHz,原始數(shù)據(jù)的采樣率為51.2 kHz,功率譜數(shù)據(jù)的頻點間隔ULF:0.25 Hz,ELF:2.5 Hz,VLF:12.5 Hz,詳查模式VLF波形數(shù)據(jù)80 ms包含4096個點(Wang et al., 2018;Zhou et al., 2018),每天產(chǎn)生大約10 G的數(shù)據(jù)量.如何從如此龐大的觀測數(shù)據(jù)中自動識別閃電哨聲波事件尤為關(guān)鍵和緊迫.
圖1 AKEBONO衛(wèi)星閃電形態(tài)圖例(Bayupati et al., 2012)Fig.1 Lightning whistlers of AKEBONO (Bayupati et al., 2012)
目前基于海量閃電哨聲波數(shù)據(jù)開展全球時空分布規(guī)律和相關(guān)參數(shù)的研究較少,主要存在以下兩個方面的原因:一是需要足夠的閃電哨聲波事件;二是缺少有效的閃電哨聲波自動識別算法,依靠人工從大量的電磁觀測數(shù)據(jù)中獲取閃電哨聲波事件是一件極具有挑戰(zhàn)性的工作.比如:Zhou等(2020)針對武漢VLF地面觀測數(shù)據(jù)中隱藏的閃電tweek現(xiàn)象,通過設(shè)置能量譜閾值和時間寬度閾值的方式提出了簡單快捷的自動識別算法.Yi等(2020)借用該算法對隨州站2016年2月3日至2月29日的WHU ELF/VLF接收機數(shù)據(jù)中的所有tweek現(xiàn)象進行自動識別和統(tǒng)計分析,發(fā)現(xiàn)該站tweek事件的日發(fā)生率的差異很大,數(shù)量大約在800至6000個之間.然而,其采用的識別算法(Zhou et al., 2020)的誤報率較高,主要原因是基于閾值匹配的分類策略使干擾噪聲對識別結(jié)果的影響較大,該方法明顯不適用于電磁衛(wèi)星數(shù)據(jù).電磁衛(wèi)星的觀測數(shù)據(jù)中攜帶了復(fù)雜多樣的空間電磁等擾動信號,如閃電哨聲波、嘶聲、VLF地面發(fā)射源、磁暴等現(xiàn)象.現(xiàn)有的研究主要是集中在一些明顯的太陽活動、地磁活動及VLF地面發(fā)射源對電離層的擾動方面(李柳元等2011; Li et al., 2015; Yang et al., 2020; 廖力等,2019; Zhao et al., 2019),較少有研究如何準(zhǔn)確地從觀測數(shù)據(jù)中自動識別閃電哨聲波.隨著電磁觀測大數(shù)據(jù)池的形成,自動識別閃電哨聲波是自動提取閃電哨聲波軌跡信息及其相關(guān)物理參數(shù)的重要前提,是對空間物理環(huán)境進行全面深入分析的關(guān)鍵環(huán)節(jié).閃電哨聲波源于閃電激發(fā)的寬頻帶電磁波,其高頻和低頻成分的速度差使其在頻譜圖上呈現(xiàn)明顯的“色散”狀特征.當(dāng)路徑長度較長或沿傳輸路徑的電子密度較密集時,色散變大,可見色散是反映等離子體層中的電子密度的重要參數(shù).Helliwell(1965)根據(jù)地面VLF觀測數(shù)據(jù)按照其色散特征將閃電哨聲波的形態(tài)分為9類,詳細內(nèi)容如表1所示,值得注意的是“多成分”類型中存在兩種不同的子類型.Santolík等(2009)指出地面VLF觀測站記錄的閃電哨聲波的形態(tài)與衛(wèi)星觀測到的形態(tài)極其相似且均具有頻散特性,如圖1和圖2所示.
圖2 DEMETER衛(wèi)星閃電形態(tài)圖例 (Parrot et al., 2015, 2019)Fig.2 Lightning whistlers of DEMETER (Parrot et al., 2015, 2019)
表1 閃電哨聲波分類(Helliwell, 1965)Table 1 Type and principal definitions of lightning whistlers (Helliwell, 1965)
目前基于電磁衛(wèi)星閃電哨聲波自動識別的研究主要是針對AKEBONO衛(wèi)星采集的波形數(shù)據(jù)(Bayupati et al., 2012)、Arase衛(wèi)星采集的數(shù)據(jù)(Ali Ahmad et al., 2019)以及DEMETER衛(wèi)星采集的頻譜數(shù)據(jù)(Parrot et al., 2019).
按照Eckersley′s 的定理(Gurnett et al., 1990),閃電哨聲波的時間和頻率之間滿足公式(1):
(1)
其中D是閃電哨聲波色散常量;t是以頻率f到達的時間,t0是閃電觸發(fā)的時間.Bayupati等(2012)將該定理應(yīng)用到AKEBONO衛(wèi)星的閃電哨聲波識別中.傳統(tǒng)的閃電哨聲波自動識別方法是通過識別功率譜中的直線的方式實現(xiàn)的,如圖1所示:t1是在頻率f1到達的時間,t2是頻率f2到達的時間,D的計算公式如式(2)所示:
(2)
圖1顯示閃電哨聲波是有一定斜率的一條直線,而公式(1)(2)僅僅表示了閃電哨聲波頻率和時間之間的簡單關(guān)系.
Ali Ahmad等(2019)認(rèn)為上述方法很難檢測到Helliwell(1965)總結(jié)的其他閃電哨聲波類型,重新整理了Arase衛(wèi)星的閃電哨聲波的類型,并根據(jù)不同的類型設(shè)計了不同的模式特征.其識別的方法是:首先用短時傅里葉變換(STFT)計算頻譜,接著采用高斯卷積核對頻譜圖進行模糊處理,再用拉普拉斯算子做邊緣提取,然后用圖像分割算法分割圖像,如圖3所示;并將圖像平均劃分為若干個格子,如圖4所示;最后,采用Bresenham′s 直線檢測算法提取特征(Bresenham, 1977)并輸入到?jīng)Q策樹進行識別,識別精度只有75%.該算法存在以下幾個問題:(1)識別過程中需要大量的圖像預(yù)處理操作,比如高斯卷積核的參數(shù)選擇、拉普拉斯算子參數(shù)的選擇、分割算法的參數(shù)選擇等,這些參數(shù)的選擇對采用Bresenham算法提取特征的影響較大;(2)Bresenham算法中需要設(shè)置參數(shù),該參數(shù)的選擇會影響特征的魯棒性;(3)該算法的評測指標(biāo)只采用精度作為評價指標(biāo),該指標(biāo)無法評估分類器的召回能力和排序能力.
圖3 分割結(jié)果(Ali Ahmad et al., 2019)Fig.3 Segmentation results (Ali Ahmad et al., 2019)
圖4 格線法 (Ali Ahmad et al., 2019)Fig.4 Grid (Ali Ahmad et al., 2019)
總之,目前的電磁衛(wèi)星閃電哨聲波識別算法存在下列問題:
(1)模式特征過于簡單導(dǎo)致其魯棒性差;
(2)分類技術(shù)粗糙導(dǎo)致其泛化能力不強;
(3)以AKEBONO衛(wèi)星和Arase 衛(wèi)星的數(shù)據(jù)為主,基于ZH-1衛(wèi)星的閃電哨聲波(如圖5所示)的識別研究未見開展.
圖5 張衡一號衛(wèi)星的SCM功率譜數(shù)據(jù)的時頻圖中閃電形態(tài)Fig.5 Lightning whistlers from ZH-1 satellite
綜上,本文在ZH-1衛(wèi)星SCM數(shù)據(jù)的基礎(chǔ)上,探索基于機器學(xué)習(xí)的閃電哨聲波自動識別框架,根據(jù)閃電哨聲波色散形態(tài)創(chuàng)建L形態(tài)卷積核提高特征魯棒性,采用支持向量機技術(shù)提高分類的泛化性能.
數(shù)據(jù)主要來自張衡一號衛(wèi)星在2019年8月份的三個軌道的SCM載荷的VLF波段的波形數(shù)據(jù),根據(jù)資料:大部分的閃電哨聲波在100~6000 Hz區(qū)域內(nèi)存在L形態(tài),且持續(xù)時不會超過20 s(Fiser et al., 2010),因此,本項目的數(shù)據(jù)收集過程如圖6所示:設(shè)計20 s的時間滑動窗,步長是4 s,截取波形數(shù)據(jù),做短時傅里葉變換得到時頻圖,并創(chuàng)建閃電哨聲波數(shù)據(jù)集.該數(shù)據(jù)集含316個閃電哨聲波時頻圖像,8000個非閃電哨聲波時頻圖像.由于本研究的重點是識別時頻圖像中是否具有色散形態(tài)特征,因此時頻圖中未繪制橫坐標(biāo)、縱坐標(biāo)和色階欄等輔助信息,其樣本示例如圖7所示.
圖6 數(shù)據(jù)采集Fig.6 Data acquisition
圖7 樣本示例(a) 閃電哨聲波樣例; (b) 無閃電哨聲波樣例.Fig.7 Sample example(a) Lightning whistlers; (b) No lightning whistlers.
閃電哨聲波識別算法的目標(biāo)是識別每個時頻圖中是否有閃電哨聲波.目前深度學(xué)習(xí)模型是機器學(xué)習(xí)的主流模型,但仍需要大量的數(shù)據(jù)樣本作為基礎(chǔ).而本文目前收集的閃電哨聲波數(shù)據(jù)量較少,基于此仍然用傳統(tǒng)的識別算法技術(shù)探索閃電哨聲波識別方案,方案包括訓(xùn)練過程和識別過程,如圖8所示:實線是訓(xùn)練流程,虛線是識別流程.訓(xùn)練流程的主要目的是獲得閃電哨聲波的識別模型,識別流程的主要目的是應(yīng)用閃電哨聲波識別模型.訓(xùn)練過程包括:灰度化處理、尺度處理,模糊卷積處理,L形態(tài)卷積處理,訓(xùn)練SVM模型.其識別流程包括:灰度化處理、尺度處理,模糊卷積處理,L形態(tài)卷積處理,應(yīng)用SVM模型進行閃電識別.
圖8 識別算法(實線是模型訓(xùn)練流;虛線是模型識別流)Fig.8 Recognition algorithm (the solid line represents training process; the dotted line denotes recognition process)
觀察原始的樣本頻譜圖,如圖9所示,發(fā)現(xiàn)識別閃電哨聲波的依據(jù)是頻譜圖中是否存在L形態(tài)特征,無需顏色特征,則首先采用灰度化處理消除顏色的影響.對圖9按照公式(3)進行灰度化處理(章毓晉, 2016),得到如圖10所示的灰度圖.
圖9 彩色頻譜圖(有閃電)Fig.9 Colorful spectrum (lightning whistlers)
圖10 灰度化(有閃電)Fig.10 Grayscale (lightning whistlers)
Gray=RGB.R×0.3+RGB.G×0.59
+RGB.B×0.11,
(3)
其中RGB表示原始的樣本頻譜圖,RGB.R是其紅色通道的像素值,RGB.G和RGB.B分別是綠色和藍色通道的值,Gray是灰度化的頻譜圖.
圖像的尺度越大凸顯的細節(jié)越明顯,但整體的形態(tài)特征不夠突出,如圖11所示;而尺度越小,容易突出其整體的形態(tài)特征,本文將頻譜圖像尺度縮小到50×50,得到如圖12所示的圖像.對比圖11和圖12:發(fā)現(xiàn)圖12的L形態(tài)特征較圖11更為明顯,且降低的數(shù)據(jù)維度更有利于計算.
圖11 原尺度Fig.11 The original scale
圖12 小尺度Fig.12 The smaller scale
觀察圖12發(fā)現(xiàn)該圖像條紋狀紋理比較嚴(yán)重,表明該圖具有明顯的階躍邊緣.這些邊緣信息不利于L形態(tài)特征的識別.為了弱化階躍邊緣對識別的影響,本文設(shè)計如圖13a所示的模糊卷積核,用其對圖12進行卷積處理,得到如圖13b所示的效果:其階躍邊緣信息被弱化了.
圖13 模糊卷積(a) 模糊卷積核; (b) 模糊卷積效果.Fig.13 Fuzzy convolution(a) Kernel; (b) Result.
為了進一步增強閃電哨聲波L形狀特征提高分類性能,根據(jù)L形態(tài)的特點,設(shè)計如圖14a所示的9×9的L形態(tài)卷積核(關(guān)于卷積核尺度為何是9×9,將在討論部分進行詳細分析),采用該卷積核對圖13b進行卷積計算,得到如圖14b所示的效果,增強了L形態(tài)特征.
圖14 L特征卷積(a) L特征卷積核; (b) 卷積效果.Fig.14 L characteristic convolution(a) Kernel; (b) Result.
將圖14b的圖像輸入到支持向量機(SVM)分類器進行訓(xùn)練和識別.SVM是基于統(tǒng)計理論的監(jiān)督分類器(Sánchez and David, 2003).本文中的類別主要有兩種:閃電哨聲波和非閃電哨聲波.首先,將時頻圖數(shù)據(jù)分為訓(xùn)練集和測試集.
訓(xùn)練集的圖像數(shù)據(jù)被表示為:x1,x2,…,xn,其相應(yīng)的類別標(biāo)簽是y1,y2,…,yn,yi∈[-1,1] ,其中-1表示該樣本中無閃電哨聲波,1表示該樣本中有閃電哨聲波.
線性SVM分類器的主要目標(biāo)是找到一個超平面w=(w1,w2,…,wn),能夠?qū)ⅰ?1”類和“1”類更好地分開.該超平面的數(shù)學(xué)模型如公式(4)所示:
wx+b=0,
(4)
其中x是在超平面上的樣本點,b是偏置.
若存在使得分類間隔最大的超平面,其滿足下列條件:閃電哨聲波的樣本正確地落在閃電哨聲波的分類區(qū),則有公式(5);
(wxi+b)≥+1,yi=1.
(5)
非閃電哨聲波的樣本正確落在非閃電哨聲波的分類區(qū),則有公式(6);
(wxi+b)≤-1,yi=-1,
(6)
公式(5)和公式(6)合成一個公式(7):
yi(wxi+b)-1≥0.
(7)
SVM將在眾多的分類超平面中,自動尋找使得特征空間間隔最大的超平面.其數(shù)學(xué)模型表示為公式(8):
max 1/‖w‖ s.t.yi(wxi+b)-1≥0
(i=1,2,…,n).
(8)
訓(xùn)練模型的目的是找到滿足式(8)的w.
由于大部分情況下,數(shù)據(jù)無法滿足線性可分的要求,此時滿足上述條件的超平面不存在,對于這種非線性可分的問題,SVM 提供核函數(shù)k(xi,xj)代替公式(5),將原數(shù)據(jù)映射到高維空間,使得其在高維空間線性可分(Sánchez and David, 2003).本文中的核函數(shù)采用的是多項式核函數(shù)如式(9)所示:
(9)
由于閃電哨聲波的樣本與非閃電哨聲波的樣本不均衡,按照傳統(tǒng)的機器學(xué)習(xí)的慣例:正負樣本的比例不能超過1∶3.而本文中的閃電哨聲波樣本是316個,與之對應(yīng)的非閃電哨聲波的樣本數(shù)據(jù)量不能超過1000個,實際上本文獲得的非閃電哨聲波的樣本是8000個.為了測試提出的閃電哨聲波識別算法是否有效,制定下列實驗方案.
1)數(shù)據(jù)集
數(shù)據(jù)集由316個閃電哨聲波樣本和1000個非閃電哨聲波樣本組成.1000個非閃電哨聲波樣本是從8000個非閃電哨聲波數(shù)據(jù)中進行隨機選擇而得到.該過程得到316個閃電哨聲波組成的正樣本集和1000個非閃電哨聲波組成的負樣本集.
2)訓(xùn)練集和測試集
從正樣本集隨機取80%的數(shù)據(jù)作為訓(xùn)練樣本集,同樣從負樣本集隨機取80%作為訓(xùn)練樣本,該過程得到含有正樣本和負樣本的訓(xùn)練集.
將正樣本集和負樣本集中剩下的樣本組合為測試集.
3)特征提取
針對訓(xùn)練集,用以下三種不同的特征提取方法提取時頻圖像特征:
(1) 原始灰度圖像特征,用Gray表示.
(2) 對原始灰度圖像進行模糊卷積處理后的特征,用Gray_Blur表示.
(3) 先對原始灰度圖像進行模糊卷積處理,再采用本文提出的L形態(tài)卷積核進行處理得到的圖像特征,用Gray_Blur_L表示.
4)訓(xùn)練
用三種不同的特征分別訓(xùn)練SVM模型,得到三種不同的基于SVM的閃電哨聲波識別模型.
5)測試
針對測試集的數(shù)據(jù),提取三種不同的特征,并分別輸入三個不同的SVM識別模型進行識別.
6)評估識別效果
對識別效果采用四種指標(biāo)進行評估:精度(Precision)、召回率(Recall)、F1值和ROC面積(AUC).
7)重復(fù)實驗
重復(fù)上述實驗過程10000次.
本算法中的SVM來自Python的SVC庫.選擇的核函數(shù)是多項式核,如公式(9)所示.通過交叉驗證得到的最佳參數(shù)d是13,其他均使用該庫下的默認(rèn)參數(shù).
采用四種不同的評價指標(biāo)評估每一次實驗的效果,設(shè)P表示正類樣本,N表示負類樣本,接下來將闡述四種指標(biāo)的定義.
首先,符號定義如表2所示.
表2 符號定義Table 2 Symbol definition
(1)精度(Precision)的定義如式(10)所示:
Precision =TP/(FP+TP),
(10)
含義:在預(yù)測出的所有正例中(TP+FP),真正例(TP)占的比例,通常該指標(biāo)越大越好.
(2)召回率(Recall)的定義如式(11)所示:
Recall =TP/(TP+FN) ,
(11)
含義:在數(shù)據(jù)集中所有的正例中(TP+FN),真正例(TP)占的比例,通常該指標(biāo)越大越好.
(3)F1值(F1-Score)的定義如式(12)所示:
F1=2/(1/ Precision +1/Recall) ,
(12)
其含義:通常情況下,Precision高,Recall就低,Recall高,Precision就低.指標(biāo)F1-score,綜合考慮Precision和Recall的調(diào)和值.Recall不變時,Precision越大,1/Precision越小,從而F1越大.同理: Precision不變時,Recall越大,1/Recall越小,從而F1越大.該指標(biāo)1越大越好.
(4)AUC-ROC:ROC(receiver operating characteristic curve, ROC)曲線下的面積,該值越高意味著分類的排序性能越佳.
在每一次實驗的訓(xùn)練集和測試集上,均使用三種不同的特征提取方法提取圖像特征,并以此訓(xùn)練得到三個不同的分類器,最后采用精度、召回率、F1和ROC-AUC評估每一個分類器的性能.由于每次的訓(xùn)練集和測試集不同,單次的四個評估指標(biāo)難以充分評價本文提出的閃電哨聲波識別算法的效果,因此,開展實驗10000次,并在四個評估指標(biāo)的基礎(chǔ)上制定了如下的評價策略:
(1)部分識別結(jié)果展示.
(2)總體識別效果評價:對10000次實驗的四個評價指標(biāo)值分別求平均值,以此來評價不同算法的總體識別效果.
(3)識別效果穩(wěn)定性評價:對10000次實驗的四個評價指標(biāo)采用盒形圖評估識別算法的穩(wěn)定性.
(4)識別效果差異性評價:為了評價不同的特征之間導(dǎo)致的分類效果是否具有明顯差異,采用T檢驗進行差異性評價.閾值p=0.05,即小于0.05為具有明顯差異,若大于0.05表明不具有明顯差異.
3.4.1 部分識別結(jié)果展示
部分識別結(jié)果如圖15和圖16所示:圖15是識別閃電哨聲波的部分結(jié)果,(a)是正確識別的時頻圖,(b)誤識別的時頻圖像.之所以將圖15b識別錯誤的原因是:其L形態(tài)特征(實線箭頭所示)相比右邊的“嘶吼”(虛線箭頭所示)特征明顯微弱很多,該特點在灰度圖中更為明顯,如圖15c所示,此時時頻圖的主要信息體現(xiàn)在嘶吼的特征上,則分類器出現(xiàn)了誤判;圖16是識別非閃電哨聲波識別的部分結(jié)果,(a)是正確識別的結(jié)果,(b)是誤識別的結(jié)果.識別錯誤的原因是圖像中出現(xiàn)的多重“嘶吼”造成了L形態(tài)特征的假象,如圖(c)(d)(e)所示,分類器出現(xiàn)了誤判.
圖15 閃電識別(a) 正確識別; (b) 錯誤識別; (c) 灰度化圖(b).Fig.15 Lightning identification(a) Correct identification; (b) Error identification; (c) The gray image of the (b).
圖16 非閃電識別(a) 正確識別; (b) 錯誤識別; (c) 灰度化圖(b); (d) 模糊卷積圖(c); (e) L形態(tài)卷積核處理圖(d).Fig.16 The performance of recognizing the image without lightning whistles(a) Correct identification; (b) Error identification; (c) Grayscale map (b); (d) Processing the (c) with fuzzy convolution; (e) Processing figure (d) with the L morphological convolution kernel.
3.4.2 總體識別精度評價
本小節(jié)主要針對10000次的Precision、Recall、F1和AUC-ROC求平均值,度量不同圖像特征下的閃電哨聲波分類效果,定量結(jié)果如表3和表4所示.
表3 10000次實驗后的平均效果Table 3 The performance obtained by 10000 experiments
表4 ROC面積AUC的均值Table 4 The mean of the AUC of the ROC area
通過觀察表3和表4可發(fā)現(xiàn):
(1)基于Gray_Blur_L特征的閃電哨聲波分類效果,在Precision、Recall和F1score三個指標(biāo)上明顯優(yōu)于Gray_Blur特征和Gray特征.比如觀察表3中的精度指標(biāo),Gray_Blur_L特征使閃電哨聲波識別精度達到0.945,優(yōu)于Gray_Blur特征的0.915和Gray特征的0.732.
(2)基于Gray_Blur_L特征的閃電哨聲波分類效果,在AUC指標(biāo)上明顯優(yōu)于Gray_Blur特征和Gray特征.比如,Gray_Blur_L特征使得分類器的排序能力達到0.989,優(yōu)于Gray_Blur特征的0.975和Gray特征的0.882.
總之,本文通過創(chuàng)建L形態(tài)卷積核提取的Gray_Blur_L特征在閃電哨聲波分類的各項性能方面表現(xiàn)最佳.
3.4.3 識別效果穩(wěn)定性評價
為了對分類的穩(wěn)定性進行定性評價,根據(jù)每個指標(biāo)的10000個數(shù)值繪制如圖17和圖18的盒形圖.
圖17 精度、召回率和F1的盒形圖(a) 閃電哨聲波; (b) 非閃電哨聲波.Fig.17 The box diagram of the precision, recall rate and F1(a) Lightning-whistler; (b) Non-lightning-whistler.
圖18 AUC 盒形圖Fig.18 AUC box
(1)Gray_Blue_L特征分類器在精度(Precision)、召回率(Recall)和F1score三個指標(biāo)上的表現(xiàn)最好且識別性能最穩(wěn)定.比如圖17a最左邊的精度圖,其橫軸是不同的圖像特征提取方法,縱軸是精度,仔細觀察發(fā)現(xiàn):Gray_Blur_L特征對應(yīng)的箱體的高度最小,說明該特征分類器的精度最穩(wěn)定;同時,Gray_Blur_L箱體的中位線均高于Gray_Blur特征和Gray特征的箱體的中位線,表明Gray_Blur_L特征分類器在識別閃電哨聲波時,其精度最高;按照同樣的方法觀察圖17a中間的圖和最右邊的圖可得結(jié)論:在識別閃電哨聲波時,Gray_Blur_L特征分類器的召回率和F1score指標(biāo)的值最優(yōu)且分類性能最穩(wěn)定;按照同樣的方式觀察如圖17b的三幅子圖,可以得到如下結(jié)論:在對非閃電哨聲波進行分類時,Gray_Blue_L特征分類器在精度、召回率和F1score值三個指標(biāo)的值最高,且性能最穩(wěn)定.
(2)觀察三個分類器的10000個AUC指標(biāo)的盒形圖,如圖18所示:其橫軸是不同的特征提取方法,縱軸是AUC值.發(fā)現(xiàn):Gray_Blue_L的箱體高度最小中位線的位置最高.這說明Gray_Blue_L特征所訓(xùn)練的分類器不僅僅波動較小且具有最好的排序能力.
總之,由Gray_Blur_L圖像特征學(xué)習(xí)得到的分類器,不僅僅具有更可靠的分類效果且分類性能更穩(wěn)定.
3.4.4 識別效果顯著性差異評價
為了檢驗不同的特征分類器的性能是否存在明顯差異,采用T檢驗方法對顯著性差異進行定量評價,其顯著性P值越高,表明顯著差異性越小,通常閾值是0.05,其含義是若差異性小于0.05則認(rèn)為存在明顯差異;若大于0.05則認(rèn)為兩組實驗不存在明顯差異.其結(jié)果如表5—8所示.
首先,對三種不同特征分類器的精度(Precision)指標(biāo)的分布數(shù)據(jù),兩兩進行T檢驗,得到如表5的檢驗值.比如對Gray和Gray_Blur的數(shù)據(jù)進行T檢驗,得到其P值是0,表明:Gray特征分類器和Gray_Blur特征分類器在分類精度方面存在明顯差異.再比如, 對Gray特征分類器的自身進行比較檢驗,即對Gray特征分類器和Gray特征分類器進行T檢驗的P值是1,表明:數(shù)據(jù)之間無顯著性差異.然后,按照上述方法觀察表6—8,發(fā)現(xiàn):三種不同特征的分類器在召回率方面、排序能力等方面均存在明顯差異.
表5 T檢驗P值(Precision)Table 5 T tests for Precision
表6 T檢驗P值(Recall)Table 6 T tests for Recall
表7 T檢驗P值(F1Score)Table 7 T tests for F1Score
表8 T檢驗P值(AUC)Table 8 T tests for AUC
總之,采用Gray特征,Gray_Blur特征,Gray_Blur_L特征進行閃電哨聲波識別,其識別效果在精度、召回率、F1值和AUC值均存在明顯差異,且Gray_Blur_L特征分類器的分類效果最佳.
上述實驗表明基于張衡衛(wèi)星SCM數(shù)據(jù)開展自動化識別閃電哨聲波的算法研究具有一定的效果.算法方案中的模糊卷積核和L特征卷積核對閃電哨聲波識別具有非常重要的影響.本章節(jié)將對其產(chǎn)生的影響開展較深入的討論和分析,同時對閃電哨聲波自動識別的延伸研究進行展望.
實驗結(jié)果表明采用模糊卷積核提取圖像特征進行閃電分類的效果優(yōu)于采用原始頻譜圖為特征的識別效果,本小節(jié)將從視覺觀察角度和特征可分角度對其展開討論.
4.1.1 視覺觀察角度
原始頻譜圖具有明顯的垂直信息痕跡,如圖19所示:大量的垂直信息的存在對L形態(tài)特征的識別產(chǎn)生了巨大的影響,而圖20是采用模糊卷積核對垂直信息進行模糊處理后的圖像,其垂直信息被減弱,同時凸顯了其L形態(tài)特征.
圖19 含有閃電信息的原始灰度圖Fig.19 Original gray image containing lightning whistlers
圖20 采用模糊卷積核處理后的圖像Fig.20 The resulting image processed by fuzzy convolution kernel
4.1.2 特征可分的角度
為了探索模糊卷積處理后的圖像特征與原始灰度圖的特征是否具有不同的可分性.本小節(jié)將采用主成分分析(Principal Components Analysis, PCA)的降維技術(shù)將316個閃電哨聲波樣本和1000個隨機的非閃電哨聲波樣本降至2維,并繪制出其在2維空間的分布,以觀察特征的可分性趨勢,如圖21所示.
圖21a是閃電哨聲波與非閃電哨聲波數(shù)據(jù)的原始特征分布,其橫坐標(biāo)和縱坐標(biāo)表示降維后的2個維度;圖21b是被模糊卷積處理后的特征分布;其中1代表閃電哨聲波,-1是非閃電哨聲波,觀察圖21發(fā)現(xiàn):原始圖像特征有大量的正負樣本聚集在一起的情況,尤其是圖21a中的圓形區(qū)域,這些疊加在一起的正負樣本增加了識別閃電哨聲波和非閃電哨聲波的難度,導(dǎo)致分類器識別閃電的性能下降;相比之下,圖21b的圓形區(qū)域,正負樣本聚集在一起的數(shù)量較前者有大幅減少,該現(xiàn)象使得正負樣本的區(qū)分提高,增加了閃電哨聲波和非閃電哨聲波圖像特征的區(qū)分度,使得分類器識別閃電哨聲波的能力增強.
圖21 特征分布趨勢圖Fig.21 Character distribution
從實驗結(jié)果發(fā)現(xiàn)在模糊卷積處理圖像的基礎(chǔ)上,再采用9×9的L特征卷積核處理,使得閃電哨聲波分類的效果更優(yōu),接下來針對L特征卷積核的識別效果和尺度選擇從兩個方面進行深入討論.
4.2.1 視覺觀察角度
從圖22中發(fā)現(xiàn)相比較原始圖像,模糊核提取的L特征更為明顯,如圖22a和圖22b所示;進一步觀察,采用3×3的L卷積核提取的L特征如圖22c所示,由于太暗,將圖22c的矩形區(qū)域進行放大如圖22j所示,發(fā)現(xiàn)大部分的細節(jié)信息被濾除,隱隱約約可看到L特征(如圖22j的橢圓區(qū)域所示),說明其只保留了L特征的主輪廓;隨著L卷積核尺度變大,L特征周圍的細節(jié)信息越來越多,如圖22(d,e,f)所示;隨著L卷積核的尺度進一步增大,不僅L特征周圍的細節(jié)強度越來越明顯,且與L區(qū)域無關(guān)的地方亦出現(xiàn)了較多的細節(jié).
圖22 不同卷積核提取的圖像特征(含有閃電哨聲波的圖像)(a) 原始灰度圖; (b) 模糊卷積核處理后的圖像; (c) 尺度3×3的L卷積核處理b后的圖像; (d) 尺度5×5的L卷積核處理b后的圖像; (e) 尺度7×7的L卷積核處理b后的圖像; (f) 尺度9×9的L卷積核處理b后的圖像; (g) 尺度11×11的L卷積核處理b后的圖像; (h) 尺度13×13的L卷積核處理b后的圖像; (i) 尺度15×15的L卷積核處理b后的圖像.Fig.22 Image features extracted by different convolution kernel (containing lightning whistlers)(a) The original grayscale image; (b) The image processed by the fuzzy convolution kernel;(c) The image obtained by processing the (b) with 3×3 L convolution kernel; (d) The image obtained by processing the (b) with 5×5 L convolution kernel; (e) The image obtained by processing the (b) with 7×7 L convolution kernel; (f) The image obtained by processing the (b) with 9×9 L convolution kernel; (g) The image obtained by processing the (b) with 11×11 L convolution kernel; (h) The image obtained by processing the (b) with 13×13 L convolution kernel; (i) The image obtained by processing the (b) with 15×15 L convolution kernel.
進一步觀察圖23,小尺度的L卷積核能夠濾除細節(jié)信息,如圖23(c,d,e)所示;隨著L卷積核尺度的不斷增加,其細節(jié)信息越來越明顯,如圖23(f,g)所示;當(dāng)尺度進一步增加時,放大的干擾信息產(chǎn)生了與L特征相似的形態(tài),如圖23i的圓形區(qū)域,即大尺度L卷積核容易將該區(qū)域的噪聲放大,容易影響識別性能.因此,小尺度的L卷積核濾除L特征周圍太多的細節(jié)信息,太大的L卷積核又容易放大非閃電圖像中的噪聲,如何自動選擇尺度合適的L卷積核是一個需要進一步思考的問題.
圖23 不同卷積核提取的圖像特征(含有非閃電哨聲波的圖像)(a) 原始灰度圖; (b) 模糊卷積核處理后的圖像; (c) 尺度3×3的L卷積核處理b后的圖像; (d) 尺度5×5的L卷積核處理b后的圖像; (e) 尺度7×7的L卷積核處理b后的圖像; (f) 尺度9×9的L卷積核處理b后的圖像; (g) 尺度11×11的L卷積核處理b后的圖像; (h) 尺度13×13的L卷積核處理b后的圖像; (i) 尺度15×15的L卷積核處理b后的圖像.Fig.23 Image features extracted by different convolution kernel (not containing lightning whistlers)(a) The original grayscale image; (b) The image processed by the fuzzy convolution kernel; (c) The image obtained by processing the (b) with 3×3 L convolution kernel; (d) The image obtained by processing the (b) with 5×5 L convolution kernel; (e) The image obtained by processing the (b) with 7×7 L convolution kernel; (f) The image obtained by processing the (b) with 9×9 L convolution kernel; (g) The image obtained by processing the (b) with 11×11 L convolution kernel; (h) The image obtained by processing the (b) with 13×13 L convolution kernel; (i) The image obtained by processing the (b) with 15×15 L convolution kernel.
4.2.2 特征可分的角度
為了定性地比較不同特征的可分性,首先采用不同的特征提取方式提取316個閃電哨聲波樣本和1000個隨機的非閃電哨聲波樣本的圖像特征,并采用PCA技術(shù)將特征維度降至二維,最后,將其繪制在二維空間,以觀察其相應(yīng)的特征的分布情況,并分析其可分性的趨勢,其中+1表示閃電樣本數(shù)據(jù),-1表示非閃電樣本數(shù)據(jù),如圖24所示.
圖24 圖像特征降至二維的示意圖(a) 模糊卷積核處理后的圖像; (b)尺度3×3的L卷積核處理a后的圖像; (c) 尺度5×5的L卷積核處理a后的圖像; (d) 尺度7×7的L卷積核處理a后的圖像; (e) 尺度9×9的L卷積核處理a后的圖像; (f) 尺度11×11的L卷積核處理a后的圖像; (g) 尺度13×13的L卷積核處理a后的圖像; (h) 尺度15×15的L卷積核處理a后的圖像.Fig.24 Represent the image characters at two-dimensional space(a) The images obtained by processing the original image with fuzzy convolution kernel; (b) The images obtained by processing (a) with 3×3 L convolution kernel; (c) The images obtained by processing (a) with 5×5 L convolution kernel; (d) The images obtained by processing (a) with 7×7 L convolution kernel; (e) The images obtained by processing (a) with 9×9 L convolution kernel; (f) The images obtained by processing (a) with 11×11L convolution kernel; (g) The images obtained by processing (a) with 13×13 L convolution kernel; (h) The images obtained by processing (a) with 15×15 L convolution kernel.
通過圖24可發(fā)現(xiàn):模糊卷積核提取的圖像特征如圖24a所示,雖然整體上看大部分的正負樣本均已分開,但在中間仍然存在正負樣本疊加在一起的情況;圖24b是在通過先采用模糊卷積處理圖像,再采用3×3的L卷積核處理圖像得到的特征在二維空間的分布效果,與圖24a相比,正負樣本之間的距離拉開了,隨著L卷積核尺度的增加,正負類之間的可分性均優(yōu)于圖24a,但與圖24b相比其差異不大,如圖24(c,d,f)所示;然而值得一提的是,閃電哨聲波樣本的類內(nèi)越來越積聚,表明閃電哨聲波樣本的類內(nèi)差越來越小,該情況有利于閃電事件的識別,如圖24f;隨著L特征卷積核的尺度的進一步增大,發(fā)現(xiàn)部分閃電哨聲波樣本和非閃電樣哨聲波樣本存在相互重疊的現(xiàn)象,如圖24(g,h)中的圓形區(qū)域所示.而且隨著尺度的增加,這個重疊現(xiàn)象越來越嚴(yán)重,如圖24h所示.此外,其非閃電哨聲波數(shù)據(jù)的類內(nèi)越來越疏散,表明非閃電哨聲波樣本的類內(nèi)差越來越大,該情況不利于對非閃電哨聲波進行分類.
總之,尺度合適的L卷積核能夠較好地對閃電哨聲波與非閃電哨聲波進行分類.太小的尺度雖然能夠提高分類效果,但是閃電哨聲波的類內(nèi)差大,不利于閃電哨聲波的識別;太大的尺度容易造成非閃電哨聲波和閃電哨聲波在特征空間發(fā)生重疊,導(dǎo)致類間方差越來越?。灰鄬?dǎo)致非閃電哨聲波類內(nèi)方差變大;類間方差小和類內(nèi)方差大將嚴(yán)重影響分類器的分類效果.
4.2.3 統(tǒng)計盒形圖的角度
利用不同尺度的L卷積核提取的圖像特征并訓(xùn)練閃電哨聲波分類器,計算反映分類器排序能力的AUC值,重復(fù)實驗10000次,得到該特征下的分類器的AUC指標(biāo)的分布情況,如圖25所示:其橫軸是不同的特征提取方法,最左邊是采用模糊卷積核提取的圖像特征,接下來依次是3×3 L形態(tài)卷積核、5×5 L形態(tài)卷積核、…、15×15 L形態(tài)卷積核.發(fā)現(xiàn)原始灰度特征的AUC的箱體遠遠高于基于L形態(tài)卷積核的箱體.尤其在卷積核是13×13的時候,其AUC箱體不僅僅最小而且其中位數(shù)最高.說明采用尺度為13×13的L卷積核提取的特征訓(xùn)練得到的分類器,具有最穩(wěn)定最優(yōu)的排序能力.
圖25 不同特征訓(xùn)練的分類器的AUCFig.25 Use different features to train the different classifier
同樣,采用不同尺度的L卷積核提取的特征訓(xùn)練分類器,重復(fù)10000次,可分別獲得10000個精度指標(biāo)值(Precision)、召回率值和F1score值,其數(shù)據(jù)分布如圖26a所示,圖中Blur表示采用模糊卷積核提取的特征,L3表示3×3的L形卷積核,以此類推,L15表示15×15的L形卷積核.觀察發(fā)現(xiàn):在識別閃電哨聲波的過程中,未采用L卷積核提取特征的分類器,其Recall指標(biāo)的箱體均高于采用L形卷積特征的箱體,特別是在圖26a第2幅圖的L9的位置,該位置意味著卷積核的尺度是9×9,同時發(fā)現(xiàn)該位置的中位線均高于其他位置的箱體的中位線,表明采用該尺度卷積核提取的特征訓(xùn)練分類器,其性能在召回率上不僅僅波動最小而且精度最優(yōu).同時發(fā)現(xiàn),Recall數(shù)據(jù)的箱體均在L3和L15位置,箱體高度變高,且中位線下降.意味著尺度太小的L形卷積核,如尺度為3×3,和尺度太大的卷積核,如尺度為15×15的L形卷積核,均使得閃電哨聲波識別的性能下降.上述同樣的性能亦體現(xiàn)在F1score的分布圖上.但其精度變化不是很大.圖26b呈現(xiàn)的是識別非閃電哨聲波的三個指標(biāo)的數(shù)據(jù),情況分別是:在精度指標(biāo)上,L9位置的中位線達到最高,表明該尺度的卷積核效果在該位置上最佳,與該位置相比,最小的尺度(L3)和最大的尺度(L15)效果均不理想;在召回率指標(biāo)上,卷積核尺度對其影響不大;在F1score,最小尺度的卷積核效果較差.
圖26 不同特征訓(xùn)練的分類器的三個指標(biāo)分布情況(a) 識別閃電哨聲波; (b) 識別非閃電哨聲波.Fig.26 Performance of the classifiers(a) Lightning whistlers; (b) Without lightning whistlers.
總之,基于卷積核提取的圖像特征不僅僅具有更好的分類性能且比原始灰度的波動小,分類性更穩(wěn)定.
基于電磁衛(wèi)星的SCM數(shù)據(jù)的閃電哨聲波識別方案可行且魯棒性較好,以此可以獲得大量的閃電哨聲波數(shù)據(jù),在此基礎(chǔ)上,可開展下列四個方面的研究:
(1)通過式(13)得到質(zhì)子回旋頻率(fc):
(13)
其中q是質(zhì)子電荷,為1.60217733×10-19C,m是質(zhì)子的質(zhì)量,為1.672621637×10-27kg;B是磁感應(yīng)強度,單位是T.繪制質(zhì)子回旋頻率,如圖27中箭頭所指.以質(zhì)子回旋頻率作為參考,分析閃電哨聲波相對于質(zhì)子回旋頻率的位置,借此,進一步分析全球閃電哨聲波隨地點、季節(jié)、年等時空變化的規(guī)律.
圖27 質(zhì)子回旋頻率Fig.27 Proton cyclotron frequency
(2)從圖27發(fā)現(xiàn)閃電哨聲波存在許多不同類型的色散形態(tài).該現(xiàn)象與閃電哨聲傳播環(huán)境有關(guān).閃電發(fā)射的脈沖輻射沿著地球-電離層波導(dǎo)傳播.在電離層底層一部分輻射溢出地球-電離層波導(dǎo)傳到電離層,并以哨聲模傳播.因為電子數(shù)陡峭的正梯度,向上傳播的哨聲模波動方向角在穿越電離層時被折射,在F層頂端變成近似垂直.在穿越電離層時,波動功率譜密度因為庫倫損失被減弱.當(dāng)波動到達等離子體層的時候,最初的VLF輻射已經(jīng)遠離它的源,由等離子體層電子密度梯度和磁場梯度引導(dǎo)傳播(曹晉濱等,2009).當(dāng)上述環(huán)境發(fā)生變化時,其呈現(xiàn)的色散形態(tài)亦不同.可通過對閃電哨聲波色散形態(tài)進一步開展聚類分析來挖掘全球電離層環(huán)境的特點.
(3)Fiser等(2010)提出哨聲波幅度可視作經(jīng)過某固定距離閃電的電流強度的函數(shù),并指出歐洲的閃電哨聲波的幅度與閃電源和衛(wèi)星軌道的位置有很大關(guān)系.可以結(jié)合地面閃電觀測系統(tǒng)與衛(wèi)星觀測電場數(shù)據(jù),探索閃電源到衛(wèi)星之間的距離與閃電哨聲波幅度的關(guān)系.
(4)本方案可進一步拓展到從衛(wèi)星數(shù)據(jù)中去識別其他具有明確形態(tài)特征的空間物理現(xiàn)象.比如嘶聲、合聲、地面甚低頻發(fā)射機VLF波動、地面電力系統(tǒng)的諧頻輻射、電磁離子回旋波等.這些空間現(xiàn)象的頻譜具有明顯的形態(tài)特征,自動識別這些非震的空間現(xiàn)象有助于剝離非震的電磁擾動,推動自動識別地震電磁擾動的發(fā)展.
(5) 本文介紹的方法是提取如圖28所示的時頻圖像中的L形態(tài)特征(如圖29所示)并進一步識別該時頻圖中是否存在閃電哨聲波,未直接對閃電哨聲波進行描跡.基于閃電哨聲波軌跡提取的截止頻率、持續(xù)時間、色散階數(shù)等信息對認(rèn)知哨聲波的傳播過程、獲取背景參數(shù)信息至關(guān)重要.未來將以本文提出的方法為基礎(chǔ),實現(xiàn)基于時頻圖的閃電哨聲波描跡:當(dāng)識別某時頻圖中存在閃電哨聲波后,首先將如圖28所示的彩色時頻圖像中的每個像素點從RGB顏色空間轉(zhuǎn)化到HSV顏色空間,設(shè)置色調(diào)閾值T0;再通過本文提出的方法將彩色時頻圖像轉(zhuǎn)換成L特征圖,如圖29所示,并設(shè)置閾值T1;若某像素點在HSV顏色空間中的H值高于該閾值T0,同時該點在L特征圖中像素值高于T1,則表明該點為閃電哨聲波軌跡點,以完成自動描跡功能.
圖28 含有閃電哨聲波的時頻圖Fig.28 Time-Frequency profile
本文在張衡一號衛(wèi)星的SCM數(shù)據(jù)上開展自動化識別閃電哨聲波的研究.根據(jù)頻譜數(shù)據(jù)的特點和閃電哨聲波的L形態(tài)特征設(shè)計了模糊卷積核和L形態(tài)卷積核,進一步增強了頻譜圖中的閃電形態(tài)特征,并采用SVM分類器對特征進行分類,使得其識別性能在精度、召回率以及排序能力等方面均處于94%以上.
然而,由于閃電哨聲波樣本(正樣本)量太少,非閃電哨聲波樣本(負樣本)量大,為了避免分類器在分類的過程中容易出現(xiàn)偏好負樣本的情況,文中采用的是降采樣負樣本的策略.為了得到更為魯棒的閃電哨聲波識別效果,需要增加正樣本數(shù)量,以平衡正負樣本量.因此,未來的工作主要集中在三個方面:
(1)在本次探索基礎(chǔ)上進一步增加正樣本量,并探索采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)的自動化特征提取方法;
(2)當(dāng)獲得大量的閃電哨聲波事件后進一步提取其頻率和幅度的變化并聯(lián)合其他載荷數(shù)據(jù),建立閃電哨聲波頻率/幅度與等離子體離子密度、離子溫度、離子速度、等離子體電子溫度、電子密度之間的數(shù)學(xué)模型;
(3)本研究提出的識別方案,可進一步拓展應(yīng)用于從張衡衛(wèi)星的數(shù)據(jù)中自動識別人工發(fā)射源、磁暴等空間事件;
(4) 鑒于我國地面ELF/VLF接收機系統(tǒng)獲得的突破性進展(Chen et al., 2016, 2017; Zhou et al., 2020; Yi et al., 2020),下一步將利用張衡一號衛(wèi)星數(shù)據(jù)和我國地面的ELF/VLF接收機觀測數(shù)據(jù)開展閃電哨聲波聯(lián)合觀測研究.
致謝本文特別感謝來自應(yīng)急管理部國家自然災(zāi)害防治研究院的張衡一號衛(wèi)星團隊的所有成員為本研究提供的技術(shù)服務(wù)支持.