亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于改進(jìn)EWT和LogitBoost集成分類器的地震事件分類識(shí)別算法

        2022-10-11 00:59:24張家聲李亞南
        地震工程學(xué)報(bào) 2022年5期
        關(guān)鍵詞:分類器波形準(zhǔn)確率

        孟 娟,張家聲,李亞南

        (1.防災(zāi)科技學(xué)院 電子科學(xué)與控制工程學(xué)院,河北 三河 065201;2.中國地質(zhì)科學(xué)院 地球物理地球化學(xué)勘查研究所,河北 廊坊 065000)

        0 引言

        根據(jù)產(chǎn)生機(jī)理的不同,地震事件一般可分為天然地震和非天然地震兩大類,人工爆破就是最常見的非天然地震類型之一。隨著地震監(jiān)測(cè)能力的不斷提升,以及礦藏勘探和開發(fā)等人類生產(chǎn)活動(dòng)干擾的急劇增加,地震臺(tái)站每天都會(huì)監(jiān)測(cè)到大量天然與人工地震數(shù)據(jù),如果不能及時(shí)、準(zhǔn)確地對(duì)這些記錄進(jìn)行分類,不僅會(huì)造成地震目錄污染,降低地震觀測(cè)資料質(zhì)量,也會(huì)影響地震監(jiān)測(cè)預(yù)警的準(zhǔn)確度。因此,快速、準(zhǔn)確地從震源事件波形中識(shí)別出天然地震與人工爆破事件一直是地震學(xué)研究及相關(guān)應(yīng)用領(lǐng)域的一個(gè)熱點(diǎn)問題。

        圍繞天然地震和人工爆破事件的分類識(shí)別,國內(nèi)外眾多學(xué)者展開了廣泛而深入的研究,通過提取地震信號(hào)波形、震相、頻譜等方面的特征,基于統(tǒng)計(jì)模式識(shí)別[1-3]、機(jī)器學(xué)習(xí)[4-6]、深度學(xué)習(xí)[7-8]等方法進(jìn)行事件類型判別,取得了一定成果。其中,統(tǒng)計(jì)模式識(shí)別嚴(yán)重依賴于特征提取,深度學(xué)習(xí)需要大量的訓(xùn)練數(shù)據(jù),且對(duì)硬件要求高[9],而機(jī)器學(xué)習(xí)對(duì)數(shù)據(jù)和硬件的依賴較小,且識(shí)別準(zhǔn)確率高[10],因此利用機(jī)器學(xué)習(xí)算法進(jìn)行地震事件分類成為趨勢(shì)。尤其是反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)[11]、支持向量機(jī)(Support Vector Machine,SVM)算法[6,12-13]被廣泛應(yīng)用于地震事件分類,成為主流分類識(shí)別方法。但BP神經(jīng)網(wǎng)絡(luò)容易陷入局部最優(yōu),且隱層數(shù)、隱層節(jié)點(diǎn)等參數(shù)無法預(yù)先確定,識(shí)別準(zhǔn)確率受限;而SVM性能優(yōu)劣取決于核函數(shù),若缺乏有效手段選取合適核函數(shù)將影響分類準(zhǔn)確率。

        在地震事件性質(zhì)分類過程中,如何提取有效的地震信號(hào)屬性特征是分類準(zhǔn)確與否的關(guān)鍵。國內(nèi)外研究學(xué)者對(duì)地震事件提取了多種判別依據(jù),如波形時(shí)域特征、頻譜特征等。這些方法各有特色,也有較好效果,但由于地震信號(hào)本身的復(fù)雜性,使得單獨(dú)采用某種特征進(jìn)行識(shí)別的普適性不夠,識(shí)別效果受限,因此研究人員開始綜合提取時(shí)頻域或變換域特征進(jìn)行識(shí)別,取得了較好的識(shí)別效果。如王婷婷等[14]利用小波包對(duì)信號(hào)分解,使用不同分解系數(shù)中的P波和S波能量進(jìn)行地震與爆破的識(shí)別;Beccar-Varela等[15]通過小波變換進(jìn)行信號(hào)分解,基于分解后的時(shí)頻能量特征進(jìn)行地震事件識(shí)別;楊千里等[16]利用廣義S變換獲取地震與爆炸時(shí)頻譜圖二階矩進(jìn)行識(shí)別。以上方法證明提取不同變換域特征能有效進(jìn)行地震識(shí)別。畢明霞等[17]利用經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)對(duì)地震信號(hào)進(jìn)行分解后,提取地震記錄特征進(jìn)行SVM識(shí)別,識(shí)別率高。但小波和小波包變換的小波基選擇缺乏自適應(yīng)性,廣義S變換依賴于窗函數(shù)調(diào)節(jié)參數(shù),EMD分解存在模態(tài)混疊、偽模態(tài)等問題,于是兼具EMD和小波變換優(yōu)勢(shì)的經(jīng)驗(yàn)小波變換(Empirical Wavelet Transform,EWT)被提出[18]。EWT能自適應(yīng)分解信號(hào),非常適合處理非線性、非平穩(wěn)的地震信號(hào)[19-20],但傳統(tǒng)EWT需要根據(jù)信號(hào)頻譜幅值進(jìn)行頻帶劃分,易受噪聲影響,因此有必要根據(jù)地震信號(hào)的特點(diǎn)進(jìn)行頻譜分割優(yōu)化。Wang等[21]基于尺度空間表示提取傅里葉譜的慢變分量,再根據(jù)尺度參數(shù)和中心頻率進(jìn)行頻譜分割,但該方法中尺度參數(shù)依經(jīng)驗(yàn)獲取,這樣會(huì)影響頻譜分割的準(zhǔn)確性。

        為提高識(shí)別的準(zhǔn)確率和穩(wěn)定性,集成學(xué)習(xí)被應(yīng)用于地震事件分類識(shí)別,將識(shí)別效果受限的基分類器按照一定規(guī)則組合為強(qiáng)分類器,以提高識(shí)別效果。趙剛等[22]提取波形時(shí)域、小波變換特征等,以BP作為弱分類器,通過AdaBoost方法組合成強(qiáng)分類器,得到較高的識(shí)別率。蔡杏輝等[23]提取波形復(fù)雜度、頻譜比、自相關(guān)系數(shù)、波形復(fù)雜度和自相關(guān)系數(shù)比值為特征,用決策樹作為基分類器,用Bagging集成方法集合成一個(gè)強(qiáng)分類器,準(zhǔn)確率可達(dá)85%以上。Bagging只是對(duì)分類器進(jìn)行簡(jiǎn)單整合,AdaBoost能對(duì)錯(cuò)誤分類的訓(xùn)練數(shù)據(jù)進(jìn)行處理,準(zhǔn)確率更高,但AdaBoost易受樣本中的噪聲影響,從而產(chǎn)生過擬合。LogitBoost算法是在AdaBoost的基礎(chǔ)上改進(jìn)而來的,對(duì)樣本噪聲不太敏感,泛化能力更強(qiáng)。

        為準(zhǔn)確提取地震信號(hào)特征,提高地震事件分類識(shí)別準(zhǔn)確率,本文提出基于改進(jìn)EWT和LogitBoost集成分類器的天然地震和人工爆破事件分類識(shí)別算法。首先,對(duì)地震記錄進(jìn)行篩選,剔除噪聲干擾嚴(yán)重的記錄,并對(duì)篩選后的地震記錄計(jì)算P波與S波最大振幅比;在此基礎(chǔ)上,利用S變換時(shí)間頻率分析精度高的優(yōu)勢(shì)對(duì)信號(hào)進(jìn)行S變換,獲取能反映信號(hào)頻率與能量特征的S譜能量曲線,再基于S譜能量曲線對(duì)傳統(tǒng)EWT進(jìn)行改進(jìn),將地震信號(hào)自適應(yīng)分解為若干按頻率和能量分布的本征模函數(shù)(Intrinsic Mode Function,IMF)后去除噪聲,然后提取各IMF的香農(nóng)熵、對(duì)數(shù)能量熵,及去噪后重構(gòu)記錄的主頻等特征;最后,基于LogitBoost機(jī)制的決策樹集成分類器進(jìn)行事件識(shí)別,以有效提高地震事件識(shí)別的準(zhǔn)確率。

        1 基于S譜能量曲線的改進(jìn)EWT

        1.1 S譜能量曲線

        作為小波變換和短時(shí)傅里葉變換的發(fā)展,S變換采用帶有頻率變量的高斯窗函數(shù)截取信號(hào),實(shí)現(xiàn)信號(hào)的局部分析。由于其窗函數(shù)可隨頻率自適應(yīng)改變,具有多分辨率的特點(diǎn),能較好地適應(yīng)非平穩(wěn)信號(hào)頻率不規(guī)律變化的特點(diǎn),在地震信號(hào)處理領(lǐng)域應(yīng)用較廣。對(duì)某地震信號(hào)h(t)進(jìn)行S變換:

        (1)

        式中:f為頻率;τ為平移因子,用于控制高斯窗在時(shí)間軸t上的位置;j為虛數(shù)單位。

        對(duì)信號(hào)進(jìn)行S變換得到信號(hào)時(shí)頻分布S譜,可同時(shí)從時(shí)域和頻域分析其特性和能量分布。對(duì)頻點(diǎn)i定義S譜頻點(diǎn)能量:

        (2)

        式中:fi為S變換后頻點(diǎn)i的頻率,S(fi,τ)為該頻點(diǎn)對(duì)應(yīng)的S變換值即S譜值。

        獲取所有頻點(diǎn)的能量譜值LEi,能夠得到依頻率分布的S譜能量曲線。該S譜能量曲線能清晰描繪不同頻率處信號(hào)的能量分布情況及不同頻率成分的能量強(qiáng)弱。

        1.2 基于S譜能量曲線的改進(jìn)EWT

        設(shè)地震信號(hào)s(t)的傅里葉頻譜為F(w)w∈[0,π],S譜為S(f,τ),按式(2)計(jì)算S譜能量曲線后對(duì)地震信號(hào)進(jìn)行改進(jìn)EWT分解。

        S譜能量曲線能真實(shí)體現(xiàn)原信號(hào)低頻到高頻部分各頻率成分的能量大小分布,基于S譜能量曲線的改進(jìn)EWT可將原地震信號(hào)準(zhǔn)確分解為一系列依頻率和能量分布的IMF。分解后的IMF瞬時(shí)頻譜和幅值具有較高的分辨率,不僅能刻畫原信號(hào)的時(shí)頻特征,也能更好地描述信號(hào)的局部突變或漸變特征,從而更好地獲取原信號(hào)特征。

        2 數(shù)據(jù)預(yù)處理與特征提取

        本文數(shù)據(jù)來源于中國地震數(shù)據(jù)共享中心。其中,人工爆破記錄是2013—2019年發(fā)生于廣西平果、武鳴、貴港、樂業(yè)等地的礦藏勘探、開采等人工爆破微震事件波形記錄,震級(jí)為ML1.3~3.0,共973條;天然地震記錄是發(fā)生于2019—2020年每年8—10月、震級(jí)ML1.3~3.0的天然微震波形記錄,共867條。由于某些地震事件的臺(tái)站波形記錄中噪聲干擾較多,因此需要對(duì)地震記錄進(jìn)行預(yù)處理,對(duì)被噪聲淹沒的波形進(jìn)行篩選剔除,以更精確地提取地震信號(hào)特征,消除噪聲影響。

        2.1 波形篩選

        對(duì)地震事件進(jìn)行分類識(shí)別前需要對(duì)記錄進(jìn)行篩選并拾取P波到時(shí)。目前應(yīng)用較廣泛的初至拾取方法有短時(shí)平均值/長時(shí)平均值(Short Term Averaging/Long Term Averaging,STA/LTA)、赤池信息準(zhǔn)則(Akaike Information Criterion,AIC)、無監(jiān)督聚類算法等,本文利用快速簡(jiǎn)單的STA/LTA算法進(jìn)行波形記錄篩選,具體流程如下:

        (1) 截取包含P 波和S波在內(nèi)的全波段波形記錄;

        (2) 設(shè)定STA,LTA和閾值,取STA=0.2 s,LTA=1 s,閾值為1.5;

        (3) 基于STA/LTA進(jìn)行P波拾取,取初至?xí)r間點(diǎn)的前10 s至后100 s的記錄波形。

        按以上步驟進(jìn)行波形篩選,得到天然地震記錄648條,人工爆破記錄575條。

        2.2 改進(jìn)EWT分解

        對(duì)篩選后的記錄進(jìn)行計(jì)算,得到其S譜能量曲線,取能量曲線上的前4個(gè)極大值點(diǎn),以其為頻譜分割初始邊界。根據(jù)ε鄰域法重新確定新邊界,進(jìn)行改進(jìn)EWT分解,最終將每條記錄分解為5個(gè)IMF分量。由于隨機(jī)噪聲在地震記錄中廣泛存在,且一般以高頻為主,因此將最后一個(gè)IMF視為高頻噪聲并丟棄,盡可能降低噪聲影響。去噪后的每條地震記錄對(duì)應(yīng)4個(gè)IMF,這4個(gè)IMF主要為有效波,既保留原信號(hào)時(shí)頻特征,也能刻畫信號(hào)局部變化細(xì)節(jié),有利于提取信號(hào)特征屬性。

        2.3 特征提取

        為了消除各維數(shù)據(jù)之間的數(shù)量級(jí)差別,對(duì)所有輸入數(shù)據(jù)進(jìn)行歸一化處理,將數(shù)據(jù)歸一化到[-1,1]區(qū)間。信號(hào)P波與S波的最大振幅比是天然地震和人工爆破波形信號(hào)中的一個(gè)重要特征[23-24],經(jīng)STA/LTA識(shí)別P波初至位置A后,按式(3)計(jì)算P波與S波最大振幅比ps:

        ps=max(A-50:A+50)/max(A+50:A+1 900)

        (3)

        熵用于衡量信號(hào)的復(fù)雜程度,利用香農(nóng)熵可以分析信號(hào)時(shí)頻分布的聚集性,利用對(duì)數(shù)能量熵可反映信號(hào)的暫態(tài)或突變特性,因此香農(nóng)熵和對(duì)數(shù)能量熵成為微震和爆破信號(hào)識(shí)別的重要參數(shù)[25]。對(duì)分解出的4個(gè)IMF,按式(4)分別提取每個(gè)IMF的香農(nóng)熵Esh(i)和對(duì)數(shù)能量熵Elg(i)。

        (4)

        式中:si,j為EWT分解后分量i(即IMFi)的第j個(gè)值;M為每個(gè)分量的長度。

        此外,由于爆破信號(hào)的頻譜特征與天然地震明顯不同,其能量較集中,且頻率更低[26]?;谶@4個(gè)IMF進(jìn)行原信號(hào)重構(gòu),對(duì)重構(gòu)后的信號(hào)進(jìn)行希爾伯特變換。希爾伯特變換是一種適合非線性、非平穩(wěn)信號(hào)的時(shí)頻分析方法,常用于求解信號(hào)瞬時(shí)頻率。按式(5)求取主頻Fm:

        (5)

        式中:f為頻率;s(f)為希爾伯特變換幅度譜。

        如上所述,從篩選后的每條記錄中提取10個(gè)特征值,所有記錄特征共組成1 223×10的波形特征向量矩陣。

        3 基于LogitBoost決策樹集成分類器的天然地震與人工爆破事件分類識(shí)別

        3.1 基于LogitBoost機(jī)制的決策樹集成分類器構(gòu)建

        Boosting算法是一種經(jīng)典集成學(xué)習(xí)算法[27],被廣泛應(yīng)用于分類識(shí)別。該算法用初始權(quán)重從初始訓(xùn)練集訓(xùn)練出一個(gè)基分類器,根據(jù)基分類器的訓(xùn)練誤差對(duì)訓(xùn)練樣本分布進(jìn)行調(diào)整,使得先前基分類器分類錯(cuò)誤的訓(xùn)練樣本在下一輪的訓(xùn)練中被選中的概率增加。如此重復(fù)進(jìn)行,直到完成T輪訓(xùn)練,將這T個(gè)基分類器組合成一個(gè)強(qiáng)分類器,使強(qiáng)分類器在樣本集上具有最小的預(yù)測(cè)損失,從而獲得比單個(gè)學(xué)習(xí)器更好的性能。

        Boosting算法中最經(jīng)典的是AdaBoost,它采用的損失函數(shù)為ELOSS,損失隨分類錯(cuò)誤呈指數(shù)變化,容易受樣本中噪聲影響而產(chǎn)生過擬合。針對(duì)這一不足,Friedman提出LogitBoost[28]。LogitBoost采用二項(xiàng)式對(duì)數(shù)似然損失函數(shù)LLOSS,損失隨分類錯(cuò)誤呈線性變化,對(duì)樣本噪聲較不敏感,泛化能力更強(qiáng)。大量研究表明,利用LogitBoost進(jìn)行分類識(shí)別能取得較好的效果[29-30]。LogitBoost對(duì)基分類器要求不高,只需要比隨機(jī)猜測(cè)略好。本文選用決策樹作為基分類器,決策樹是一種非參的有監(jiān)督學(xué)習(xí)方法,可從有特征和標(biāo)簽的訓(xùn)練樣本數(shù)據(jù)中學(xué)習(xí)出決策規(guī)則,自動(dòng)構(gòu)造決策樹進(jìn)行分類?;贚ogitBoost的決策樹集成分類器構(gòu)建過程如下:

        步驟(1):選取訓(xùn)練樣本集d=(xi,yi),i=1,2,…,N,其中N為樣本個(gè)數(shù);xi為判別變量,xi=(xi,1,xi,2,…,xi,m),m=10;yi為類別標(biāo)簽,設(shè)1為正類(天然地震),-1為負(fù)類(人工爆破)。

        步驟(4):樣本權(quán)重的更新。

        (6)

        (7)

        (8)

        3.2 分類器識(shí)別流程

        為剔除干擾嚴(yán)重的記錄,有效提取地震信號(hào)特征,在識(shí)別前先對(duì)地震記錄進(jìn)行篩選,基于STA/LTA進(jìn)行P波初至拾取,截取初至點(diǎn)前10 s至后100 s共110 s記錄,計(jì)算P波與S波最大振幅比;其次,進(jìn)行基于S譜能量曲線的改進(jìn)EWT,將地震信號(hào)分解為5個(gè)IMF,視最后一個(gè)IMF為噪聲,取前4個(gè)IMF的香農(nóng)熵和對(duì)數(shù)能量熵,并計(jì)算由前4個(gè)IMF重構(gòu)的地震記錄主頻,每條記錄共提取10個(gè)特征值;最后,對(duì)所有記錄特征組成的波形特征向量矩陣,以決策樹為基分類器,基于LogitBoost機(jī)制合成強(qiáng)分類器進(jìn)行事件識(shí)別。算法流程如圖1所示。

        圖1 本文分類識(shí)別算法流程圖Fig.1 Flow chart of the proposed classification and recognition algorithm

        3.3 分類器識(shí)別效果評(píng)價(jià)

        為驗(yàn)證算法的穩(wěn)定性及泛化能力,采用交叉驗(yàn)證和獨(dú)立樣本測(cè)試方法進(jìn)行檢驗(yàn)。其中交叉驗(yàn)證采用非重疊的隨機(jī)選取劃分策略,訓(xùn)練集和測(cè)試集獨(dú)立,選取10%~100%的樣本為訓(xùn)練集,其余為測(cè)試集(100%樣本時(shí),全部樣本數(shù)據(jù)既做訓(xùn)練集也做測(cè)試集);獨(dú)立樣本測(cè)試是用新數(shù)據(jù)集進(jìn)行測(cè)試。為評(píng)估算法性能,根據(jù)表1 所示的分類識(shí)別結(jié)果混淆矩陣,計(jì)算敏感度SE、特異性SP值和準(zhǔn)確率ACC。

        表1 地震事件分類識(shí)別結(jié)果Table 1 Classification and recognition results of seismic events

        (9)

        敏感度SE也稱召回率,代表所有正例被正確分類的比例,能衡量分類器對(duì)正類的識(shí)別能力;特異性SP表示所有負(fù)例被正確分類的比例,能衡量分類器對(duì)負(fù)例的識(shí)別能力;準(zhǔn)確率ACC是對(duì)分類器整體正確率的評(píng)價(jià)。SE越高,越容易鑒定出負(fù)類,即越靈敏;SP越高,則越不容易誤分類,即篩選能力強(qiáng)。準(zhǔn)確率、召回率、特異性是分類器的常用性能度量指標(biāo),一般認(rèn)為具有高準(zhǔn)確率、高召回率和高特異性的分類器是一個(gè)優(yōu)秀的分類器。

        4 實(shí)驗(yàn)及分析

        4.1 改進(jìn)EWT信號(hào)分解

        為驗(yàn)證改進(jìn)EWT的信號(hào)分解效果,分別對(duì)天然地震和人工爆破記錄進(jìn)行分解。圖2和圖3分別為經(jīng)篩選(初至點(diǎn)前10 s至后100 s)并歸一化后的天然地震和人工爆破記錄,采樣率均為100 Hz。天然地震是2020年8月16日福建安溪(25.391°N,117.742°E)發(fā)生的ML2.2微地震在QZH 臺(tái)站的記錄波形。人工爆破記錄是2014年8月2日廣西武鳴地區(qū)(23.006°N,108.21°E)發(fā)生的M2.6人工爆破事件在DHX臺(tái)站的記錄波形。圖中可見,人工爆破持續(xù)時(shí)間相對(duì)較短,天然地震持續(xù)時(shí)間更長?;诖瞬ㄐ斡涗浛捎?jì)算P波與S波最大振幅比ps。

        圖2 天然地震記錄Fig.2 Natural seismic record

        圖3 人工爆破記錄Fig.3 Artificial blasting record

        以圖2所示天然微震波形記錄為例進(jìn)行改進(jìn)EWT分解,所得S譜能量曲線繪于圖4。該曲線能較清晰地描繪各頻率點(diǎn)處原信號(hào)的能量大小,可見天然地震能量主要集中在低頻端。

        圖4 S譜能量曲線Fig.4 S-transform spectrum energy curve

        基于該曲線進(jìn)行頻帶分割得到子頻帶,如圖5所示;傳統(tǒng)EWT頻譜分割結(jié)果如圖6所示。可見,傳統(tǒng)EWT以傅里葉頻譜的極值點(diǎn)為頻譜分割邊界,頻譜分割雜亂無章,從而無法有效區(qū)分有效波和噪聲;而本文改進(jìn)EWT的子頻帶能根據(jù)頻率和能量大小將原信號(hào)頻譜分割開,便于信號(hào)分解。

        圖5 改進(jìn)EWT頻帶分割結(jié)果Fig.5 Intersection of frequency spectrum using improved EWT

        圖6 傳統(tǒng)EWT頻帶分割結(jié)果Fig.6 Intersection of frequency spectrum using traditional EWT

        頻譜分割后,基于改進(jìn)EWT和傳統(tǒng)EWT所得的IMF分別如圖7、圖8所示。改進(jìn)EWT能較好地根據(jù)信號(hào)的頻率和能量進(jìn)行模態(tài)分解,如圖7中IMF1~I(xiàn)MF4主要為有效波,而IMF5主要為高頻隨機(jī)噪聲,將其視為噪聲去除有利于實(shí)現(xiàn)有效波與隨機(jī)噪聲的有效分離。而傳統(tǒng)EWT分解信號(hào)散亂,無法實(shí)現(xiàn)有效波與噪聲的有效分離。用改進(jìn)EWT對(duì)圖3中的人工爆破信號(hào)進(jìn)行分解,所得IMF如圖9所示。同理,前4個(gè)IMF為有效信號(hào),最后一個(gè)IMF為噪聲。

        圖7 改進(jìn)EWT分解IMF結(jié)果(天然地震)Fig.7 Decomposed IMFs by improved EWT (natural event)

        圖8 傳統(tǒng)EWT分解IMF結(jié)果(天然地震)Fig.8 Decomposed IMFs by traditional EWT (natural event)

        圖9 改進(jìn)EWT分解IMF結(jié)果(人工爆破)Fig.9 Decomposed IMFs based on improved EWT (manual blasting)

        對(duì)IMF1~I(xiàn)MF4提取香農(nóng)熵和對(duì)數(shù)能量熵,將IMF5視為噪聲舍棄。再對(duì)IMF1~I(xiàn)MF4進(jìn)行重構(gòu),計(jì)算重構(gòu)信號(hào)主頻,獲取每條記錄的特征屬性值。

        4.2 基于LogitBoost的決策樹集成分類器性能

        將1 223條記錄提取的特征組成1 223×10的特征矩陣,采用基于LogitBoost機(jī)制的決策樹集成分類器進(jìn)行分類識(shí)別,迭代次數(shù)100次,算法基于Weka開源平臺(tái)實(shí)現(xiàn),環(huán)境為Matlab2016Ra,Win10系統(tǒng)。

        基分類器個(gè)數(shù)是集成分類器的重要參數(shù)之一,理論上,樣本數(shù)據(jù)量增大,基分類器個(gè)數(shù)應(yīng)適當(dāng)增加。如圖10所示,以訓(xùn)練樣本比例70%為例,以決策樹為基分類器,將不同數(shù)量基分類器集成為強(qiáng)分類器,得到的分類準(zhǔn)確率均在93.1%以上,說明本文算法有較好的分類效果。隨著基分類器數(shù)量增加,分類準(zhǔn)確率有一定提高,但分類器數(shù)量越多,識(shí)別時(shí)間也將增加。綜合考慮算法時(shí)間與性能,本文以10個(gè)基分類器組成強(qiáng)分類器。

        圖10 不同數(shù)量基分類器對(duì)應(yīng)的識(shí)別準(zhǔn)確率Fig.10 Recognition accuracy corresponding to different amounts of base classifiers

        采用交叉驗(yàn)證檢驗(yàn),隨機(jī)抽取一定比例(10%~100%)的數(shù)據(jù)用于訓(xùn)練,其余數(shù)據(jù)用于測(cè)試,且同一訓(xùn)練樣本比例隨機(jī)抽取、運(yùn)行100次,計(jì)算SE、SP和ACC值,并取均值,得到的分類識(shí)別結(jié)果列于表2。

        表2 不同訓(xùn)練樣本比例分類結(jié)果(單位:%)Table 2 Classification results with different proportions of training samples (Unit:%)

        由表2可見,本文集成分類器方法中訓(xùn)練集的劃分具有較好的魯棒性,即訓(xùn)練樣本數(shù)量對(duì)分類結(jié)果影響較小,訓(xùn)練樣本數(shù)量取不同比例時(shí),分類準(zhǔn)確率ACC較高,且差異性較小,同時(shí)SE、SP也較高,說明分類器具有較好的穩(wěn)定性。

        4.3 與其他分類器對(duì)比

        為了進(jìn)一步分析分類器的性能,分別用BP神經(jīng)網(wǎng)絡(luò)、SVM、AdaBoost等分類算法進(jìn)行分類識(shí)別,并與本文分類器的識(shí)別效果進(jìn)行對(duì)比。使用BP神經(jīng)網(wǎng)絡(luò)分類時(shí),為增強(qiáng)網(wǎng)絡(luò)分類性能,采用雙隱層,每個(gè)隱層4個(gè)節(jié)點(diǎn),網(wǎng)絡(luò)迭代100次,學(xué)習(xí)率為0.1,訓(xùn)練誤差設(shè)置為10-5;SVM分類時(shí),選用RBF核函數(shù),選擇有最高分類準(zhǔn)確率的懲罰參數(shù)C和核函數(shù)參數(shù)g為最佳參數(shù);AdaBoost也采用決策樹為基分類器,基分類器數(shù)為10個(gè)。同上,選擇不同的比例樣本,分別用BP神經(jīng)網(wǎng)絡(luò)、SVM、AdaBoost、本文算法各運(yùn)行100次,取均值后得到的分類準(zhǔn)確率如圖11所示。

        圖11 不同分類算法在不同樣本比例下的分類準(zhǔn)確率Fig.11 Classification accuracy of different algorithms under different proportions of samples

        由圖11可見,本文方法與其他3種方法相比有1%以上的分類準(zhǔn)確率提升。SVM 基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化進(jìn)行網(wǎng)絡(luò)訓(xùn)練,BP神經(jīng)網(wǎng)絡(luò)基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化進(jìn)行網(wǎng)絡(luò)訓(xùn)練,SVM訓(xùn)練結(jié)果略優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。AdaBoost集成分類器和本文方法均采用組合策略,能減小單個(gè)分類器誤差,具有較高識(shí)別率;二者對(duì)訓(xùn)練集的劃分均具有較好穩(wěn)定性,即訓(xùn)練樣本數(shù)量多少對(duì)分類結(jié)果影響較小。BP神經(jīng)網(wǎng)絡(luò)和SVM對(duì)訓(xùn)練集數(shù)量比較敏感,當(dāng)訓(xùn)練樣本較少時(shí)分類準(zhǔn)確率較低,隨著訓(xùn)練樣本增加,準(zhǔn)確度提升。因此,當(dāng)樣本數(shù)量較少時(shí)更適合采用集成分類器,而Logitboost由于采用二項(xiàng)式對(duì)數(shù)似然損失函數(shù),抗噪性較強(qiáng),比AdaBoost集成分類器具有更好的性能,分類正確率更高一些。

        為進(jìn)一步驗(yàn)證本文分類器的實(shí)用性及穩(wěn)定性,對(duì)另外兩組獨(dú)立的樣本數(shù)量不同的數(shù)據(jù)集進(jìn)行分類識(shí)別。其中一組:人工爆破為2014年11—12月廣西田陽、2015年2—3月廣西柳江的ML1.7~2.7礦藏開采記錄,共452條,采樣率100 Hz;天然地震為2020年8—10月ML1.8~2.8的天然微震記錄,共481條,采樣率100 Hz。用本文方法識(shí)別該數(shù)據(jù)集,準(zhǔn)確識(shí)別人工爆破記錄422條,識(shí)別準(zhǔn)確率為93.4%;準(zhǔn)確識(shí)別天然地震記錄455條,識(shí)別準(zhǔn)確率為94.6%,整體識(shí)別準(zhǔn)確率94%。另外一組:天然地震為2021年5—8月187條ML3.0以下天然微震記錄,人工爆破為2018年4—5月廣西臨桂202條采礦爆破記錄。對(duì)該數(shù)據(jù)集進(jìn)行分類預(yù)測(cè),結(jié)果顯示對(duì)天然地震的識(shí)別準(zhǔn)確率為94.5%,人工爆破的識(shí)別準(zhǔn)確率為93.4%,整體識(shí)別準(zhǔn)確率94.2%。

        實(shí)驗(yàn)表明,本文所提分類器的整體分類準(zhǔn)確率較高,達(dá)94%,且訓(xùn)練樣本數(shù)量對(duì)分類結(jié)果的影響較小,說明分類器模型具有較好的穩(wěn)定性,能解決樣本不足的問題。

        5 結(jié)論

        本文利用S變換優(yōu)良的時(shí)頻特性,提出了基于S譜能量曲線的改進(jìn)EWT,以有效獲取地震信號(hào)特征;研究了基于LogitBoost機(jī)制的集成分類器分類識(shí)別算法,并基于真實(shí)的天然微震和人工爆破記錄對(duì)不同算法性能進(jìn)行測(cè)試,得到如下結(jié)論:

        (1) S譜能量曲線能真實(shí)完整地反映信號(hào)能量和頻率特征,從而根據(jù)原信號(hào)的頻率和能量完成信號(hào)分解,更好地提取信號(hào)特征。

        (2) 根據(jù)原信號(hào)P波與S波最大振幅比、分解后IMF的香農(nóng)熵和對(duì)數(shù)能量熵,及去噪后重構(gòu)信號(hào)主頻等特征,能有效區(qū)分天然和人工爆破的不同,可作為識(shí)別天然和人工爆破的特征參數(shù),應(yīng)用于實(shí)際的地震事件識(shí)別系統(tǒng)。

        (3) 基于LogitBoost的決策樹集成分類器準(zhǔn)確率要優(yōu)于AdaBoost、BP神經(jīng)網(wǎng)絡(luò)和SVM方法,且擁有1%以上的性能提升,說明本文算法有效可靠,具有一定的實(shí)用性。

        (4) 通過集成學(xué)習(xí)方法可提高分類效果,基于LogitBoost機(jī)制的集成分類器方法具有較好的魯棒性,即訓(xùn)練樣本數(shù)量多少對(duì)分類結(jié)果影響較小,能有效解決樣本不足的問題,適用性較強(qiáng)。

        文中對(duì)分類器相關(guān)參數(shù)的研究不夠細(xì)致,下一步將進(jìn)行分類器相關(guān)參數(shù)優(yōu)化,如基分類器種類、迭代次數(shù)等參數(shù)對(duì)分類結(jié)果的影響,從而獲取最優(yōu)參數(shù),提高分類器分類效果。

        猜你喜歡
        分類器波形準(zhǔn)確率
        乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
        健康之家(2021年19期)2021-05-23 11:17:39
        不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
        2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
        對(duì)《壓力容器波形膨脹節(jié)》2018版新標(biāo)準(zhǔn)的理解及分析
        基于LFM波形的靈巧干擾效能分析
        高速公路車牌識(shí)別標(biāo)識(shí)站準(zhǔn)確率驗(yàn)證法
        BP-GA光照分類器在車道線識(shí)別中的應(yīng)用
        加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
        結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
        基于ARM的任意波形電源設(shè)計(jì)
        亚洲av色精品国产一区二区三区| 亚洲av理论在线电影网| 亚洲线精品一区二区三区八戒| 成年人男女啪啪网站视频| 亚洲毛片在线观看免费| 女的扒开尿口让男人桶30分钟| 精品国产a∨无码一区二区三区 | 肉色欧美久久久久久久免费看| 久久久久久久性潮| 国产亚洲美女精品久久久2020| 精品人妻一区二区三区狼人| 国产精品人人做人人爽| 在线观看国产精品日韩av| 久久国产精品超级碰碰热| 日本不卡一区二区三区久久精品| 精品偷拍被偷拍在线观看| 中文在线а√天堂官网| 久久久亚洲精品免费视频| 亚洲av乱码二区三区涩涩屋 | 欧美国产综合欧美视频| 欧美日韩精品一区二区在线视频| 日日噜噜夜夜狠狠久久av| 久久国产在线精品观看| 亚洲国产精华液网站w| 成人毛片18女人毛片免费| 激情偷拍视频一区二区| 亚洲av成人片色在线观看| 在线va免费看成| a√无码在线观看| 亚洲视频在线免费不卡| 亚洲av无码久久精品蜜桃| 国产主播在线 | 中文| 日本女u久久精品视频| 国产三级精品三级| 巨大欧美黑人xxxxbbbb| 二区三区视频在线观看| 无套无码孕妇啪啪| 国产高清乱理伦片| 亚洲AV色欲色欲WWW| 亚洲毛片一区二区在线| 草草久久久无码国产专区|