施佳朋,黃漢明,薛思敏,黎炳君,袁雪梅
(廣西師范大學(xué) 計算機科學(xué)與信息工程學(xué)院,廣西 桂林 541004)
天然地震危害巨大,一旦發(fā)生容易造成大量的財產(chǎn)損失和人員傷亡,對地震信號的分類研究對于防震減災(zāi)是有著重要的意義,這是構(gòu)建完整的地震目錄和便于地震研究學(xué)者能更加專注對天然地震信號的研究的基礎(chǔ)[1,2]。但是如人工爆破等其他人為產(chǎn)生的噪聲地震信號,很容易對監(jiān)聽產(chǎn)生影響,導(dǎo)致誤判。還有就是天然地震信號不同于一般信號,屬于非平穩(wěn)信號[3],本身就較為復(fù)雜,因此分類研究也一直是重點研究對象。
地震信號研究學(xué)者們也根據(jù)地震信號的特性,從多方面判斷,如:利用到達時間自動拾取方法(automatic method for picking up arrive time,AMPAT)來研究P波[4]、波形復(fù)雜度[5]、分形維數(shù)[6]、能量比[7]、倒譜[8]、小波變換[9]等。而隨著計算機硬件設(shè)備發(fā)展,研究者們使用的方法也逐步多樣化,如使用機器學(xué)習(xí)方法[10],從使用反向傳播(back propogation,BP)神經(jīng)網(wǎng)絡(luò)對震動信號研究[11],到使用更為深層的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)[12]。這些地震領(lǐng)域研究學(xué)者們的實驗,都取得了不錯的成果,為地震領(lǐng)域研究提供了思路和方向。
本文以天然地震信號和人工爆破地震信號為對象進行分類實驗研究。在前人提供的研究思路方向上,提出了一種基于經(jīng)驗?zāi)B(tài)分解—變分模態(tài)分解—長短期記憶(empirical mode decomposition-variational mode decomposition-long short-term memory,EMD-VMD-LSTM)的地震信號分類研究模型,分別求得前5個本征模態(tài)函數(shù)(intrinsic mode function,IMF)分量,然后求取IMF的熵值,作為分類特征,最后輸入到LSTM中,利用LSTM提取特征能力來進行分類研究。
EMD可以將任意信號分解為若干IMF分量,對于處理非線性、非平穩(wěn)信號的是一種非常有效的方法[13]。EMD方法對地震信號分解的基本步驟如下:1)確定原始信號X(t)的所有極值點,并用三次樣條插值函數(shù)擬合出原始信號的上下包絡(luò)線平均值a1,接著求出原始信號X(t)和a1的差b1。2)得到b1后,會對其進行判斷是否滿足IMF分量的條件要求,如若滿足,則歸為第一個IMF分量,并且記為c1;不滿足則作為新的原始信號重復(fù)步驟(1),直到滿足IMF分量要求為止。3)按式(2)將c1從原始信號X(t)中分離出來,得到d1,作為新的原始信號輸入,求下一個IMF分量。
b1=X(t)-a1
(1)
d1=X(t)-c1
(2)
EMD分解后前5個IMF分量圖如圖1所示。
圖1 EMD分解圖
VMD是由Dragomiretskiy K在于2014年提出的一種新的自適應(yīng)信號處理方法[14],VMD建立約束變分問題有如下公式
(3)
式中 {uk}={u1,u2,…,uk}為分解得到的k個IMF分量;{ωk}={ω1,ω2,…,ωk}為各個IMF分量的頻率中心;使用拉格朗日乘法算子λ(t)和二次懲罰因子α,對式(3)進行改變,得到改變后
(4)
尋找約束變分問題的最優(yōu)解,對uk,ωk更新,其中有如下公式
(5)
(6)
(7)
(8)
經(jīng)過上述步驟,VMD對地震信號的分解后,得到前5個IMF分量,其中分解圖如圖2所示。
圖2 VMD分解圖
1997年,Hochreiter S等人提出了LSTM模型[15],其中有如下公式,可以更加詳細地描述LSTM內(nèi)部結(jié)構(gòu)
ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf)
(9)
it=σ(Wxixt+Whiht-1+Wcict-1+bi)
(10)
ct=ftct-1+ittanh(Wxcxt+Whcxt-1+bc)
(11)
ot=σ(Wxoxt+Whoxt-1+Wcoxt+bo)
(12)
ht=ottanh(ct)
(13)
式中Wxc,Wxi,Wxf,Wco為輸入信號X(t)的連接權(quán)重;Whc,Whi,Whf,Who為隱含層輸出信號ht的連接權(quán)重;Wco,Wcf,Wcf為連接神經(jīng)元激活函數(shù)輸出矢量ct和門函數(shù)的對角矩陣;bo,bc,bi,bf為偏置向量;σ為激活函數(shù)。
根據(jù)Shannon信息熵理論,對于一個隨機變量X,引入來求IMF能量熵值,得到有能量熵值公式如下
(14)
式中pi為第i個IMF能量占總能量比值,其中各個數(shù)值有以下關(guān)系可得
(15)
所使用天然地震事件來源于中心首都圈數(shù)據(jù),人工爆破事件為門頭溝地區(qū)數(shù)據(jù),這些事件發(fā)生在2010年~2016年間,每個事件中有幾十個波形個數(shù),數(shù)據(jù)都可在國家地震科學(xué)數(shù)據(jù)共享中心(http://data.earthquake.cn/)下載,實驗中具體數(shù)據(jù)個數(shù)如表1所示。
表1 實驗中的數(shù)據(jù)個數(shù)
注:Evt:事件個數(shù);Waveform:波形個數(shù);Trainw:訓(xùn)練波形個數(shù);Testw:測試波形個數(shù);Eq:天然地震信號;Ex:人工爆破信號;Sum:合計數(shù)目。
本文有以下實驗步驟,具體流程如圖3流程圖所示。
圖3 實驗流程圖
在實驗中,使用了總共75個事件,其中天然地震信號事件40個,人工爆破事件35個,經(jīng)過篩選,去除明顯不是波形信號數(shù)據(jù)后,得到了2 017個波形信號數(shù)據(jù)。接著對信號波形進行幅值歸一化,以消除監(jiān)測臺站記錄下來如零漂等外界條件的影響。去除噪聲處理得到一個較為精確的波形信號。
數(shù)據(jù)預(yù)處理后,同時將波形信號分別進行EMD和VMD,從計算速度來考慮,并且因為前5個IMF分量占據(jù)了原始波形信號的大部分有用信息,已經(jīng)可以有效地作為了分類的特征依據(jù),故只取了前5個IMF分量,用來求取每個IMF的能量熵值,構(gòu)建出特征向量。
然后對特征向量進行訓(xùn)練和測試集的劃分,其中訓(xùn)練數(shù)據(jù)有1 508條波形條數(shù),包含了873條天然地震波形,635條人工爆破波形,測試集有509條波形條數(shù),包含了天然地震波形247條,人工爆破波形262條。把訓(xùn)練數(shù)據(jù)輸入到LSTM中,對其進行訓(xùn)練,構(gòu)建出EMD-VMD-LSTM模型,從程序運行速度和最終分類精確度考慮,Layer層數(shù)為2層,第一層隱含節(jié)點數(shù)為512,第二層隱含節(jié)點數(shù)為256。為了防止過擬合,在每一層都設(shè)置了Dropout,數(shù)值為0.2。訓(xùn)練迭代次數(shù)為5 000次,訓(xùn)練過程中使用了Adam作為解算器,初始學(xué)習(xí)率設(shè)置為0.1,并且為了防止?jié)u變溢出,設(shè)置漸變閾值為1。
實驗環(huán)境基于Windows7 64位操作系統(tǒng)平臺,所使用的編程代碼語言為MATLAB,編程軟件為MATLAB2018a。訓(xùn)練過程的準(zhǔn)確度(accuracy)和損耗(loss)圖分別如圖4所示,可以直觀地看出EMD-VMD-LSTM模型的構(gòu)建過程。
圖4 訓(xùn)練結(jié)果
實驗與單一使用了一種分解方法的模型進行對比分類精度,其中對比結(jié)果如表2所示。
表2 模型對比
經(jīng)過上表2的對比結(jié)果可以看出,本文提出的EMD-VMD-LSTM模型比較單一分解方法的模型,分類準(zhǔn)確率進一步的提升了,分類性能更為優(yōu)越。
本文在EMD,VMD基礎(chǔ)上,提出了一種綜合EMD,VMD和LSTM的EMD-VMD-LSTM模型,用以來實現(xiàn)對地震信號的分類研究。在相同的實驗條件下,通過和多個模型對比,證明了本文提出的EMD-VMD-LSTM模型,相較于單一使用其中一種分解的方法,有著更好的分類準(zhǔn)確性,提高了分類精確度,提出的該方法對地震信號進行分類研究提供了新視角。