廖成旺 龐 聰 江 勇 吳 濤
1 中國地震局地震研究所,武漢市洪山側(cè)路40號(hào),430071
2 武漢引力與固體潮國家野外科學(xué)觀測研究站,武漢市洪山側(cè)路40號(hào),430071
3 湖北省地震局,武漢市洪山側(cè)路48號(hào),430071
地震波往往是直達(dá)、反射、折射、轉(zhuǎn)換和散射體波與面波的疊加,并且含有各種背景源產(chǎn)生的波信號(hào)以及噪聲信號(hào)。為獲得這些類型的波中包含的信息,發(fā)展了多波成分處理技術(shù),其中備受關(guān)注的是極化分析方法[1]。以往主要使用平動(dòng)三分量(3C)速度或加速度信號(hào)進(jìn)行極化分析,但存在單臺(tái)站數(shù)據(jù)無法準(zhǔn)確計(jì)算地表地震波參數(shù)、波型識(shí)別不準(zhǔn)確等問題。引入包含旋轉(zhuǎn)三分量的六分量(6C)極化分析已在地震波參數(shù)提取和地震信號(hào)處理等領(lǐng)域取得諸多進(jìn)展[2-4],能克服3C分析帶來的諸多弊端。
(1)
(2)
式中,rij為向量ri中的第j個(gè)元素,V為速度調(diào)整因子。方位角φ的180°模糊度問題結(jié)合r11sinφ-r12cosφ和r16的正負(fù)符號(hào)解決。
因此,正確獲得波型參數(shù)的關(guān)鍵在于識(shí)別特征向量所對(duì)應(yīng)的極化向量,即極化向量辨識(shí)是提取極化參數(shù)的前提。Sollberger等[7]提出一種應(yīng)用支持向量機(jī)(SVM)辨識(shí)6C地震波極化向量所屬波型的方法,但預(yù)測準(zhǔn)確率基本低于80%,且易混淆Love波和SH波的極化向量。為了更有效地區(qū)分6C地震波的極化向量類型,本文應(yīng)用文獻(xiàn)[6-7]的6C地震波各波型極化向量數(shù)學(xué)模型和一系列參數(shù)進(jìn)行仿真,計(jì)算得到5種實(shí)際波型和1種噪聲波型的極化向量數(shù)據(jù)集,應(yīng)用機(jī)器學(xué)習(xí)中的SVM[9-11]和MFC神經(jīng)網(wǎng)絡(luò)[12-13]構(gòu)建6C地震波極化向量波型識(shí)別模型,并以機(jī)器學(xué)習(xí)混淆矩陣和統(tǒng)計(jì)學(xué)指標(biāo)作為模型效果的評(píng)價(jià)標(biāo)準(zhǔn)進(jìn)行對(duì)比實(shí)驗(yàn)。
假設(shè)地震波的傳播介質(zhì)為橫向各向同性的分層介質(zhì),波從彈性自由面入射,空間坐標(biāo)軸的Z軸垂直向下,并給定固定角頻率ω,則P波、Love波、SH波、Rayleigh波和SV波的極化向量計(jì)算表達(dá)式為[6-7]:
(3)
(4)
(5)
(6)
(7)
式中,θS為S波入射角,θP為P波入射角,φ為方位角,β為S波速度,ps=1/V為調(diào)整比例系數(shù),ξ為Rayleigh波的橢圓角,決定偏心率的大小,Ax(x為P波或S波)為x波入射幅值,Axy(x、y為P波或S波)為x波入射、y波反射幅值,P波速度隱含在該系數(shù)中。
按照式(3)~(7)每種波型各生成5 000個(gè)6C極化向量,各波型極化向量中參數(shù)的取值范圍如表1所示,極化參數(shù)在該范圍內(nèi)隨機(jī)取值,噪聲參數(shù)在0~1范圍內(nèi)隨機(jī)取值。
區(qū)別于傳統(tǒng)的2、3、4層神經(jīng)網(wǎng)絡(luò),MFC神經(jīng)網(wǎng)絡(luò)是一種深度學(xué)習(xí)模型,可以任意修改隱藏層的數(shù)量,結(jié)合一個(gè)輸入層和一個(gè)輸出層構(gòu)建超多層神經(jīng)網(wǎng)絡(luò),其中的每一個(gè)結(jié)點(diǎn)都與其相鄰的神經(jīng)網(wǎng)絡(luò)層N個(gè)結(jié)點(diǎn)組成一對(duì)N映射結(jié)構(gòu)并互相連接,同層結(jié)點(diǎn)互不干擾。MFC神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)是可以實(shí)現(xiàn)無監(jiān)督預(yù)測學(xué)習(xí),隱藏層的多層結(jié)構(gòu)可以實(shí)現(xiàn)較強(qiáng)的非線性求解能力。
(8)
圖1 MFC神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
通過使用平方誤差函數(shù)和累積誤差改變結(jié)點(diǎn)權(quán)重wjk的值,使全局誤差E逐漸變小。wjk的變化量公式為:
(9)
通過迭代更新結(jié)點(diǎn)權(quán)重值,上一層結(jié)點(diǎn)將信號(hào)傳遞到下一層結(jié)點(diǎn),并進(jìn)行信號(hào)的疊加求和運(yùn)算,應(yīng)用指定的網(wǎng)絡(luò)輸出層激活函數(shù)得到最終輸出值。典型激活函數(shù)采用Sigmoid函數(shù),即
(10)
基于MFC神經(jīng)網(wǎng)絡(luò)的6C地震波各波型極化向量識(shí)別流程如下:1)仿真生成一個(gè)6C地震波極化向量,設(shè)置各種波型的波速、方位角、傾斜角等必要參數(shù)(表1)后,利用式(3)~(7)計(jì)算得到各波型對(duì)應(yīng)的極化向量數(shù)據(jù)集(每個(gè)波型5 000個(gè));2)隨機(jī)選擇5 000個(gè)極化向量數(shù)據(jù)集作為測試集,其余為訓(xùn)練集;3)訓(xùn)練集輸入MFC神經(jīng)網(wǎng)絡(luò)進(jìn)行迭代識(shí)別,測試集用來檢驗(yàn)識(shí)別準(zhǔn)確率。
為評(píng)判MFC神經(jīng)網(wǎng)絡(luò)在6C地震波極化向量識(shí)別中的效能,采用單輪預(yù)測和多輪預(yù)測的方式進(jìn)行分析,并與SVM結(jié)果進(jìn)行對(duì)比。
實(shí)驗(yàn)使用的軟件、操作系統(tǒng)等主要為:Python 3.10、PyCharm Community 17開發(fā)平臺(tái)、Windows 10 64位操作系統(tǒng)以及numpy、obspy、matplotlib、sklearn等Python開源庫。
MFC神經(jīng)網(wǎng)絡(luò)主要設(shè)置為:核函數(shù)采用徑向基函數(shù)(radial basis functions,RBF),隱藏層大小為[50,50];反向傳播優(yōu)化器采用可以自主學(xué)習(xí)的AdaGrad算法,其全局學(xué)習(xí)率為0.1;迭代次數(shù)為10 000次,每次迭代中訓(xùn)練模型隨機(jī)抽取數(shù)量設(shè)置為100,初始化權(quán)重為0.01。
SVM是一種通過構(gòu)建超平面解決二類型或多類型分類問題的經(jīng)典學(xué)習(xí)器,在地震學(xué)研究中常使用核函數(shù)解決非線性問題。本實(shí)驗(yàn)以機(jī)器學(xué)習(xí)中的混淆矩陣作為預(yù)測性能的指標(biāo),設(shè)計(jì)6C地震波5種波型和6種波型(將噪聲也視作一種極化向量參與識(shí)別)的極化向量識(shí)別實(shí)驗(yàn),單次波型預(yù)測的實(shí)驗(yàn)結(jié)果如圖2、3所示。
圖2 SVM單輪預(yù)測結(jié)果的混淆矩陣(考慮SH波)
由圖2可見,SVM的單輪預(yù)測準(zhǔn)確率為78.3%,其對(duì)Love波、噪聲、P波、Rayleigh波、SH波和SV波波型極化向量識(shí)別的準(zhǔn)確率分別為39%、97%、100%、94%、61%和79%。對(duì)比發(fā)現(xiàn),SVM對(duì)SH波和Love波的單一類型識(shí)別誤差較大,被誤判的極化向量類型也全部集中在Love波或SH波中,說明這2個(gè)類型存在較為相似的信號(hào)特征,較難被SVM準(zhǔn)確區(qū)分?;诖嗽?將SH波視作Love波,再次進(jìn)行極化向量類型預(yù)測分析(圖3)。由圖3可見,SVM的單輪預(yù)測準(zhǔn)確率為94%,其對(duì)Love波、噪聲、P波、Rayleigh波和SV波波型極化向量識(shí)別的準(zhǔn)確率分別為100%、97%、99%、95%和79%。值得注意的是,有16%的SV波極化向量被錯(cuò)誤識(shí)別為Love波極化向量,導(dǎo)致SVM的綜合識(shí)別率不高。
圖3 SVM單輪預(yù)測結(jié)果的混淆矩陣(SH波視作Love波)
基于MFC神經(jīng)網(wǎng)絡(luò)的6C地震波波型單輪識(shí)別過程如圖4所示。可以看出,經(jīng)過10 000次迭代,預(yù)測值從一個(gè)較低的水平持續(xù)更新并穩(wěn)定到99.5%以上;訓(xùn)練集和測試集的預(yù)測率迭代曲線整體變化趨勢高度一致,但由于訓(xùn)練集數(shù)量遠(yuǎn)小于測試集,故其預(yù)測準(zhǔn)確率一直高于測試集。
圖4 MFC神經(jīng)網(wǎng)絡(luò)單輪識(shí)別過程迭代曲線
圖5為基于MFC神經(jīng)網(wǎng)絡(luò)的20輪6C地震波各波型極化向量識(shí)別結(jié)果??梢钥闯?5種波型(SH波視為Love波)極化向量的識(shí)別效果明顯優(yōu)于6種波型。
圖5 基于MFC神經(jīng)網(wǎng)絡(luò)的20輪6C地震波極化向量識(shí)別結(jié)果
為了比較MFC神經(jīng)網(wǎng)絡(luò)與SVM模型識(shí)別6C地震波各波型極化向量的效果,分別進(jìn)行20輪預(yù)測實(shí)驗(yàn),結(jié)果如圖6和表2所示。
圖6 基于SVM的20輪6C地震波極化向量識(shí)別結(jié)果
表2 6C地震波極化向量波型預(yù)測結(jié)果對(duì)比
圖6為基于SVM的20輪6C地震波各波型極化向量識(shí)別結(jié)果??梢钥闯?將SH波視為Love波以后,5種波型的極化向量識(shí)別效果明顯優(yōu)于6種波型,二者的平均預(yù)測準(zhǔn)確率分別為94.171%和78.955%。
表2為MFC神經(jīng)網(wǎng)絡(luò)與SVM的6C地震波極化向量波型預(yù)測結(jié)果對(duì)比。由表2可見,MFC神經(jīng)網(wǎng)絡(luò)預(yù)測效果顯著優(yōu)于SVM,5種波型和6種波型識(shí)別條件下的平均識(shí)別率分別提升約5.6%和9.0%。對(duì)于5種波型的極化向量識(shí)別,MFC神經(jīng)網(wǎng)絡(luò)的預(yù)測準(zhǔn)確率較高,其均值達(dá)到99.786%,預(yù)測過程的穩(wěn)定性也很高,STD僅為0.071,極差僅為0.300%;相比之下,對(duì)于6種波型的極化向量識(shí)別,SVM的預(yù)測結(jié)果均值不太理想,僅為78.955%,且其多個(gè)指標(biāo)值都差于MFC神經(jīng)網(wǎng)絡(luò)模型,證明MFC神經(jīng)網(wǎng)絡(luò)具有更好的非線性求解能力,能更精確地識(shí)別各種6C地震波極化向量的精細(xì)化特征。
本文提出一種基于MFC神經(jīng)網(wǎng)絡(luò)的6C地震波極化向量所屬波型識(shí)別方法,能有效識(shí)別出P波、SV波、Rayleigh波所對(duì)應(yīng)的極化向量,對(duì)Love波和SH波的極化向量識(shí)別效果也相對(duì)SVM模型有所改善。
SH波和Love波是一對(duì)波形特征較為相似的地震波,其中SH波在地震工程結(jié)構(gòu)動(dòng)力響應(yīng)研究中具有重要作用;Love波相對(duì)Rayleigh波在地震勘探和反演分析中具有更好的頻散能量譜清晰度和連續(xù)性,但二者有較多的相似性,導(dǎo)致難以區(qū)分其極化向量。針對(duì)這2種波型的精準(zhǔn)區(qū)分工作仍需進(jìn)一步推進(jìn),未來研究將從引入分量信號(hào)的新型特征提取方法入手。
基于MFC神經(jīng)網(wǎng)絡(luò)的6C地震波6種波型向量識(shí)別結(jié)果均值為87.940%,仍有5%以上的提升空間。隨著人工智能技術(shù)的不斷完善,利用群體智能啟發(fā)式算法優(yōu)化神經(jīng)網(wǎng)絡(luò)模型的超參數(shù)已成為改進(jìn)模型的一個(gè)重要方向,未來將從這個(gè)角度入手,改進(jìn)MFC模型的部分預(yù)設(shè)參數(shù),進(jìn)一步提高6C地震波極化向量的預(yù)測準(zhǔn)確率。
同時(shí),在后續(xù)工作中,將應(yīng)用真實(shí)6C地震波數(shù)據(jù)計(jì)算各個(gè)頻帶與時(shí)窗上的信號(hào)協(xié)方差矩陣特征向量與特征值,根據(jù)有效特征向量與標(biāo)準(zhǔn)極化向量的實(shí)數(shù)/虛數(shù)平行特性,判斷其所屬波型并提取方位角、相速度等極化參數(shù),將兩者結(jié)合,評(píng)估本文方法的實(shí)際效果。
致謝:感謝David Sollberger、Nienke Brinkman、Sebastian Heimann、Felix Bernauer等學(xué)者提供TwistPy工具。