林彬華,金星,3*,康蘭池,韋永祥,李軍,張燕明,陳惠芳,周施文
1 福建省地震局,福州 350003 2 福州大學(xué),福州 350108 3 中國地震局廈門海洋地震研究所,廈門 361021
總結(jié)上述方法,主要思路都是從地震初期少量地震波形記錄中提取與地震震級相關(guān)的頻率、振幅信息,并從歷史地震數(shù)據(jù)中通過統(tǒng)計(jì)方法獲得相關(guān)統(tǒng)計(jì)公式用于地震震級測定中.但是,地震震級測定是一個(gè)十分復(fù)雜的過程,需要綜合考慮震源過程、傳播介質(zhì)、場地條件、儀器響應(yīng)等多個(gè)方面因素的影響,單一的幅值或周期參數(shù)在一定程度上能夠較好映射出地震的規(guī)模,但較難反映出地震的全部特征,從而導(dǎo)致地震震級測定的精度不足.
近年來,隨著地震數(shù)據(jù)資料不斷積累,以及深度學(xué)習(xí)算法的出現(xiàn),使得人工智能技術(shù)在地震學(xué)領(lǐng)域中的應(yīng)用進(jìn)入新的階段.Perol等(2018)應(yīng)用CNN網(wǎng)絡(luò)實(shí)現(xiàn)地震檢測和定位,可檢測出比常規(guī)地震目錄多17倍的地震,且檢測效率也比模板匹配快了好幾個(gè)數(shù)量級.Zhu和Beroza(2019)利用U-net神經(jīng)網(wǎng)絡(luò)將震相拾取問題看成分割問題,提高了P波和S波的拾取精度.趙明等(2019b)應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)對汶川地震余震波形進(jìn)行自動(dòng)分類與識別,其訓(xùn)練和檢測準(zhǔn)確率均達(dá)到95%以上.Lomax等(2019)設(shè)計(jì)了單臺50 s波形輸入的ConvNetQuake_INGV網(wǎng)絡(luò)來檢測地方震和遠(yuǎn)震,根據(jù)震中距、方位角、震源深度和震級等特征獲得地震的概率估計(jì),模型展示了即使地震事件在空間位置和震級上的廣度,也能獲得較高的識別效果(準(zhǔn)確率達(dá)87%).Mousavi和Beroza(2020)設(shè)計(jì)了單臺30 s的卷積神經(jīng)網(wǎng)絡(luò)和遞歸神經(jīng)網(wǎng)絡(luò)聯(lián)合的震級預(yù)測模型,震級預(yù)測標(biāo)準(zhǔn)差約為0.2,網(wǎng)絡(luò)可有效提高地方性震級和持時(shí)震級測量精度.胡安冬和張海明(2020)設(shè)計(jì)了NN模型和CNN模型對地震緊急預(yù)警震級進(jìn)行預(yù)估,目前已實(shí)現(xiàn)以NN網(wǎng)絡(luò)為基礎(chǔ)的模型,與已有單臺震級預(yù)估算法相比有著更好的效果,但因數(shù)據(jù)量不足的原因暫時(shí)還未實(shí)現(xiàn)CNN模型對震級的預(yù)估.以上研究進(jìn)一步證明了CNN在地震檢測及在地震預(yù)警方面的應(yīng)用存在較好的潛力.為此,本文設(shè)計(jì)了以地震三分量波形數(shù)據(jù)作為輸入,震級類別作為輸出,訓(xùn)練出3 s樣本的CNN震級預(yù)測模型.該方法充分利用首臺前3 s全波形信息,通過多層卷積核自動(dòng)提取波形綜合、深層次的特征,相比于傳統(tǒng)單一特征提取方法更加全面、可靠,提高了震級測定精度和可靠度,有望解決地震預(yù)警震級測定這一世界性難題.
福建測震臺網(wǎng)由88個(gè)測震臺站、16個(gè)臺灣臺及12個(gè)周邊鄰省臺站共116臺組成.本文選取了2012—2019年福建臺網(wǎng)記錄到的福建地區(qū)、臺灣海峽及臺灣地區(qū)ML>2.0共1928個(gè)地震作為研究資料,其中2≤ML<3的地震共721個(gè),3≤ML<4的地震共607個(gè),4≤ML<5的地震共474個(gè),5≤ML<6的地震共99個(gè),ML≥6的地震共27個(gè),地震分布圖如圖1所示.所有臺站記錄均包含E、N、Z三分量,采樣率為100 Hz,均為扣除臺站儀器響應(yīng)后獲得實(shí)際地動(dòng)速度記錄(單位um·s-1).
圖1 福建臺網(wǎng)記錄2012—2019年份的地震分布圖
樣本數(shù)據(jù)是根據(jù)P波到時(shí)信息從原始波形截取每個(gè)臺站的樣本,本文主要訓(xùn)練了3 s樣本長度模型.截取規(guī)則如下,截取P波到時(shí)前0.2 s至P波到時(shí)后2.8 s的數(shù)據(jù)段(帶有振幅信息).圖2展示了不同震級的3 s樣本波形存在較大差異,如ML2.0樣本波形含有較為豐富的高頻信息,ML6.1樣本波形的長周期成分較強(qiáng),即隨著震級增加,波形的優(yōu)勢周期增大,為深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)奠定重要基礎(chǔ).
圖2 3 s長度的樣本波形記錄
福建臺網(wǎng)的大震樣本較為稀缺,故收集川滇地區(qū)2017—2019年記錄的21次ML>5的地震震例進(jìn)行補(bǔ)充,同時(shí)使用隨機(jī)截取地震事件對大震樣本進(jìn)行增強(qiáng)處理.具體處理方法是,利用滑動(dòng)窗在P波到時(shí)附近滑動(dòng),隨機(jī)截取出若干條記錄作為樣本.如圖3為隨機(jī)截取地震樣本記錄示意圖,一條地震記錄可截取出D1、D2、D3、D4等4條3 s長度的數(shù)據(jù)段作為增強(qiáng)樣本.
圖3 隨機(jī)截取地震記錄實(shí)現(xiàn)數(shù)據(jù)增強(qiáng)
當(dāng)?shù)卣鹩|發(fā)后,為更快地估算地震震級,通常選用前幾臺的地震記錄信息進(jìn)行判別,因此本文只截取出1949個(gè)歷史地震事件中150 km內(nèi)的臺站記錄作為研究資料,經(jīng)過重復(fù)小震記錄的剔除、大震樣本增強(qiáng)處理、記錄質(zhì)量篩選后共得到14644條三分向地震記錄,所有記錄相對于震級和震中距的分布情況,如圖4所示,樣本震中距分布在0~150 km,震級主要分布在ML2.0~6.5之間,樣本所覆蓋的震中距范圍和震級范圍都較廣,而非針對某個(gè)特定區(qū)域的研究,使得訓(xùn)練好的模型具有更好的實(shí)際應(yīng)用價(jià)值.
圖4 地震記錄相對震中距和震級的分布情況
將其中2012—2018年震例資料共11807條記錄作為訓(xùn)練集樣本,供卷積神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)訓(xùn)練;將2019年震例資料共2837條記錄作為測試集樣本,檢驗(yàn)?zāi)P蛯φ鸺壍念A(yù)測效果.
由于卷積神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的分類功能,且地震震級通常可允許的誤差在±0.3(南芳芳等,2019),故本文將震級測定看成是分類問題,對震級大小進(jìn)行等級分類,具體分類情況如表1所示,將ML2.0~2.2分為第1類,ML2.3~2.5為第2類,…,ML>7.6為第20類,共將ML>2.0的震級分成20個(gè)不同等級類別.
當(dāng)模型在實(shí)際檢測中,若識別出該地震為第10個(gè)等級類別,按表1可得震級范圍在ML4.7~4.9,本文規(guī)定模型最終預(yù)測震級值取中間值,故為ML4.8,這樣有可能造成模型預(yù)測的震級值與實(shí)際震級值之間存在±0.1的系統(tǒng)誤差,但該誤差是在可接受的范圍內(nèi).
表1 震級分類及標(biāo)簽
卷積神經(jīng)網(wǎng)絡(luò)具有自動(dòng)提取特征和長輸入數(shù)據(jù)的縮放能力,與地震信號處理的需求相契合.然而,卷積神經(jīng)網(wǎng)絡(luò)對未歸一化輸入數(shù)據(jù)較為敏感,使其在震級估算中遇到較大的挑戰(zhàn).地方性震級ML規(guī)定(中華人民共和國國家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局和中國國家標(biāo)準(zhǔn)化管理委員會(huì),2017),即
ML=lgA+R(Δ)+S,
(1)
式中,A為水平向的峰值振幅;R(Δ)為儀器的量規(guī)函數(shù),隨震中距變化的函數(shù),其物理意義是補(bǔ)償?shù)卣鸩S距離的衰減;S為臺站場地校正項(xiàng).為了測定震級,需要獲取平均衰減模型和場地函數(shù).神經(jīng)網(wǎng)絡(luò)可以從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)到這些關(guān)系,我們只需確保向網(wǎng)絡(luò)提供學(xué)習(xí)這些關(guān)系所需要的信息.
從式(1)可知振幅信息對震級測定非常關(guān)鍵,但是數(shù)據(jù)歸一化處理可使典型卷積神經(jīng)網(wǎng)絡(luò)獲得較好的性能.為此,Lomax等(2019)通過提取振幅信息作為額外數(shù)值輸入到網(wǎng)絡(luò)中來克服這個(gè)問題.而Mousavi和Beroza(2020)設(shè)計(jì)了一個(gè)主要由卷積層和循環(huán)層構(gòu)成的網(wǎng)絡(luò),其中卷積層沒有任何激活函數(shù),僅用于降維和特征提取.但是以上兩種方法網(wǎng)絡(luò)較為復(fù)雜也不是很高效,因此本文設(shè)計(jì)了針對帶振幅信息輸入的卷積神經(jīng)網(wǎng)絡(luò),將震級輸出劃分為20個(gè)不同震級類別,降低了震級輸出的離散性,提高了每組類型判別的樣本數(shù)量.另外,通過在卷積層中增加RELU激發(fā)函數(shù)以及采用ADAM優(yōu)化算法使模型參數(shù)值更加穩(wěn)定,解決了輸入未歸一化數(shù)據(jù)容易引起梯度變化過大的問題,提高模型的識別效果.
針對地震震級測定問題,將單臺三通道的3 s波形作為輸入,震級類別作為輸出,進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練與識別.卷積神經(jīng)網(wǎng)絡(luò)通過卷積核提取波形的內(nèi)在特征,設(shè)置多層卷積層,提取更多的特征,綜合以上特征信息,最后采用類似投票的方式輸出該事物所屬震級類型的概率(圖5).
圖5 卷積神經(jīng)網(wǎng)絡(luò)模型的輸入與輸出
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)的核心部分是卷積,卷積層是通過將上一層的每個(gè)通道特征圖和卷積核(如1×3)進(jìn)行卷積、疊加、增加偏置項(xiàng)、外加一個(gè)非線性的激活函數(shù)獲得(如公式(2)):
(2)
經(jīng)過多層卷積、池化,全連接層處理,最后一層的輸出設(shè)為Z=(z1,z2,…,zj,…,zm),共分為m個(gè)類別.經(jīng)過分類函數(shù)(softmax)處理后,得出模型的輸出概率,其表達(dá)式如下:
(3)
式中,zj為最后一層輸出Z的第j個(gè)元素值,qj為屬于第j種類別的概率值(通常在0~1之間,概率值越大表示屬于該類別的可能性越大).
本文的損失函數(shù)H是采用實(shí)際的標(biāo)簽pj和預(yù)測概率分布qj之間的交叉熵,表達(dá)式如下:
(4)
從交叉熵的公式來看,交叉熵刻畫的是pj和qj兩個(gè)概率分布之間的距離,可以理解為交叉熵值越小,實(shí)際與預(yù)測的概率分布越接近.預(yù)測概率分布p為二值化編碼形式的標(biāo)簽,如[0,0,1,0,0],可判斷是屬于第三種類別.
搭建一個(gè)好的卷積神經(jīng)網(wǎng)絡(luò)模型需要對卷積核大小、卷積通道數(shù)、激活函數(shù)類型、卷積層數(shù)、全連接層數(shù)、訓(xùn)練批次數(shù)等參數(shù)進(jìn)行設(shè)計(jì).本研究采用Tensorflow框架進(jìn)行模型搭建和訓(xùn)練.參數(shù)選取的原則,一方面總結(jié)前人的研究經(jīng)驗(yàn)(Krizhevsky et al.,2012; Ma et al., 2015; Perol et al., 2018; 趙明等,2019a),針對地震波三通道檢測,采用卷積核1×3,每層卷積通道數(shù)為64道,選用128批次和RELU激活函數(shù).另一方面根據(jù)實(shí)測數(shù)據(jù)的調(diào)參試驗(yàn)獲得最優(yōu)模型參數(shù).
表2列出不同模型參數(shù),訓(xùn)練集與測試集的準(zhǔn)確率和耗時(shí)情況,以測試集的準(zhǔn)確率來評判模型的優(yōu)劣.通過試驗(yàn)S01、S02、S03,可知7層卷積層的模型識別效果較優(yōu);通過試驗(yàn)S02、S04、S05,可知2層連接層的模型識別效果較優(yōu).由于本試驗(yàn)采用GPU配置的工作站進(jìn)行訓(xùn)練,因此在耗時(shí)上相差無幾.
表2 卷積層數(shù)和全連接層數(shù)的調(diào)參試驗(yàn)
綜上所述,設(shè)計(jì)出3s樣本輸入的震級測定模型架構(gòu),如圖6所示,以臺站三通道的地震波形數(shù)據(jù)作為輸入,采用1×3卷積核進(jìn)行卷積,用0填充對邊緣處理,2×2最大值池化.本例輸入波形層(也就是第0層)用3個(gè)通道,從第1到第7個(gè)卷積層都采用64個(gè)通道數(shù).經(jīng)過7層卷積池化后,特征圖由原來的64@300縮小為64@3,該過程可看成從原始地震數(shù)據(jù)中提取和壓縮有用信息到特征圖,使得最后一層特征圖具有深層、概括性強(qiáng)的特征表征能力.將這些特征圖展開為一維向量,共得到192個(gè)特征點(diǎn),最后采用2層全連接模式輸出20個(gè)震級等級中概率最大的類別.
圖6 震級預(yù)測的卷積神經(jīng)網(wǎng)絡(luò)模型架構(gòu)
本模型訓(xùn)練在Windows10、64位系統(tǒng)運(yùn)行,設(shè)備安裝Tensorflow深度學(xué)習(xí)框架的相關(guān)環(huán)境,采用Tensorflow-gpu版本進(jìn)行訓(xùn)練,大大提高訓(xùn)練效率.模型訓(xùn)練所配備的硬件和軟件配置如表3所示.
表3 模型訓(xùn)練所配備的硬件和軟件環(huán)境
訓(xùn)練過程采用小批次隨機(jī)梯度下降法(SGD)算法、增加L2正則化防止過擬合、以及ADAM優(yōu)化算法,學(xué)習(xí)率取0.001,訓(xùn)練的目標(biāo)誤差為0.08,迭代10000次進(jìn)行學(xué)習(xí)訓(xùn)練.通常耗時(shí)都集中在訓(xùn)練上,對于普通的CPU配置機(jī)子,迭代10000次耗時(shí)大約需要300 min,不過采用GPU計(jì)算耗時(shí)只需3~5 min左右,提高了上百倍的模型訓(xùn)練效率.
通過訓(xùn)練集數(shù)據(jù)訓(xùn)練出震級預(yù)測網(wǎng)絡(luò)模型MagNet,將訓(xùn)練集數(shù)據(jù)通過MagNet仿真預(yù)測,得到訓(xùn)練集的預(yù)測震級與實(shí)際震級的關(guān)系(圖7a);將測試集數(shù)據(jù)通過MagNet仿真預(yù)測,得到測試集的預(yù)測震級與實(shí)際震級的關(guān)系(圖7b).可以看出訓(xùn)練集的離散度較小,幾乎都集中1∶1的對角線上,震級偏差的標(biāo)準(zhǔn)差為0.106;而測試集的離散度較大些,震級偏差的標(biāo)準(zhǔn)差為0.231.
圖7 MagNet模型預(yù)測震級與實(shí)際震級的關(guān)系
將MagNet模型預(yù)測的震級值與實(shí)際震級值進(jìn)行對比,逐一計(jì)算震級偏差,公式如下:
(5)
式中,ΔMij為第i個(gè)地震第j個(gè)臺站的震級偏差,MCNN為卷積神經(jīng)網(wǎng)絡(luò)模型預(yù)測震級值,M0為該地震最終的編目震級.根據(jù)省級測震臺網(wǎng)地震速報(bào)評比標(biāo)準(zhǔn),通常震級誤差的允許范圍為±0.3.
由于測試樣本對模型來說屬于新鮮樣本,因此可統(tǒng)計(jì)測試集的震級偏差來評判模型的優(yōu)劣.將測試集MagNet模型的預(yù)測結(jié)果MCNN,并與實(shí)際震級值M0之間求偏差進(jìn)行分析,結(jié)果如圖8所示,測試結(jié)果的震級偏差整體呈正態(tài)分布,平均震級偏差為0.028,標(biāo)準(zhǔn)差為0.231,最大震級偏差為-1.3.其中MCNN與M0震級偏差控制在±0.3以內(nèi)的占85.6%,MCNN與M0震級偏差控制在±0.5以內(nèi)高達(dá)95.7%.
圖8 MagNet模型的測試結(jié)果
為了提高M(jìn)agNet模型預(yù)測的可靠性,針對同一個(gè)地震事件中多臺的預(yù)測結(jié)果進(jìn)行綜合平均.將測試集2837條地震記錄,以地震事件進(jìn)行歸類,共有278個(gè)地震事件.統(tǒng)計(jì)測試集278個(gè)事件的前三臺預(yù)測震級的平均偏差,如圖9所示,得出91.8%的地震事件震級偏差控制在±0.3級以內(nèi),相比較單臺預(yù)測而言,最大震級偏差由-1.3減小為-0.6,標(biāo)準(zhǔn)差由0.231降至0.160,離散度減小,預(yù)測效果更優(yōu)更可靠.其中2019年1月30日23時(shí)14分臺灣花蓮海域5.1級震例的前三臺平均震級偏差為0.033,MagNet震級預(yù)測效果好,預(yù)測效果基本和實(shí)際一致,這是由于該地震區(qū)域存在較多歷史震例,使得MagNet模型充分學(xué)習(xí)到該區(qū)域地震波形特征與震級之間的映射關(guān)系,從而做出可靠的預(yù)測.
圖9 前三臺平均的震級偏差統(tǒng)計(jì)圖
從測試集278個(gè)地震事件中挑出前三臺平均震級偏差大于或等于0.45的事件共有4個(gè),具體結(jié)果見表4.對較大震級偏差的事件進(jìn)行分析如下:福建龍巖ML2.1的震級偏差主要由于該區(qū)域周圍無歷史震例樣本,導(dǎo)致MagNet模型無法學(xué)習(xí)到該區(qū)域?qū)俚鼗ㄐ翁卣?,例如龍巖臺觀測儀器布設(shè)在半山腰,臺站記錄受場地放大效應(yīng)的影響,使得模型預(yù)測的震級值偏大;臺灣新北ML3.2的震級偏差主要由于該地震震源深度為102 km,福建ML測定是未考慮震源深度的影響,故而測得的ML偏小.然而MagNet模型通過深度學(xué)習(xí)歷史震例,訓(xùn)練出一套不同于傳統(tǒng)方法的震級預(yù)測模式,該模式可能有考慮震源深度的影響,故而預(yù)測出的震級值比實(shí)際ML偏大;巴坦群島海域ML4.5、臺灣宜蘭海域ML6.1這兩個(gè)事件具有共同的分布特征是:一是該事件周圍歷史樣本較稀疏,導(dǎo)致CNN模型訓(xùn)練時(shí)樣本數(shù)量不夠,使得模型預(yù)測效果較差;二則這些事件屬于網(wǎng)外地震,離最近臺站較遠(yuǎn),可能對事件本身震級測定精度造成一定的影響.同時(shí)這兩個(gè)事件都為臺灣島東部海域地震,該地區(qū)的地下構(gòu)造受太平洋板塊和亞歐板塊的俯沖作用影響,使得其發(fā)震機(jī)理較為復(fù)雜,體現(xiàn)的波形特征具有多樣性,再加上樣本數(shù)有限,最終導(dǎo)致模型預(yù)測偏差較大.
表4 事件震級偏差大于0.4的地震統(tǒng)計(jì)表
利用文中CNN模型所使用的樣本數(shù)據(jù),篩選出震源距小于60 km的臺站記錄作為研究資料,分別采用τc和Pd兩種方法擬合出特征參數(shù)與地震震級間的關(guān)系,統(tǒng)計(jì)得出預(yù)估震級與實(shí)際震級偏差的標(biāo)準(zhǔn)差,并與上述獲得的CNN震級測定方法進(jìn)行比較.
3.4.1τc方法
根據(jù)周期特征類τc方法(Kanamori,2005;張紅才等,2017)提取出每條臺站記錄P波段的周期特征參數(shù),再采用M=a+blg(τc)形式擬合,得到τc特征參數(shù)與地震震級間的關(guān)系:
M=7.41+5.52lg(τc)±0.79,
(6)
式中,τc為P波觸發(fā)后3s數(shù)據(jù)的臺站垂直向獲得的特征周期,單位為s;M為事件震級ML.圖10a為每條臺站記錄的周期τc值與震級M的統(tǒng)計(jì)關(guān)系,震級與周期τc呈正相關(guān).圖10b為采用τc方法預(yù)測的震級值與實(shí)際震級值之間的關(guān)系,并獲得兩者震級偏差的標(biāo)準(zhǔn)差為0.79個(gè)震級單位.
圖10 利用τc方法預(yù)測震級
3.4.2Pd方法
根據(jù)幅值特征類Pd方法(Zollo et al.,2006)提取出經(jīng)過高通濾波器(低頻截至頻率為0.075 Hz)濾波的位移幅值特征參數(shù),再采用M=a+blg(R)+clg(Pd)形式擬合,得到Pd特征參數(shù)與地震震級間的關(guān)系:
M=3.10+1.95lg(R)+0.89lg(Pd)±0.40,
(7)
圖11 利用Pd方法預(yù)測震級
對以上周期特征類τc方法和幅值特征類Pd方法分析表明,統(tǒng)計(jì)得出預(yù)估震級與實(shí)際震級偏差的標(biāo)準(zhǔn)差分別為0.79和0.40,均大于CNN模型測定震級的標(biāo)準(zhǔn)差(無論是訓(xùn)練集還是測試集).另外,CNN模型所使用的資料是對震中距150 km范圍內(nèi)的臺站記錄(包括淺源和深源地震)共14644條樣本做統(tǒng)計(jì),而特征參數(shù)方法只篩選出震源距60 km的臺站記錄(淺源地震)共2310條樣本進(jìn)行統(tǒng)計(jì)擬合,相比而言,CNN模型統(tǒng)計(jì)的數(shù)據(jù)更加全面、多樣性,更加接近真實(shí)地震可能存在的情況.綜上所述,驗(yàn)證了本文提出CNN的震級測定方法優(yōu)于傳統(tǒng)的特征統(tǒng)計(jì)方法.
為了進(jìn)一步驗(yàn)證CNN模型對地震震級的測定效果,本文選取樣本資料充足區(qū)域的臺灣花蓮ML5.9震例和樣本資料稀疏區(qū)域的巴坦群島海域ML4.5震例進(jìn)行分析.
利用CNN模型、τc、Pd三種方法對典型震例的震級進(jìn)行預(yù)測,結(jié)果如表5所示.對于臺灣花蓮ML5.9地震,CNN模型、τc、Pd方法的預(yù)測震級與實(shí)際震級偏差分別為0.04、-0.88、-0.16,CNN模型預(yù)測效果最優(yōu),其次Pd方法,τc方法最差,這是由于該地震區(qū)域存在較多歷史震例,使得神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)對該區(qū)域震例的特征學(xué)習(xí)更加充分,CNN模型相比傳統(tǒng)特征方法具有更強(qiáng)的非線性、多因素的擬合能力,所以CNN模型預(yù)測效果優(yōu)于傳統(tǒng)特征方法.對于巴坦群島海域ML4.5地震,CNN模型、τc、Pd方法的預(yù)測震級與實(shí)際震級偏差分別為-0.50、0.12、-0.64,τc方法最優(yōu),CNN模型次之,Pd方法最差,這是由于該地震歷史樣本較少,訓(xùn)練時(shí)神經(jīng)網(wǎng)絡(luò)未能充分學(xué)習(xí)到該區(qū)域的歷史震例特征,神經(jīng)網(wǎng)絡(luò)會(huì)發(fā)揮一部分泛化能力對未知區(qū)域進(jìn)行預(yù)測,但是傳統(tǒng)特征方法簡單的線性預(yù)測,有可能效果會(huì)優(yōu)于CNN模型.綜上,可以看出τc方法和Pd方法還不夠穩(wěn)定,既有好的預(yù)測效果,也有差的預(yù)測效果.CNN模型在樣本充足的情況下可以做出高可靠的預(yù)測,因此在實(shí)際應(yīng)用中有必要將多種方法聯(lián)合分析,更大程度的發(fā)揮新技術(shù)帶來的優(yōu)勢.
表5 典型震例的預(yù)測效果對比分析
本文充分利用卷積神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的分類功能,把震級測定問題看成分類問題來處理,將震級ML>2.0的地震共分成20個(gè)震級類型進(jìn)行識別,提供了一種震級測定的新思路.應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)建立了單臺三通道3 s樣本波形與震級大小的映射模型,并用2012—2018年歷史震例資料訓(xùn)練出適用于震級預(yù)測的MagNet模型,模型能夠又快又準(zhǔn)地測定出地震震級,相較于傳統(tǒng)方法,模型測定的震級值更加穩(wěn)定可靠,為解決地震預(yù)警震級測定這一挑戰(zhàn)性難題提供了新的技術(shù)手段.
通常地震樣本數(shù)據(jù)會(huì)存在空間分布和震級分布的不均勻性,可通過剔除地震頻發(fā)地帶較小的相似地震,并對較大地震數(shù)據(jù)進(jìn)行樣本增強(qiáng)處理,使得樣本分布更加均勻,可提高模型的識別效果.在模型構(gòu)建過程中,針對3 s地震波形的輸入,采用1×3的小卷積核效果較佳.通過調(diào)參試驗(yàn)可知,6層卷積層未能充分提取到全局特征,8層卷積層過度壓縮,使得部分局部特征被掩蓋,因此得到7層卷積層效果較優(yōu).而1層全連接層可能對事物特征表達(dá)力不夠,但3層全連接層可能會(huì)造成過擬合現(xiàn)象,因而得2層全連接層較優(yōu).典型卷積神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)通常需要做歸一化處理,如震相識別、地震定位等處理.但是針對地震震級測定問題,由于振幅信息的重要性,因此構(gòu)建了帶振幅信息輸入的卷積神經(jīng)網(wǎng)絡(luò),一方面將震級輸出劃分為20個(gè)不同震級類別,減小震級輸出的分類類別,增加每類樣本數(shù)量;另一方面通過在卷積層中增加RELU激發(fā)函數(shù)以及采用ADAM優(yōu)化算法來解決未歸一化的問題,進(jìn)而使得模型的識別效果更佳.
用2019年新震例對模型進(jìn)行測試分析,得出單臺的震級偏差有85.6%可以控制在±0.3以內(nèi),前三臺平均的震級偏差有91.8%可以控制在±0.3以內(nèi),可見多臺平均的震級預(yù)測效果比單臺更加穩(wěn)定可靠.分析震級偏差較大的事件,得出對于缺乏歷史震例的地震樣本的識別效果較差,同時(shí)對于臺灣島東部海域遠(yuǎn)岸的地震由于發(fā)震機(jī)制復(fù)雜多樣,導(dǎo)致波形特征多樣性,在歷史樣本不足且臺站距離較遠(yuǎn)的情況下,容易導(dǎo)致模型預(yù)測出現(xiàn)較大偏差.雖然深度神經(jīng)網(wǎng)絡(luò)的新方法總體上優(yōu)于傳統(tǒng)特征方法,但這并不代表在實(shí)際應(yīng)用中可以完全取代傳統(tǒng)震級測定方法.換言之,可以將兩者結(jié)合起來,發(fā)揮各自的優(yōu)點(diǎn),比如對于歷史多震區(qū)域的地震,則以深度神經(jīng)網(wǎng)絡(luò)預(yù)測的震級結(jié)果為主;而對于歷史少震或無震區(qū)域的地震,則需要傳統(tǒng)特征方法聯(lián)合輔助判斷,使得結(jié)果更加可靠.預(yù)警工程是一個(gè)十分復(fù)雜的工程,除了考慮震級偏差外,還需考慮誤報(bào)率.不同地區(qū)的預(yù)警報(bào)警等級不同,例如對于福建地區(qū)的地震,通常震級大于3.5級或者近臺烈度超過一定限值,即發(fā)出預(yù)警警報(bào);對于臺灣地區(qū)的地震,通常5級或5.5級以上地震,便向福建全省發(fā)出預(yù)警警報(bào).而一旦將小地震發(fā)布成大地震,所帶來的社會(huì)和經(jīng)濟(jì)影響將會(huì)很大,因此還需要進(jìn)一步防止誤報(bào)現(xiàn)象.
地震震級測定是一個(gè)非常難的問題,其受地震震源深度、區(qū)域衰減、臺站場地等多種因素的影響.根據(jù)地震震源深度的不同,震級度量方法也不同.對于淺源地震,通常選用里氏震級ML和面波震級MS;對于深源地震,通常采用體波震級mb.考慮區(qū)域衰減的影響,主要體現(xiàn)在量規(guī)函數(shù)項(xiàng),即補(bǔ)償量隨震中距的變化函數(shù),不同地區(qū)的量規(guī)函數(shù)會(huì)存在一定的差異但不會(huì)太大.臺站場地也會(huì)對震級造成一定影響,主要體現(xiàn)在臺站校正值,如臺站受場地放大效應(yīng)的影響,常導(dǎo)致單臺震級測量偏大.針對單臺震級測量偏差問題,深度神經(jīng)網(wǎng)絡(luò)通過自學(xué)習(xí)波形特征,訓(xùn)練出單臺波形與最終臺網(wǎng)平均震級之間的映射關(guān)系,即可消除不同臺站場地造成的震級偏差影響.文中震級預(yù)測模型采用ML震級進(jìn)行訓(xùn)練,但由于ML震級本身的局限性,當(dāng)測定的震級大于6.5級時(shí)將趨于飽和,對于7.0級以上大震顯然難以從ML測定中得到較科學(xué)的震級,因此可選用其它震級標(biāo)度(如MS、mb或MW)作為最終震級值進(jìn)行訓(xùn)練.同時(shí)對于深源地震,可選用mb震級作為最終震級值進(jìn)行訓(xùn)練.
另外,還需考慮噪聲、異常波形的影響,文中所用的訓(xùn)練數(shù)據(jù)都是不同震級的地震波形,這會(huì)導(dǎo)致訓(xùn)練出來的網(wǎng)絡(luò)偏向?qū)Φ卣鸩ㄐ胃信d趣,而實(shí)際應(yīng)用中必不可少會(huì)存在地震噪聲或異常波形,可能導(dǎo)致網(wǎng)絡(luò)出現(xiàn)一定的偏差,因此后續(xù)需要增加一個(gè)專門區(qū)分地震、噪聲和異常波形的網(wǎng)絡(luò)先將地震數(shù)據(jù)分離出來,再做CNN震級測定.
文中的訓(xùn)練數(shù)據(jù)雖然有增加部分川滇地區(qū)ML>5.0的地震記錄,并進(jìn)行了大震樣本增強(qiáng)處理,但是大震樣本數(shù)量還是比較有限,今后可收集全國各地域的大震記錄加入模型訓(xùn)練,并探究模型在不同地區(qū)的適用能力.隨著地震數(shù)據(jù)量不斷積累,網(wǎng)絡(luò)模型不斷加深和優(yōu)化,在3 s樣本的基礎(chǔ)上再訓(xùn)練出5 s、8 s、10 s、20 s等樣本的震級預(yù)測模型,以滿足地震預(yù)警震級連續(xù)測定的要求,可進(jìn)一步提高預(yù)警震級的精度和可靠度.
致謝感謝審稿專家提出的修改意見和編輯部的大力支持!