吳果 李建強 冉洪流 周慶 謝卓娟
1)中國地震局地質(zhì)研究所,活動構(gòu)造與火山重點實驗室,北京 100029 2)中水北方勘測設(shè)計研究有限責任公司,天津 300222 3)應急管理部國家自然災害防治研究院,北京 100085
我國海域及鄰區(qū)同時受到歐亞板塊、西太平洋板塊、印澳板塊和菲律賓海板塊的作用(圖1),構(gòu)造活動強烈、地震頻發(fā)(劉光鼎,1992;彭艷菊等,2008)。海域地震對我國沿海地區(qū)的經(jīng)濟建設(shè)和社會穩(wěn)定以及我國的海洋資源開發(fā)構(gòu)成了嚴重威脅(丁海平等,2011;謝卓娟等,2020)。因此,分析我國海域及鄰區(qū)的地震活動特征并進行海域地震區(qū)劃的重要性日益凸顯(李小軍等,2020)。區(qū)別于大陸地區(qū),廣大海域地區(qū)缺乏地震地質(zhì)、地球物理等資料(林趾祥等,1999),儀器地震記錄成為分析我國海域地震活動性最重要的基礎(chǔ)資料。
圖1 中國海域及鄰區(qū)震中分布(公元前1767—2020年9月)
地震震級是地震記錄中最重要的參數(shù)之一,是通過測量地震波中的某個震相的振幅來衡量地震的相對大小的一個量(劉瑞豐等,2018)。由于不同類型震級基于的地震波類型和優(yōu)勢周期不同,使得不同震級標度之間存在一定差異。新的國家標準《地震震級的規(guī)定》(GB17740—2017)中規(guī)定了地方性震級(ML)、面波震級(MS)和矩震級(MW)等6種震級標度。由于矩震級具有與地震震源的物理過程直接關(guān)聯(lián)、可以表征地震的絕對大小且不會產(chǎn)生震級飽和等優(yōu)點,其已經(jīng)成為國內(nèi)外地震學界推薦優(yōu)先使用的震級標度(陳運泰等,2004、2018)。
國際上最新的地震活動研究成果大都基于矩震級,例如適用于海域俯沖帶的地震動衰減模型(Abrahamson et al,2016、2018;Kishida et al,2018a)。然而,由于矩震級的測定工作開展較晚、原理較復雜,歷史地震和大量的早期儀器地震記錄均缺乏矩震級記錄。如果對其他類型的震級不加以處理,直接輸入基于矩震級的模型,將會引起較大誤差,影響計算結(jié)果的可靠性。因此,在地震活動分析和地震危險性評價領(lǐng)域經(jīng)常需要開展震級轉(zhuǎn)換的工作,與其相關(guān)的研究一直是國際上的研究熱點(Pandey et al,2017;Kishida et al,2018b;Konstantinou et al,2018;Lolli et al,2018、2020;Wu et al,2019;Kumar et al,2020;Das et al,2021;Manzunzu et al,2021)。
已有學者擬合了國內(nèi)不同震級標度之間的轉(zhuǎn)換關(guān)系(劉瑞豐等,2007;汪素云等,2009;Wu et al,2019)以及中國地震臺網(wǎng)震級標度與國際上相應測定震級之間的關(guān)系(劉瑞豐等,2005、2006;Bormann et al,2007、2009)。同時,由于面波震級是國內(nèi)工程地震學界最常用的震級標度(肖亮,2011;潘華等,2013;Xu,2019;Xu et al,2021),多位學者使用最小二乘回歸或正交回歸建立了MS到MW的轉(zhuǎn)換關(guān)系,例如陳宏峰等(2014)基于2008年以來中國地震臺網(wǎng)86個5.3級以上地震數(shù)據(jù),采用正交回歸擬合了MS與MW的轉(zhuǎn)換關(guān)系;Cheng等(2017)采用正交回歸擬合了中國大陸及鄰區(qū)MS與MW的分段線性關(guān)系;沙海軍等(2018)使用加權(quán)最小二乘回歸建立了中國地震臺網(wǎng)MS與MW的統(tǒng)計關(guān)系。這些研究成果在地震預測預報、工程抗震、防震減災等領(lǐng)域發(fā)揮了重要的作用。
區(qū)別于中國大陸地區(qū),海域地震具有分布范圍廣、震源深度變化大以及地震監(jiān)測水平相對較差且空間差異大等特征。因此,海域地震的經(jīng)緯度范圍和震源深度等均可能影響到MS與MW的對應關(guān)系。然而,前人對于MS到MW的轉(zhuǎn)換關(guān)系的研究大都圍繞中國大陸地區(qū)進行,目前尚缺少以我國海域及鄰區(qū)為研究區(qū)的針對性研究,僅謝卓娟等(2020)在編譯我國海域及鄰區(qū)的地震目錄時擬合了MW到MS的線性關(guān)系。此外,目前國內(nèi)外常用的擬合震級轉(zhuǎn)換關(guān)系的方法主要為最小二乘回歸和正交回歸(Castellaro et al,2007;Wason et al,2012;吳果等,2014;Cheng et al,2017;Xie et al,2021)。這2種方法通常僅考慮單因子MS,未能考慮諸如震源深度等因素對結(jié)果的影響,且當數(shù)據(jù)點偏離線性規(guī)律時擬合效果受到影響。
近年來,BP神經(jīng)網(wǎng)絡(luò)已經(jīng)被成功應用于地震滑坡預測、地震波震相識別等地震學相關(guān)領(lǐng)域(孫印等,2018;Tian et al,2019;張彭達等,2020)。相比于傳統(tǒng)的線性擬合,BP神經(jīng)網(wǎng)絡(luò)可以建立多種影響因子與目標參數(shù)之間的非線性映射,這為建立震級轉(zhuǎn)換模型提供了新的探索思路。本文以中國海域及鄰區(qū)為研究區(qū),收集了最新的MS與MW地震記錄數(shù)據(jù)。從中提取年份、深度、MS等多個因子,進而訓練BP神經(jīng)網(wǎng)絡(luò)建立以MW為目標震級的震級轉(zhuǎn)換模型。同時,采用最小二乘回歸和正交回歸擬合了MS與MW的線性轉(zhuǎn)換關(guān)系以作為參考。通過分析誤差大小和殘差分布,對3種算法進行了系統(tǒng)的對比分析。本研究可以用于建立新的同時考慮多種因素的震級轉(zhuǎn)換模型,為編譯我國大陸或海域統(tǒng)一震級標度的地震目錄提供參考。
謝卓娟等(2020)新編錄了中國海域及鄰區(qū)的地震目錄,時間跨度從公元前1767年至2018年10月。該目錄匯集了中國大陸、中國臺灣以及日本、韓國、菲律賓等國家和地區(qū)的地震數(shù)據(jù),是目前數(shù)據(jù)收集最為完整的中國海域及鄰區(qū)的地震目錄。由于編制海域地震區(qū)劃圖時需要考慮遠場大震的影響,因此該目錄的數(shù)據(jù)收集范圍不僅包含渤海、黃海、東海和南海等主要海域,還囊括了中國大陸沿海的地震區(qū)帶(圖1 中紅色虛線框)。
由于謝卓娟等(2020)的地震目錄的截止日期為2018年10月,且近年來有大量新增的矩震級記錄可供收集(Di Giacomo et al,2021)。因此,本文在上述地震目錄的基礎(chǔ)上,進一步收集中國地震臺網(wǎng)(1)https://data.earthquake.cn/和國際地震中心(2)http://www.isc.ac.uk/iscbulletin/的地震數(shù)據(jù),數(shù)據(jù)收集時間范圍為公元前1767—2020年9月(圖1)。國際地震中心的地震目錄收錄了全球主要國家的多種震級標度的儀器地震記錄,其中包含全球矩心矩張量(Global Earthquake Moment Tensors project,GCMT)的矩震級記錄。GCMT的矩震級記錄是目前國際上最權(quán)威、數(shù)據(jù)量最大的矩震級數(shù)據(jù)來源(Di Giacomo et al,2021),并且與中國地震臺網(wǎng)中心測定的矩震級基本一致(陳宏峰等,2014)。因此,本文選擇GCMT的矩震級作為震級轉(zhuǎn)換的目標震級,下文的矩震級特指GCMT的矩震級。
從收集的地震數(shù)據(jù)中共提取到中國地震臺網(wǎng)的面波震級和GCMT的矩震級同時存在的地震記錄1480條。地震記錄的時間跨度自1988年1月至2020年9月,地震數(shù)呈逐年遞增趨勢。面波震級的分布范圍從MS4.0~7.9,矩震級的分布范圍為MW4.6~7.7。以0.5個震級單位將矩震級分檔,不同震級檔對應的地震數(shù)如下:MW4.6~4.9地震292個、MW5.0~5.4地震751個、MW5.5~5.9地震304個、MW6.0~6.4地震105個、MW6.5~6.9地震18個、MW7.0~7.4地震9個、MW7.5~7.7地震1個。地震數(shù)據(jù)主要分布于琉球海溝俯沖帶、中國臺灣地區(qū)以及馬尼拉海溝俯沖帶,僅有10條數(shù)據(jù)位于中國大陸沿海或近海地區(qū)。
區(qū)別于MS到MW的線性關(guān)系模型,BP神經(jīng)網(wǎng)絡(luò)可以同時輸入多個影響因子。因此,首先對地震目錄做預分析以確定影響因子。借鑒前人的研究(Cheng et al,2017;林彬華等,2019),同時考慮到海域地震分布區(qū)域廣、深度范圍大等特征,確定了年份、深度、經(jīng)度、緯度、面波震級等5個影響因子。通過觀察矩震級和面波震級的震級差(MW-MS)隨這5種影響因子的變化(圖2),可以定性地認識這些影響因子的作用。
圖2 不同影響因子與矩震級和面波震級震級差(MW-MS)關(guān)系圖
圖2顯示,隨著年份增大,震級差未呈現(xiàn)明顯的分布規(guī)律,僅在少數(shù)年份時分布范圍有所收縮(如2012年),這說明該因素對震級差的影響較小。隨著經(jīng)度和緯度變化,震級差呈現(xiàn)較為復雜的分布趨勢,經(jīng)緯度對震級差的影響總體上比年份顯著。隨著深度增大,震級差總體上由負值過渡到正值,這說明深度因子的影響十分明顯并具有一定的規(guī)律性。面波震級對震級差的影響最為直觀和顯著。當面波震級由MS4.0增加到MS6.5時,震級差由正值過渡到負值,樣本點的中心線呈近似線狀分布。當面波震級大于MS6.5時,震級差的絕對值不再線性增大,MS7.5以上的2個數(shù)據(jù)點的震級差甚至出現(xiàn)顯著減小,這提示傳統(tǒng)的二元線性模型很難兼顧震級差在大、小地震之間的變化趨勢。以上分析說明5個因子均對面波震級與矩震級之間的對應關(guān)系有一定影響,但影響的顯著程度和方式存在差異。將上述有影響的因子同時納入考慮,有利于提高震級轉(zhuǎn)換模型的精度。
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)是模擬和抽象人類大腦神經(jīng)的思維活動的一種機器學習算法,其通過大量簡單神經(jīng)元廣泛鏈接而形成復雜的神經(jīng)網(wǎng)絡(luò)(Kros et al,2006)。ANN具有非線性映射、自學習、自適應以及強泛化等優(yōu)點,可以處理并存儲不精確的和模糊的數(shù)據(jù),近年來已在地震滑坡預測(Tian et al,2019)、地震波震相識別(孫印等,2018;王鈺清等,2019;張彭達等,2020)、地震震源破裂面參數(shù)估算(Asim et al,2019)等地震學相關(guān)領(lǐng)域取得成熟的應用成果。
本文采用的BP神經(jīng)網(wǎng)絡(luò)為誤差反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò),是一種經(jīng)典的人工神經(jīng)網(wǎng)絡(luò),被廣泛應用于地震預測、地震震級修正等(蔣淳等,1994;王煒等,2000;項月文等,2015;蔡潤等,2018;林彬華等,2019;袁愛璟等,2021)。BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)一般由輸入層、輸出層和若干隱含層組成(圖3)。對于本研究,基于前文對地震數(shù)據(jù)預分析的結(jié)果,輸入層中包含年份、深度、經(jīng)度、緯度、面波震級共5個影響因子,輸出層中僅包含1個神經(jīng)元,對應模型估算的矩震級值,隱含層的層數(shù)和每層包含的神經(jīng)元個數(shù)則需要通過對比不同參數(shù)設(shè)置下模型的表現(xiàn)來確定。經(jīng)過反復調(diào)試,發(fā)現(xiàn)當隱含層擁有2層神經(jīng)網(wǎng)絡(luò)、每層分別包含3個和4個神經(jīng)元時(圖3),模型的表現(xiàn)達到最優(yōu)。隱含層中各個神經(jīng)元均有相應的權(quán)值,權(quán)值的優(yōu)化通過輸入數(shù)據(jù)對模型進行訓練來實現(xiàn)。
圖3 本研究采用的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
每當選定一種BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),即可以對模型進行訓練:首先從收集到的數(shù)據(jù)中選取部分數(shù)據(jù)作為訓練樣本,每個訓練樣本均包含年份、深度、經(jīng)度、緯度、面波震級共5個影響因子和實際記錄的矩震級值。BP神經(jīng)網(wǎng)絡(luò)的訓練過程包含2個傳播過程,分別為信號的正向傳播和誤差的反向傳播(蔡潤等,2018)。信號的正向傳播是將訓練樣本中的5個影響因子輸入到輸入層(圖3),然后經(jīng)過隱含層的逐層處理并最終到達輸出層。將輸出層中得到的矩震級估計值與實際記錄的矩震級值進行對比,即得到擬合誤差。將誤差逆向輸入隱含層并修正隱含層中神經(jīng)元權(quán)值的過程即誤差的反向傳播過程。信號的正向傳播和誤差的反向傳播可以通過更新訓練樣本循環(huán)往復進行,直到得到理想的誤差最小值。在此過程中,隱含層的神經(jīng)元權(quán)值被不斷優(yōu)化,最終使模型達到逼近輸入和輸出之間的非線性映射的目的(馮利華,2000)。
模型訓練好后,需要進一步評估該參數(shù)設(shè)置下模型的表現(xiàn)。將收集的數(shù)據(jù)中未被劃入訓練樣本的數(shù)據(jù)作為測試樣本,每個測試樣本中同樣包含上述5個影響因子和實際記錄的矩震級值。將測試樣本的5個影響因子輸入訓練好的模型,直接計算出矩震級的估算值,將估算值與實際值進行對比即可評價模型的表現(xiàn)。上述過程為信號的一次性正向傳播過程,不再涉及誤差的反向傳播和神經(jīng)元權(quán)重的更新。
為了保證對模型結(jié)果評價的合理性,本文采用了機器學習領(lǐng)域常用的多重交叉驗證的方法(Asim et al,2019)。以本文采用的10重交叉驗證為例,將1480個樣本隨機劃分為10等份,每次以其中9份作為訓練樣本建立模型,以剩余的1份作為測試樣本檢測模型的預測效果,從而保證每次訓練樣本和測試樣本之間互不重疊,最終評價結(jié)果取10次測試的均值。
為客觀評價BP神經(jīng)網(wǎng)絡(luò)的震級轉(zhuǎn)換表現(xiàn),本文借鑒前人的做法,采用最小二乘回歸和正交回歸擬合了MS到MW的線性轉(zhuǎn)換公式,以此作為參考。前人已詳細介紹了最小二乘回歸和正交回歸的原理(Cheng et al,2017;沙海軍等,2018;Xie et al,2021),本文不再贅述。二者的擬合結(jié)果如下
最小二乘回歸
MW=2.089+0.620×MS
(1)
正交回歸
MW=1.853+0.666×MS
(2)
圖4展示了BP神經(jīng)網(wǎng)絡(luò)、最小二乘回歸和正交回歸3種算法的轉(zhuǎn)換結(jié)果。最小二乘回歸和正交回歸擬合的直線較為接近。在MS5.0~6.5區(qū)間,二者近似位于數(shù)據(jù)點中線;在該區(qū)間以外,二者均逐漸偏離數(shù)據(jù)點中線,尤其是在MS6.5以上的大震端,二者均明顯低估。由于正交回歸的斜率略大,因此其在大震端的表現(xiàn)要優(yōu)于最小二乘回歸,這與前人的研究一致(Castellaro et al,2006)。BP神經(jīng)網(wǎng)絡(luò)的轉(zhuǎn)換結(jié)果總體上隨著真實記錄的數(shù)據(jù)點的變化而變化,在大震端的分布明顯優(yōu)于最小二乘回歸和正交回歸。
圖4 不同算法的震級轉(zhuǎn)換結(jié)果圖
采用平均絕對誤差(Mean absolute error,MAE)和均方根誤差(Root mean squared error,RMSE)對3種算法的表現(xiàn)作進一步定量評估。MAE和RMSE的定義分別如下
(3)
(4)
式中,MW,預測i為矩震級的預測值,MW,實際i為矩震級的實際記錄值,n為樣本量。表1 顯示,最小二乘回歸的MAE和RMSE略小于正交回歸,但比BP神經(jīng)網(wǎng)絡(luò)的相應值高40%左右。因此,BP神經(jīng)網(wǎng)絡(luò)在MAE和RMSE上的表現(xiàn)明顯優(yōu)于最小二乘回歸和正交回歸。
表1 不同算法震級轉(zhuǎn)換結(jié)果的誤差對比(均采用10重交叉驗證)
進一步分析3種算法的殘差絕對值(|MW,實際-MW,預測|)的頻度分布(表2 和圖5)。在1480個樣本中,BP神經(jīng)網(wǎng)絡(luò)的殘差絕對值有一半以上在0~0.1之間,有2個樣本位于0.5~0.6之間,沒有樣本落入更大的殘差絕對值范圍。最小二乘回歸和正交回歸的殘差絕對值更多地位于較大的區(qū)間,分布更離散,同時最大值達到0.9或1.0。因此,3種算法中BP神經(jīng)網(wǎng)絡(luò)的殘差絕對值更小,分布更集中。
表2 不同算法震級轉(zhuǎn)換結(jié)果的殘差絕對值頻度分布
圖5 不同算法震級轉(zhuǎn)換結(jié)果的殘差絕對值頻度分布
最終觀察3種算法下不同震級檔的MW實際值對應的殘差絕對值的均值分布(表3)。在所有震級檔內(nèi),BP神經(jīng)網(wǎng)絡(luò)的殘差絕對值的均值都更小,并且這種優(yōu)勢在MW6.5以上時更為顯著。當震級MW≥7.0時,BP神經(jīng)網(wǎng)絡(luò)的殘差絕對值的均值分別比正交回歸法和最小二乘回歸法小0.2和0.3左右。
表3 不同震級檔的MW實際值對應的殘差絕對值的均值分布
綜合前文所述,本文主要結(jié)論如下:
(1)在謝卓娟等(2020)編譯的中國海域及鄰區(qū)的地震目錄的基礎(chǔ)上,進一步收集數(shù)據(jù),共獲得中國地震臺網(wǎng)的面波震級和GCMT的矩震級同時存在的地震記錄1480條。
(2)從收集的數(shù)據(jù)中提取年份、深度、經(jīng)度、緯度、面波震級共5個影響因子,以實際的矩震級記錄值為標記,訓練BP神經(jīng)網(wǎng)絡(luò)建立了以GCMT的矩震級為目標震級的轉(zhuǎn)換模型。
(3)通過將BP神經(jīng)網(wǎng)絡(luò)與最小二乘回歸和正交回歸的線性模型進行對比發(fā)現(xiàn),BP神經(jīng)網(wǎng)絡(luò)的轉(zhuǎn)換結(jié)果的總體分布趨勢更接近真實地震記錄。在不同震級檔下BP神經(jīng)網(wǎng)絡(luò)的殘差絕對值的均值都更小,當震級為6.5以上時優(yōu)勢增大。
(4)最小二乘回歸和正交回歸的轉(zhuǎn)換結(jié)果較接近,在大震端,正交回歸的結(jié)果稍優(yōu)于最小二乘回歸。當震級≥6.5時,二者均出現(xiàn)較明顯的低估。
(5)相比于最小二乘回歸和正交回歸的線性模型,BP神經(jīng)網(wǎng)絡(luò)的平均絕對誤差和均方根誤差更小,且殘差絕對值更集中地分布于小值范圍。
(6)BP神經(jīng)網(wǎng)絡(luò)在震級轉(zhuǎn)換上顯示出良好的應用前景,有望為編制我國統(tǒng)一震級標度的地震目錄提供參考。