劉方斌 曲均浩 張志慧
(山東省地震局 山東 濟(jì)南 250102)
在實(shí)際地震監(jiān)測(cè)和分析中,分析人員根據(jù)實(shí)際積累的經(jīng)驗(yàn)和資料,從波形的整體特征定性判斷,能夠識(shí)別天然地震和礦震。然而有些波形信號(hào)僅靠定性判斷很難加以識(shí)別,且主觀因素較大,山東地區(qū)曾經(jīng)發(fā)生過幾次天然地震與礦震識(shí)別困難的有感事件,一度引起省、市兩級(jí)政府的高度重視,因而找出一種切實(shí)可行的識(shí)別天然地震和礦震的定量方法顯得尤為重要。
目前,國內(nèi)外在天然與非天然地震識(shí)別方面進(jìn)行了廣泛研究,并提出了多種識(shí)別方法。如:P波初動(dòng)[1]、震源深度、體波震級(jí)和面波震級(jí)之比[2]、P波初動(dòng)振幅與P波最大振幅比、P波與S波譜振幅比[3]、P波譜振幅與勒夫波譜振幅比[4]、最大振幅與尾波持續(xù)時(shí)間比[5]等。另外,小波算法、人工神經(jīng)網(wǎng)絡(luò)、遺傳算法等方法也被用于對(duì)天然與非天然地震的識(shí)別研究中[6-7]。
近年來,利用BP神經(jīng)網(wǎng)絡(luò)對(duì)地震事件進(jìn)行分類識(shí)別已有很多科研成果,例如邊銀菊等[7]對(duì)北京及周邊地區(qū)的73次地震和9次爆破事件的P波和S波的頻譜進(jìn)行計(jì)算,并在0.1~10 Hz頻率范圍內(nèi)采用對(duì)數(shù)采樣的方式分別得到P波和S波的對(duì)數(shù)譜振幅值,然后將獲得的對(duì)數(shù)譜振幅值標(biāo)準(zhǔn)化后再進(jìn)行網(wǎng)絡(luò)識(shí)別;張帆等[8]通過提取地震事件的時(shí)空參數(shù)和小波能量比,對(duì)內(nèi)蒙古阿拉善地區(qū)的天然地震和爆破事件進(jìn)行自動(dòng)識(shí)別;曲均浩等[9]采用Morlet小波的時(shí)頻分布方法來確定地震波信號(hào)主周期窗長,并以此為輸入元進(jìn)行網(wǎng)絡(luò)識(shí)別。盡管上述方法識(shí)別效果良好,但是提取特征值時(shí)相對(duì)繁瑣,并且耗時(shí)耗力,無法在地震速報(bào)規(guī)定內(nèi)(10分鐘以內(nèi))完成地震事件的識(shí)別及報(bào)送。因此,有必要選擇其他典型的特征值來快速高效地識(shí)別地震事件。
本文基于BP神經(jīng)網(wǎng)絡(luò)方法,對(duì)山東臺(tái)網(wǎng)記錄的天然與非天然地震進(jìn)行深度學(xué)習(xí),抓住二者典型的量化特征(P波初動(dòng)方向、P波初動(dòng)振幅與S波最大振幅比以及P波最大振幅與S波最大振幅比),快速開展天然與非天然地震事件的識(shí)別研究,為區(qū)域天然和非天然地震模式識(shí)別提供了新的理論依據(jù)。
BP神經(jīng)網(wǎng)絡(luò),又稱反向傳播網(wǎng)絡(luò),是目前應(yīng)用最為流行的人工神經(jīng)網(wǎng)絡(luò)模型之一[9]。該網(wǎng)絡(luò)主要由輸入層、隱含層和輸出層組成,結(jié)構(gòu)如圖1所示。其核心主要分為前期的網(wǎng)絡(luò)學(xué)習(xí)和后期的預(yù)測(cè)過程兩個(gè)階段,前者是通過對(duì)訓(xùn)練樣本的持續(xù)學(xué)習(xí),不斷調(diào)整網(wǎng)絡(luò)節(jié)點(diǎn)和閾值,使得輸出的誤差值達(dá)到最小;后者則是將訓(xùn)練好的預(yù)測(cè)結(jié)果輸出,然后通過擬對(duì)預(yù)測(cè)結(jié)果和期望輸出進(jìn)行擬合分析,根據(jù)相關(guān)系數(shù)判斷網(wǎng)絡(luò)性能的好壞,從而達(dá)到預(yù)期效果。
圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
第一階段的學(xué)習(xí)過程主要分為信息正向傳播和誤差的反向傳播兩方面。當(dāng)信息正向傳播時(shí),信息從輸入層經(jīng)隱含層逐層進(jìn)行計(jì)算,并將處理結(jié)果傳向輸出層,然后由輸出層向外界輸出。當(dāng)實(shí)際結(jié)果與期望值不符時(shí),則將誤差信號(hào)值沿原路進(jìn)行反向傳播,并逐一改變網(wǎng)絡(luò)權(quán)值和閾值,直至達(dá)到預(yù)期結(jié)果。
BP網(wǎng)絡(luò)的學(xué)習(xí)過程的學(xué)習(xí)算法屬于δ算法,它是一種監(jiān)督訓(xùn)練多層網(wǎng)絡(luò)的算法。主要是通過不斷的學(xué)習(xí),使輸出結(jié)果的誤差平方和達(dá)到最小值。具體如下:
假設(shè)輸入向量為X,輸出向量為Y,中間含有一層隱含層,相鄰兩層之間以Sigmoid函數(shù)作為傳遞函數(shù)進(jìn)行計(jì)算,即:
(1)
(2)
式中:O為輸入層經(jīng)過權(quán)值ωij和閾值a到隱含層所輸出的值,S則為隱含層經(jīng)過權(quán)值ωjp和閾值b所計(jì)算的輸出預(yù)測(cè)值。然后根據(jù)網(wǎng)絡(luò)預(yù)測(cè)輸出S和期望輸出Y,計(jì)算網(wǎng)絡(luò)預(yù)測(cè)誤差e,即:
ep=Yp-Sp
(3)
最后對(duì)網(wǎng)絡(luò)權(quán)重與神經(jīng)元偏置調(diào)整,即:
(4)
ωjp=ωjp+ηOjep
(5)
(6)
bp=bp+ep
(7)
式中:η為學(xué)習(xí)速率。
當(dāng)學(xué)習(xí)完成以后,需要對(duì)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果進(jìn)行檢驗(yàn),即將學(xué)習(xí)訓(xùn)練好的結(jié)果以非線性函數(shù)的方式輸出,并通過預(yù)測(cè)輸出和期望輸出分析其擬合能力,從而判斷網(wǎng)絡(luò)性能的好壞。為了獲得較好的網(wǎng)絡(luò)性能,首先學(xué)習(xí)樣本必須達(dá)到一定的數(shù)據(jù)量,并且所選取的數(shù)據(jù)具有一定的代表性,其次是測(cè)試樣本要與學(xué)習(xí)樣本不同[10]。
天然和非天然地震(爆破、塌陷)事件發(fā)生時(shí)均會(huì)釋放出大量的能量,其中絕大部分能量以彈性波形式從震源區(qū)向外射出,并以數(shù)字地震波的形式被地震儀記到[11]。但由于其震源物理機(jī)制不同,相應(yīng)產(chǎn)生的地震波亦有不同特征(圖2),這種特征是區(qū)分天然地震、爆破及塌陷的最直接方法。前人研究表明,P波初動(dòng)方向、振幅比是識(shí)別天然與非天然地震的2個(gè)最主要判據(jù)[1]。根據(jù)先前地震目錄統(tǒng)計(jì)發(fā)現(xiàn),山東地區(qū)的各類地震事件主要集中在某特定區(qū)域,如天然地震集中在斷裂附近(乳山、墾利、長島、黃海等地),非天然地震主要發(fā)生在省內(nèi)的各大礦區(qū)內(nèi)(如鄒城、曲阜、泰安、嶧城等地),并且同一地區(qū)的相近震級(jí)的地震波形幾乎一致。因此,本文選取山東地區(qū)近幾年的地震事件的波形記錄,為了保證檢測(cè)結(jié)果的可靠性,隨機(jī)選擇不同區(qū)域不同震級(jí)大小的地震事件100個(gè)作為研究對(duì)象,其中選擇30個(gè)天然地震、20個(gè)爆破事件和20個(gè)塌陷事件作為訓(xùn)練樣本,剩下每類10個(gè)作為測(cè)試樣本。上述樣本長度足以涵蓋所有震區(qū)的不同級(jí)別的地震事件,具有一定的樣品代表性,滿足實(shí)驗(yàn)需求。
圖2 不同地震事件波形圖
由于山東地區(qū)地震監(jiān)測(cè)臺(tái)網(wǎng)密度相對(duì)較大,其中固定的測(cè)震臺(tái)站128個(gè),強(qiáng)震臺(tái)站146個(gè),科學(xué)臺(tái)陣96個(gè),因此某一地震事件往往可以被多個(gè)臺(tái)站所記錄到。實(shí)驗(yàn)過程中,為保證一定的信噪比,在選擇的地震事件中擇取記錄清晰、信噪比高的臺(tái)站(即選擇地震波與地脈動(dòng)易于人工辨別的臺(tái)站波形,如圖2),從而用于提取P波初動(dòng)方向、P波初動(dòng)振幅(Pc)、最大振幅(Pm)以及S波最大振幅(Sm)等特征值,各類參數(shù)值如圖3所示。由于爆破事件屬于膨脹源,P波初動(dòng)以向上為主,因此比例幾乎均在100%;天然地震在地震臺(tái)站屬于四象限分布,P波初動(dòng)既有向上的也有向下的方向;而塌陷事件屬于壓縮源,P波初動(dòng)主要以向下為主(圖3(a))。圖3(b)是P波初動(dòng)振幅(Pc)與S波最大振幅(Sm)之比,我們發(fā)現(xiàn)人工爆破與塌陷地震的Pc/Sm大致以0.4為臨界值,大于0.4的為爆破,小于0.4的為塌陷,而天然地震則分布閾相對(duì)寬闊。另外,P波最大振幅(Pm)以及S波最大振幅(Sm)比圖中(圖3(c)),爆破和塌陷地震均位于0.5~1.0之間,而天然地震同樣分散分布其中。綜上,選擇P波初動(dòng)方向、振幅比作為特征值來識(shí)別天然與非天然地震是可取的。
注:叉號(hào)為地震,圓點(diǎn)為爆破,菱形為塌陷圖3 P波初動(dòng)百分比、P波初動(dòng)振幅、最大 振幅與S波最大振幅比
模型的構(gòu)建主要包括確定BP網(wǎng)絡(luò)模型的層數(shù)、各層的神經(jīng)元個(gè)數(shù),選取激活函數(shù)、初始權(quán)值、學(xué)習(xí)速率等方面。對(duì)于BP神經(jīng)網(wǎng)絡(luò)模型,輸入層選擇P波初動(dòng)值(1表示向上,0表示向下)、Pc/Sm、Pm/Sm作為神經(jīng)元,輸出層的神經(jīng)元為天然地震(1,0,0)、爆破(0,1,0)和塌陷(0,0,1),隱含層則根據(jù)訓(xùn)練情況選擇單層10個(gè)神經(jīng)元。對(duì)上述70個(gè)地震事件共計(jì)255條數(shù)據(jù)進(jìn)行學(xué)習(xí)、反復(fù)訓(xùn)練,最后得到所需的各權(quán)值和權(quán)重動(dòng)量(本文選擇0.8)。學(xué)習(xí)速率影響系統(tǒng)學(xué)習(xí)過程的穩(wěn)定性。過大的學(xué)習(xí)速率可能使網(wǎng)絡(luò)權(quán)值的修正量過大,導(dǎo)致系統(tǒng)不穩(wěn)定;過小的學(xué)習(xí)速率會(huì)導(dǎo)致訓(xùn)練時(shí)間過長,收斂速度較慢。因此,一般傾向于選取較小的學(xué)習(xí)速率以保證學(xué)習(xí)過程的收斂性及系統(tǒng)的穩(wěn)定性,通常學(xué)習(xí)速率的選取范圍為0.01~0.8,本文選擇0.15。選用的傳遞函數(shù)為Sigmoid函數(shù)。
將70個(gè)訓(xùn)練樣本代入建立好的神經(jīng)網(wǎng)絡(luò)模型中對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,直至輸出誤差滿足收斂準(zhǔn)則。然后將30個(gè)預(yù)測(cè)樣本代入訓(xùn)練好的網(wǎng)絡(luò)中,經(jīng)過多次迭代,目標(biāo)誤差達(dá)到最小。表1列出了各測(cè)試樣本的震級(jí)實(shí)際事件類型、BP網(wǎng)絡(luò)輸出結(jié)果及最終判定結(jié)果等相關(guān)信息。從表中可以發(fā)現(xiàn),參與測(cè)試的30個(gè)樣本中僅有21號(hào)樣本輸出結(jié)果錯(cuò)誤,其預(yù)測(cè)正確率達(dá)到96.67%,預(yù)測(cè)結(jié)果非常理想。究其錯(cuò)誤原因主要是由于該地震事件震級(jí)較小,記錄到的地震波形的臺(tái)站僅有1個(gè),且P波初動(dòng)的方向向下,另外該地區(qū)發(fā)生地震的次數(shù)相對(duì)較少,缺乏一定的訓(xùn)練樣本,無法對(duì)類似事件進(jìn)行反復(fù)學(xué)習(xí),使得預(yù)測(cè)結(jié)果出現(xiàn)偏差。
表1 BP神經(jīng)網(wǎng)絡(luò)檢驗(yàn)結(jié)果
續(xù)表1
本文采用BP神經(jīng)網(wǎng)絡(luò)方法對(duì)山東地區(qū)記錄到的天然與非天然地震事件進(jìn)行深度學(xué)習(xí),提取天然與非天然地震之間的特征值,開展天然與非天然地震事件的識(shí)別研究,得到了以下結(jié)論:
(1) 天然與非天然地震(爆破和塌陷)的震源性質(zhì)是不相同的。天然地震源是非對(duì)稱剪切源、爆破源是對(duì)稱膨脹源,而塌陷則是壓縮源。因此,根據(jù)其特性選擇P波初動(dòng)方向、振幅比等特征值來識(shí)別天然地震和非天然地震是可行的。
(2) 神經(jīng)網(wǎng)絡(luò)具有高度的非線性映射功能,使用BP神經(jīng)網(wǎng)絡(luò)對(duì)山東地區(qū)的天然地震與非天然地震進(jìn)行自動(dòng)識(shí)別,測(cè)試結(jié)果表明在本文構(gòu)建的神經(jīng)網(wǎng)絡(luò)模型合理,具有較高的識(shí)別率。
(3) 為減少預(yù)測(cè)結(jié)果的錯(cuò)誤性,訓(xùn)練過程中應(yīng)盡量選擇足夠多的訓(xùn)練樣本,并且選擇的樣本要具有代表性,從而提高系統(tǒng)的泛化能力和正確識(shí)別率。