亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多源數(shù)據(jù)的機器學習在地震預測中的研究進展

        2022-02-03 01:56:18朱俊清孫珂
        中國地震 2022年4期
        關(guān)鍵詞:震級機器神經(jīng)網(wǎng)絡

        朱俊清 孫珂

        中國地震局地震預測研究所,北京 100036

        0 引言

        地震是一種突發(fā)的、劇烈的地殼運動形式,是給人類社會帶來人員傷亡、經(jīng)濟損失最嚴重的自然災害之一。據(jù)相關(guān)數(shù)據(jù)統(tǒng)計,20世紀全球各地發(fā)生了多達1100多次破壞性地震,造成150多萬人死亡(Yariyan et al,2020)。我國是地震多發(fā)國家,地震具有頻度高、強度大、震源淺、分布廣的特點,地震災害給我國造成了嚴重的損失(夏朝旭等,2022)。

        為減少地震對人類社會的危害,20世紀90年代全世界地震研究者就地震能否預測展開討論。Geller等(1997)認為大量的物理條件決定著小地震能否演化成大地震,而不僅僅取決于斷層,地震破裂高度敏感的非線性影響地震的可預測性;此外,即使已經(jīng)發(fā)現(xiàn)了大量地震前兆,但沒有定量的物理機制把前兆和地震聯(lián)系起來,因此認為地震是不可預測的。Brehm等(1999)利用從斷裂力學和裂紋拓展中推導出來的中期地震預測的失效時間方法,來定位和預測未來主震的大小和時間。無論是持地震不可預測觀點或是持地震可預測觀點的學者,均認可在當時科學認知和科技發(fā)展受限條件下,暫時不能實現(xiàn)地震的準確預測。

        近年來,人工智能技術(shù)迅速發(fā)展,尤其是機器學習和深度學習在自然語言處理、計算機視覺、數(shù)據(jù)挖掘等具有多源海量復雜數(shù)據(jù)的領(lǐng)域取得蓬勃發(fā)展,在某些預測應用中獲得了比傳統(tǒng)方法明顯優(yōu)異的結(jié)果。很多地震工作者將基于數(shù)據(jù)特征和算法建模的人工智能方法運用到地震研究中,試圖發(fā)現(xiàn)復雜地震數(shù)據(jù)與地震發(fā)生之間的聯(lián)系,并嘗試預測地震。研究算法從基于規(guī)則發(fā)展到淺層機器學習和深度學習,研究數(shù)據(jù)也基本包含了各類地震數(shù)據(jù)。

        本文從機器學習背景、地震預測方法和評價指標等方面,回顧機器學習歷史發(fā)展過程以及機器學習在地震預測應用中的常用流程,比較各算法模型的性能評價指標;并將數(shù)據(jù)按學科分類,討論多源數(shù)據(jù)在基于機器學習的地震預測中的應用進展,在比較各算法表現(xiàn)的基礎(chǔ)上,對機器學習在地震預測中應用的趨勢發(fā)展進行總結(jié)和討論。

        1 研究背景

        1.1 機器學習背景介紹

        人工智能(Artificial Intelligence)是一門涉及計算機科學、邏輯學、信息學、哲學、生物學、心理學、語言學等多學科的交叉學科,在模式識別、機器學習、計算機視覺、自然語言處理、機器人學等應用領(lǐng)域獲取了前所未有的成果(崔雍浩等,2019)。機器學習是人工智能核心,涉及概率論、統(tǒng)計學、算法復雜度理論、逼近論、凸分析等多學科,通過計算機技術(shù)模擬人類學習過程,并實現(xiàn)機器的自動識別(袁愛璟等,2021)。機器學習包括監(jiān)督學習、無監(jiān)督學習和半監(jiān)督學習。監(jiān)督分類分為分類和回歸,現(xiàn)有的大多數(shù)地震預測算法均屬于監(jiān)督分類。無監(jiān)督分為聚類和降維,聚類包括層次聚類、神經(jīng)網(wǎng)絡聚類等;降維包括主成分分析、線性判別分析等。深度學習是機器學習的重要組成部分,自2012年深度卷積神經(jīng)網(wǎng)絡在ImageNet大賽上獲取了正確率超越第二名10%的優(yōu)越成績以來,深度學習進入高速發(fā)展時期。深度學習是一種基于深度神經(jīng)網(wǎng)絡算法模型技術(shù),網(wǎng)絡深度往往深達幾十層,甚至上百層,如VGG網(wǎng)絡有16層或者19層,GoogleNet有22層,ResNet具有從18層到152層等多個不同層數(shù)的具體模型,但是并不是層數(shù)越多性能越好,具體性能由數(shù)據(jù)、激活函數(shù)、模型參數(shù)等多個因素共同決定。人工智能技術(shù)自1943年誕生以來,發(fā)展歷經(jīng)坎坷,但總體上呈現(xiàn)上升趨勢,自2012年至今處于快速發(fā)展時期。圖1展示了自神經(jīng)元誕生以來人工智能技術(shù)的主要發(fā)展歷程。

        注:該圖據(jù)陳運泰(2009)、焦李成等(2016)、張榮等(2018)、包俊等(2020)、袁愛璟等(2021)研究中關(guān)于人工智能的歷史發(fā)展綜合繪制。

        1.2 機器學習地震預測

        機器學習地震預測方法涉及數(shù)據(jù)輸入、數(shù)據(jù)預處理、算法選擇、數(shù)據(jù)輸出和評價指標等5個部分(圖2)。數(shù)據(jù)輸入的類型主要以各類地震觀測數(shù)據(jù)為主,記錄震前長時序的某個參數(shù)的持續(xù)變化。不同數(shù)據(jù)的載荷不同,記錄的數(shù)據(jù)中會存在一定數(shù)量的無用值或空值,故需要對數(shù)據(jù)進行預處理,以滿足模型處理的格式要求;算法選擇面較廣,包括基于規(guī)則的算法以及淺層神經(jīng)網(wǎng)絡和深層神經(jīng)網(wǎng)絡等不同類型的算法;數(shù)據(jù)的輸出包括預測地震的發(fā)生時間、地點、震級和概率等,有些研究不會給出具體的輸出,而是給出通過已發(fā)生地震驗證的算法精確度;評價指標是評估算法模型好壞的關(guān)鍵,通過比較指標,對比不同模型的性能,從而選擇基于某種數(shù)據(jù)的最佳模型,以達到最優(yōu)預測(張榮等,2018)。

        圖2 機器學習地震預測流程(據(jù)Al Banna等(2020))

        1.3 機器學習評價體系

        建立良好的評價體系有利于評估機器學習地震預測的性能,有利于對比分析不同特征參數(shù)和不同模型算法的性能,從而有利于選擇最優(yōu)參數(shù)和模型。機器學習評價指標根據(jù)算法的不同,一般可以分為2種,一種為分類算法指標,另一種為回歸算法指標。

        1.3.1 分類算法評價指標

        傳統(tǒng)機器學習分類算法一般為二分類問題,即正例和反例,根據(jù)真實情況和預測結(jié)果的組合劃分為真正例TP(true positive)、假正例FP(false positive)、真反例TN(true negative)和假反例FN(false negative)。在地震預測應用中,正例代表有地震,反例代表無地震。分類結(jié)果混淆矩陣如表1所示。

        表1 分類結(jié)果混淆矩陣(據(jù)袁愛璟等(2021))

        一般而言,混淆矩陣中做出正確預測的TP和TN數(shù)量多、且做出錯誤預測的FN和FP數(shù)量少的情況下,認為預測結(jié)果較好。但是簡單的分類結(jié)果尚且不能完全表示模型的好壞,可以從混淆矩陣拓展出很多相關(guān)性的評價指標。表2為分類結(jié)果延伸出的8個評價指標。

        表2 分類算法評價指標(據(jù)Asencio-Cortés等(2017a)、袁愛璟等(2021))

        AUC(area under curve)是受試者工作特征曲線(ROC曲線)下面積,除了表2中的計算方法外,還可以通過計算面積得到。由于ROC曲線能有效評價預測模型的性能,因此被廣泛使用。一般而言,AUC值若為1,則為一個完美的分類器,AUC值為0.5則認為是隨機猜測,模型預測結(jié)果沒有具體價值,AUC值在0.5~1之間,越接近1,預測效果越好(袁愛璟等,2021)。另外,Asencio-Cortés等(2017a、2017b、2018)使用PPV、TPR、TNR和NPV的均值評價模型性能。

        1.3.2 回歸算法評價指標

        在震級預測應用中,常運用回歸算法將震級預測值和真實震級作回歸分析,比較誤差,回歸值和預測值越接近,算法的預測性能越好。表3給出一些常用的回歸算法評價指標。

        表3 回歸算法評價指標(據(jù)Asencio-Cortés等(2018)、Salam等(2021))

        2 多源數(shù)據(jù)在地震預測中的綜合應用

        2.1 地震學

        2.1.1 地震目錄數(shù)據(jù)

        地震目錄是按照時間順序?qū)Φ卣饏?shù)進行收錄和編目所形成的資料,是開展地震活動性研究的基礎(chǔ)數(shù)據(jù)(王想等,2017)。地震目錄通常包括發(fā)震時刻、震中位置、震源深度、震級等參數(shù),而地震活動性研究的重要內(nèi)容是分析這些參數(shù)在空間和時間維度上的分布特征(王想等,2016)。

        Aslam等(2021b)利用統(tǒng)計聚類熱點分析方法獲取巴基斯坦北部地區(qū)地震活動熱點區(qū)域(圖3),分析表明興都庫什地區(qū)和2005年克什米爾地震發(fā)生的主邊界逆沖斷層所定位的中部地區(qū)為主要地震發(fā)生率較高地區(qū),即地震活動熱點地區(qū);人工智能神經(jīng)網(wǎng)絡模型(ANN)僅使用震級信息作為訓練特征對上述地區(qū)進行研究,模型訓練精度達到74%,測試精度達69%,0.69雖然表現(xiàn)一般,但對于復雜的地區(qū)特征,仍是一個較不錯的結(jié)果。

        圖3 Anselin局部莫蘭指數(shù)聚類分析(a)和熱點分析(b)(據(jù)Aslam等(2021b))

        Jain等(2021)以目標地震震中為中心,根據(jù)不同半徑值分割整個數(shù)據(jù)集,不同半徑(100km、200km、500km、1000km、1500km、3000km和5000km)范圍內(nèi)地震的經(jīng)緯度信息和震源深度信息作為特征參數(shù),選用隨機森林回歸(RF)、多層感知器回歸(MLP)和支持向量回歸(SVR)對震級信息進行回歸分析,獲取均方根誤差,在所有半徑范圍內(nèi)MLP回歸算法的RMSE值均最小,回歸預測的震級和實際震級的誤差最小。

        人工智能神經(jīng)網(wǎng)絡在其他領(lǐng)域時間序列的預測上已取得廣泛應用。Kaftan等(2017)為了驗證不同神經(jīng)網(wǎng)絡在地震時間序列應用的性能,獲取1975—2009年土耳其西部某地區(qū)震級大于等于3.0級地震,整理得到每月的地震頻率,使用多個不同頻率數(shù)輸入多層感知器神經(jīng)網(wǎng)絡(MLPNN)、徑向基函數(shù)神經(jīng)網(wǎng)絡(RBFNN)和自適應神經(jīng)網(wǎng)絡模糊推理系統(tǒng)(ANFIS),測試結(jié)果表明,RBFNN的RMSE值低于MLPNN和ANFIS的結(jié)果,在時間序列數(shù)據(jù)表現(xiàn)較好。Wang等(2020)在時間序列基礎(chǔ)上加入空間信息,利用LSTM網(wǎng)絡發(fā)現(xiàn)地震之間存在的時空相關(guān)性,將中國研究區(qū)分為9個區(qū)域,使用1966—2016年相鄰地區(qū)地震數(shù)據(jù),設(shè)置時間間隔為一個月,輸入為某一子區(qū)域在該時間間隔內(nèi)發(fā)生地震的次數(shù),總的數(shù)據(jù)為一個600×9矩陣,總的預測精度為74.81%,在擁有多條斷裂的某些子區(qū)域內(nèi)組合的預測準確率可達88.57%。

        2.1.2 地震活動性參數(shù)

        Panakkat等(2007)和Adeli等(2009)根據(jù)古登堡-里希特逆冪律和地震震級特征分布,獲得8個具有一定數(shù)學原理的地震活動性特征參數(shù)(表4),利用神經(jīng)網(wǎng)絡預測地震震級,在當時地震預測性能高度不確定的情況下,取得了較好的效果。

        表4 地震活動性參數(shù)(據(jù)Asencio-Cortés等(2017b)、吳晶晶等(2019))

        Asencio-Cortés等(2017a、2017b、2018)在這些地震活動性參數(shù)基礎(chǔ)上進行改進,增加了其他特征參數(shù),包括計算了一定地震間隔的b值增值、使用概率密度函數(shù)記錄震級大于等于目標震級的概率和記錄最近一周的最大震級等。Asencio-Cortés等(2017a)在對某些特定位置且空間分辨率較小的震例分析時,對東京200km范圍內(nèi)中大地震震級進行預測,ANN神經(jīng)網(wǎng)絡各評價指標均值均大于70%,結(jié)果優(yōu)于其他測試算法。大數(shù)據(jù)技術(shù)的強大計算能力能夠挖掘隱藏在雜亂數(shù)據(jù)中的有效信息,Asencio-Cortés等(2017b)在大數(shù)據(jù)技術(shù)加持下,基于云的大數(shù)據(jù)計算預測加利福尼亞地區(qū)未來7天內(nèi)地震震級,首先使用4種算法單獨訓練,發(fā)現(xiàn)隨機森林(RF)表現(xiàn)最好,其次將RF算法和其他3種算法進行集成學習,利用集成后的算法重新訓練。不同算法集成在不同震級范圍的平均絕對誤差各不相同,不存在某種表現(xiàn)均優(yōu)異的算法,但總體上相對誤差接近10%,絕對誤差接近0.5。

        Asim等(2017b、2018)在對興都庫什地區(qū)震級大于等于5.5級地震進行預測時,使用8個地震活動性參數(shù),驗證了地震發(fā)生雖然是絕對非線性的,類似于隨機事件,但可以根據(jù)發(fā)震區(qū)地球物理情況和極其復雜的機器學習模型對地震事件進行建模學習。此外,Asim等(2017a)對巴基斯坦北部地區(qū)地震進行研究時,根據(jù)信息增益情況剔除8個指標中的震級虧損和均方誤差,選擇其余6個指標作為神經(jīng)網(wǎng)絡的訓練特征,在對預測模型進行McNemar’s統(tǒng)計測試后,比較各算法的顯著性,前饋神經(jīng)網(wǎng)絡(Feed-Forward Neural Network)顯著性為0.005且準確性為0.70,因此FFNN模型更適合巴基斯坦北部地區(qū)的地震預測。短臨地震預報是減少人員傷亡和財產(chǎn)損失的關(guān)鍵所在,Asim等(2018)為了提高15天內(nèi)對5.0級地震預測的準確性,將基于基因規(guī)劃的GP算法和AdaBoost算法的集成算法與標準地震活動性參數(shù)相結(jié)合,并在興都庫什、智利和南加州地區(qū)進行實驗,3個地區(qū)的地震預測精確度分別是78.7%、84.5%和86.6%,均取得比前人研究更好的結(jié)果。Asim等(2020)在分析塞浦路斯低級別地震時,更是創(chuàng)新性地選用總復發(fā)時間等多達60個地震特征預測未來5天、7天、10天和15天內(nèi)發(fā)生地震震級,在震級閾值相同的情況下,較長時間閾值預測值MCC較好,隨著震級閾值的增加,預測值MCC也隨著降低。

        除上述研究外,其他學者也基于地震活動性參數(shù)從算法創(chuàng)新和結(jié)合其他指標進行地震預測研究,其他地震指標作為地震活動性參數(shù)的補充,在一定程度上填補了地震活動性參數(shù)未能涉及到的物理機制,算法的優(yōu)化和其他領(lǐng)域算法的跨領(lǐng)域應用對提升地震預測訓練能力和測試精度上有很大幫助。吳晶晶等(2019)利用反向選擇算法生成檢測器,減少了對數(shù)據(jù)量較少的大地震的依賴性,對四川省歷史地震進行訓練,對其一個月內(nèi)發(fā)生5.0級地震進行預測,結(jié)果明顯好于神經(jīng)網(wǎng)絡和支持向量機;周天祥等(2019)和Zhou等(2020)將主要運用于計算機安全領(lǐng)域的樹突狀細胞算法DCA(Dendritic Cell Algorithm)應用到地震預測,在大多數(shù)數(shù)據(jù)集上的表現(xiàn)均優(yōu)于其他算法;張研等(2020)將RVM(Relevance Vector Machine)預測算法與BP神經(jīng)網(wǎng)絡及SOM-BP神經(jīng)網(wǎng)絡算法進行比較,結(jié)果表明RVM算法優(yōu)于其他2種算法;Salam等(2021)提出了2個混合機器學習地震預測模型,第一個為花授粉算法FPA(Flower pollination algorithm)和極限學習機ELM(Extreme learning machine)的混合模型FPA-ELM,第二個為FPA和最小二乘支持向量機LS-SVM的混合模型FPA-LS-SVM,混合了FPA算法的ELM和LS-SVM算法的精度均有所提高,在90%訓練集和10%測試集的情況下,混合后ELM模型的RMSE為0.529,優(yōu)于LS-SVM模型的0.537。Majhi等(2020)采用功能鏈接神經(jīng)網(wǎng)絡(Function Link Artificial Neural Network)對地震非線性數(shù)據(jù)建模,并結(jié)合最小二乘回歸、飛蛾火焰優(yōu)化算法(Moth-flame optimalization algorithm)、自適應梯度下降和LM反向傳播算法,比較預測回歸模型的均方根誤差,在諸多結(jié)合方案中,基于FLANN的MFO算法的均方根誤差最小(0.0565),預測效果較好。Rahmat等(2020)僅使用地震b值作為地震前兆指標,在極限學習機和深度學習方法中進行b值預測,2種方法在不同訓練集下的平均成功率均達到85%,但深度學習表現(xiàn)相比極限學習機有1.61%的性能優(yōu)勢。Yousefzadeh等(2021)認為前人的地震預測研究更多側(cè)重于時間參數(shù),而不是空間參數(shù),并且特征分析過程中會剔除一些相關(guān)性較強的變量,所以在地震活動性參數(shù)基礎(chǔ)上,使用核密度估計和雙變量莫蘭指數(shù)計算的新參數(shù)斷層密度進行地震預測研究,在傳統(tǒng)機器學習和深度學習算法中,新參數(shù)均有效提高預測的準確性,后續(xù)會在更多深度神經(jīng)框架中評估新參數(shù)對預測性能的影響。

        2.2 大地測量學

        Karimzadeh等(2019)將不同的機器學習算法(樸素貝葉斯、K近鄰、支持向量機、隨機森林)和滑動分布、相鄰活動斷層方向、庫倫應力變化相結(jié)合,研究伊朗克曼沙7.3級地震后震級大于2.5的余震,利用70%的余震,基于二進制的方法預測所有余震的空間位置。研究區(qū)域滑動分布信息來源于InSAR技術(shù),SAR數(shù)據(jù)在低噪聲水平下識別和獲??;庫侖應力變化可根據(jù)滑動分布模型和摩擦系數(shù)以及斯肯普頓系數(shù)定義;實驗區(qū)內(nèi)共有HZF、MMF-1、MMF-2和MMF-3四條斷層,實驗區(qū)信息如圖4所示。研究區(qū)域余震限制在100km×80km范圍內(nèi),并且將地理坐標轉(zhuǎn)換為二元網(wǎng)格地圖,點的緩沖區(qū)約為1.5km,發(fā)生余震標記為1,非余震標記為0。由于變量較多,繪制基于不同斷層和算法的ROC曲線有利于直觀比較,實驗結(jié)果表明,除K近鄰算法外,其他算法在添加斷層信息后能有效提高AUC值,RF算法對斷層敏感。總的來說,KNN和RF算法表現(xiàn)要優(yōu)于NB算法。

        注:(a)為根據(jù)Sentinel-1和ALOS-2數(shù)據(jù)的聯(lián)合反演分析得出的克爾曼沙7.3級地震的滑動分布圖;(b)為根據(jù)彈性半空間中Sentinel-1和ALOS-2數(shù)據(jù)集的二次采樣相位展開位移結(jié)果推導出的克爾曼沙7.3級地震的庫侖應力變化圖;(c)~(f)為相鄰斷層的歐氏距離圖。

        DeVries等(2018)的研究不需要事先假設(shè)斷層方向,基于靜態(tài)應力標準進行余震預測。利用超過13.1萬對主震-余震訓練數(shù)據(jù)和超過3萬多對主震-余震測試數(shù)據(jù),在深度學習網(wǎng)絡下預測余震位置并對比經(jīng)典庫侖破裂應力變化預測結(jié)果,兩者的ROC曲線表明,神經(jīng)網(wǎng)絡(測試數(shù)據(jù)集中所有滑動分布和網(wǎng)格單元的合并AUC值為0.849)的性能要明顯優(yōu)于經(jīng)典庫侖破裂應力準則(AUC值為0.583),在1999年中國臺灣集集7.6級、1995年日本神戶7.2級和2005年克什米爾7.6級地震的單一震例分析中,神經(jīng)網(wǎng)絡的AUC值均優(yōu)于傳統(tǒng)庫侖破裂應力變化準則的AUC值。

        然而,Mignan等(2019)對DeVries等(2018)的這一結(jié)果表示懷疑,其在實驗中,使用較為簡單的神經(jīng)網(wǎng)絡雙參數(shù)邏輯回歸,基于測量距離和主震平均滑移參數(shù),也能獲得與DNN模型相同的性能,即AUC=0.85,實驗結(jié)果證明,復雜深度神經(jīng)網(wǎng)絡一般情況下不會影響模型的整體性能,但較難準確地解釋物理推理過程。

        2.3 地球化學

        研究表明,跨斷層土壤氣體(氡氣、二氧化碳、汞、氫氣等)在地震發(fā)震期間非常活躍(王喜龍,2021),而在機器學習的方法上,對于氡氣的研究較多。氡是一種放射性氣體,化學性質(zhì)穩(wěn)定,能溶解于水和有機物,并且具有較強的擴散能力和遷移能力,在地震發(fā)生時的高溫高壓環(huán)境下,容易吸附在其他物質(zhì)上,從而可以反映物質(zhì)在地殼內(nèi)部的遷移情況(史楊等,2017),震前氡濃度異常變化也已經(jīng)是地震前兆熱點研究對象之一。1978年1月14日本伊豆大島7.0級地震前夕,觀測到地下水濃度突然下降,隨后并顯著增加(Wakita et al,1980);1995年1月17日神戶7.2級地震前1~2個月,觀測到氡濃度比往常增加了約4倍,且于震前9天達到峰值,是初始觀測的10倍多(Igarashi et al,1995);近年來,不少學者將機器學習的方法用于識別震前氡異常,取得的效果優(yōu)于其他傳統(tǒng)技術(shù)(Haider et al,2021;Tareen et al,2019)。

        Sikder等(2009)使用前人研究報告中的數(shù)據(jù)集,包括155個地震活動,每次活動包括8個不同地點測量的氡濃度和7項氣候環(huán)境特征參數(shù),算法上選擇粗糙集理論算法和決策樹C4.5算法,進行對比分析,結(jié)果表明決策樹算法的總體精度高達93.55%,高于粗糙集算法的88.39%。

        2.4 地球電磁學

        電離層是位于60km以上的高層大氣區(qū)域,由于宇宙射線(主要是太陽輻射)的電離作用,大氣處于部分電離或者完全電離的狀態(tài),通過現(xiàn)有數(shù)據(jù)研究,科學家們發(fā)現(xiàn)強震前后電離層參數(shù)會發(fā)生擾動(楊許鉑,2015)。震前電離層擾動機制復雜,許多學者嘗試利用機器學習方法去識別電磁擾動并嘗試預測地震。

        Xiong等(2020)利用機器學習技術(shù)識別震前電磁擾動,從DEMETER衛(wèi)星數(shù)據(jù)中選擇11個電場頻帶和6個磁場頻帶,為了驗證機器學習技術(shù)的可靠性和魯棒性,在已經(jīng)選取的2005—2010年8760次大于等于5.0級地震的基礎(chǔ)上,生成8760個人工非地震事件,訓練算法包括常用的15種機器學習算法和深度神經(jīng)網(wǎng)絡,為了提高模型選擇的置信度,利用貝葉斯優(yōu)化進行超參數(shù)調(diào)整和五重交叉驗證進行性能評估。實驗表明,LightGBM算法在眾多算法中表現(xiàn)最優(yōu),13個數(shù)據(jù)集訓練下,AUC基本大于0.88,最高為0.986,識別震前電磁擾動最為準確。Xu等(2010)基于反向傳播神經(jīng)算法,利用DEMETER衛(wèi)星獲取的電子密度、電子溫度、離子溫度、氧離子密度、氫離子密度、氦離子密度以及地震帶參數(shù)作為神經(jīng)網(wǎng)絡特征因子,其中地震帶參數(shù)是根據(jù)每個震中距地震帶的距離計算的,若距離小于60km則參數(shù)為1,否則為0。模型對2007年大于等于6.0級地震DEMETER數(shù)據(jù)訓練后,在2008年的117個震區(qū)樣本和106個非震區(qū)樣本中進行測試,結(jié)果表明該方法對震區(qū)預測效果較好,準確率為81.2%,非震區(qū)則為57.5%。Ma等(2010)使用相同的神經(jīng)網(wǎng)絡,特征因子剔除了地震帶信息,獲取了測試震區(qū)83.9%的地震預測準確率。

        Xiong等(2020)研究表明,強震震區(qū)附近震前存在電離層TEC異常擾動;Nahornyi等(2020)提出一種基于TEC變化趨勢的預測模型,并且得到±5%的預測偏差,驗證了TEC作為地震預測標志的可能性;Akhoondzadeh等(2013)利用遺傳算法檢測所羅門群島8.0級地震所引起的TEC異常變化;Xiong等(2021b)提出一種新的拓展編碼器-解碼器長短時記憶拓展神經(jīng)網(wǎng)絡預測TEC。機器學習技術(shù)廣泛應用于TEC異常檢測,有助于基于TEC參數(shù)的地震預測的研究。Brum等(2019)利用NOAA提供的VTEC文件,開發(fā)具有多層感知器的神經(jīng)網(wǎng)絡并應用于墨西哥恰帕斯州8.2級地震,訓練后的模型在測試數(shù)據(jù)集上能達到85.71%的準確性,通過對比震前VTEC時序變化和臺站3個不同方向的地震波形圖,發(fā)現(xiàn)ANN模型在震前3小時內(nèi)給出異常預警。

        Xiong等(2021a)使用多源、多參數(shù)衛(wèi)星數(shù)據(jù)用于震前異常檢測,特征參數(shù)包括地表溫度、表層溫度、地球表面大氣溫度、表面水蒸氣質(zhì)量混合比、總臭氧負荷、反演一氧化碳總柱量、反演甲烷總柱量、出射長波輻射通量(AIRS)、晴空出射長波輻射通量和出射長波輻射通量(NOAA)。通過確定最佳時間特征和空間特征,獲得1234次6~7級地震和137次7級以上地震,并生成1371次人工地震事件,基于K均值算法和滑動時間窗方法2種不同方法生成特征,再根據(jù)是否包含余震信息,最終獲取一個完整的數(shù)據(jù)集。此外在算法上提出一種新的基于反向提升修剪樹(Inverse Boosting Pruning Trees)的地震預報框架(圖5),IBPT在不同機器學習方法、不同特征比較、考慮余震效應、不同時間窗和空間窗以及不平衡數(shù)據(jù)集上均能最優(yōu)的效果,最后基于該算法,生成全球范圍內(nèi)的地震預測可能性圖。

        圖5 IBPT框架流程圖(據(jù)Xiong等(2021a))

        2.5 地震地質(zhì)學

        在過去的幾十年中,地震數(shù)據(jù)種類和數(shù)據(jù)量快速增加,為地震發(fā)生概率評估提供一定的條件。Jena等(2020a)首次嘗試使用深度學習和GIS進行地震概率評估,研究使用的卷積神經(jīng)網(wǎng)絡使用9個特征指標,分別為斷層接近度、斷層密度、具有地震震動放大效應的巖性、坡度角、高程、震級密度、震中密度、距震中距離和地面峰值加速度密度。在GIS中生成每一指標的全區(qū)域?qū)n}圖,獲取地震點和隨機創(chuàng)建的非地震點的像素值;設(shè)計CNN模型,用兩類(0和1)地震預測;訓練完成后將預測點的像素轉(zhuǎn)換成格柵,從而生成GIS概率圖。在整個印度次大陸的研究范圍內(nèi),訓練和測試數(shù)據(jù)集的整體準確度分別為96%和92%,取得較好的結(jié)果。

        印度次大陸是一個面積較大的范圍,空間分辨率較低,為研究某一特定較小范圍區(qū)域內(nèi)地震概率,Jena等(2021)又以印度東北部為研究區(qū)域,選用相同的特征指標,不同的是在卷積神經(jīng)網(wǎng)絡評估地震概率后,利用層次分析法、維恩交集理論和風險映射集成模型評估脆弱性,脆弱性評價指標主要為建筑物密度、遠離建筑物距離、土地利用密度、遠離土地利用距離、遠離鐵路距離和鐵路密度,然后再結(jié)合區(qū)域的災害應對能力(評價指標為醫(yī)院數(shù)量和災害預算),最終得到印度東北部的地震災害風險圖。

        城市是人口、工業(yè)、經(jīng)濟產(chǎn)業(yè)密集區(qū),若發(fā)生破壞性地震將會帶來巨大的人員傷亡和財產(chǎn)損失,對城市抗震減災和地震風險評估是地震工作者的首要任務。Jena等(2020b)利用人工神經(jīng)網(wǎng)絡和層次分析法,建立綜合模型,研究分析印度尼西亞班達亞齊市地震風險。使用和上述研究相似的13個特征指標,通過在ANN中進行震例訓練后,概率映射到GIS中生成各項指標的專題圖,再利用MLP多層感知器繪制班達亞齊地震概率圖(圖6),實驗獲取的地震概率圖準確率達到84%,層次分析法將脆弱性指標映射到GIS中生成專題圖,并與地震概率圖混合,生成地震風險圖,通過分析研讀風險圖,發(fā)現(xiàn)班達亞齊市的地震中高風險主要分布在該市的中部和東南部地區(qū),這些研究結(jié)果對未來抗震減災和政府部門的政策制定有一定幫助。

        圖6 地震發(fā)生概率圖(據(jù)Jena等(2020b))

        3 總結(jié)與討論

        機器學習在其他預測領(lǐng)域取得的一定成果讓學者們開始利用機器學習方法研究地震預測,在本文整理的近5年來30多篇地震預測應用文獻中,基于地震學的地震目錄和地震活動性指標數(shù)據(jù)的地震預測研究熱度最高。而其他數(shù)據(jù)因為數(shù)據(jù)量、數(shù)據(jù)特征相關(guān)性和預測效能等影響,研究熱度較低?,F(xiàn)階段基于機器學習的地震預測并沒有最優(yōu)算法,不同的研究側(cè)重的算法不同,暫不能統(tǒng)計不同算法的研究熱度。

        地震預測效能是基于機器學習地震預測研究的重點關(guān)注內(nèi)容之一,現(xiàn)階段以地震活動性參數(shù)為數(shù)據(jù)并基于復雜算法模型進行地震預測已經(jīng)達到瓶頸,預測精度較難提升,而基于震源數(shù)據(jù)以及延伸出來的地震發(fā)生頻率、間隔時間等數(shù)據(jù)的地震預測仍處于發(fā)展階段,研究成果較少,尚不能總結(jié)預測性能;基于庫侖應力機器學習方法將余震預測歸納為平面或空間上,現(xiàn)有研究中不同特征參數(shù)和不同算法組合的AUC值基本處于0.75~0.85的范圍內(nèi),少數(shù)AUC值能超過0.9,整體預測性能較好;基于氡氣數(shù)據(jù)機器學習方法預測地震的研究較少,由于氡氣特別受外部環(huán)境影響,包括不同深度的土壤溫度、降雨和大氣壓力等因素,故整體研究成果不理想;現(xiàn)有的基于地球電磁地震預測研究準確率超過80%,但由于數(shù)據(jù)量的限制,參考價值有限,然而基于機器學習方法的空間電磁異常識別整體效果能達到較高水平,提高異常信號的識別能力有利于提升地震預測特征參數(shù)的準確性;基于地震地質(zhì)數(shù)據(jù)的地震概率預測對于中長期地震震害防御有所幫助。圖7整理了現(xiàn)有研究中出現(xiàn)較多的算法有效指標,由于某些算法的訓練指標和結(jié)果表現(xiàn)形式不一樣,無法通過某一特定指標進行直接比較。

        注:基于分類算法和回歸算法在地震預測上的表現(xiàn)主要以精確度(a)和均方根誤差/均方誤差(RMSE/MSE)(b)表示;其中,地震預測精度普遍高于65%,DCA-BPNN表現(xiàn)最差,約50%,LightGBM算法精度最高;回歸誤差表現(xiàn)差異較大,誤差值在0.1附近和大于0.4的最多,中間表現(xiàn)較少;從數(shù)據(jù)來源上分析,USGS數(shù)據(jù)使用最廣泛,其他各國地震研究機構(gòu)的數(shù)據(jù)也會偶爾被使用。

        基于不同學科的地震研究迅速發(fā)展,產(chǎn)生了海量數(shù)據(jù),但有效用于機器學習地震預測的只占地震數(shù)據(jù)的小部分,仍有大量的觀測數(shù)據(jù)待挖掘;不同數(shù)據(jù)若能跨學科使用,將有利于在不同維度上接近地震物理機制;另一方面,具有不同空間特征或時間特征的數(shù)據(jù),若可以相互匹配融合,能夠克服單一數(shù)據(jù)源有限性問題,例如空間范圍廣、時效性長的空間電磁數(shù)據(jù)與定點定位、時效性短的地電磁數(shù)據(jù)的融合使用。特征參數(shù)的選擇需要盡可能還原地震發(fā)震的物理機制,另外值得注意的是新興特征參數(shù)的效能也需深入研究,例如地球化學中的同位素;算法模型對預測結(jié)果影響較大,例如DeVries等(2018)用多達13000多個參數(shù)進行余震預測,而相同震例條件下,Mignan(2019)僅用2~3個參數(shù)就獲得了類似的結(jié)果。地震預測研究算法繁多,很難找到一個通用的最優(yōu)算法,更多的目的是基于某一地區(qū)尋找可能適合該地區(qū)的最優(yōu)算法,另外其他領(lǐng)域的一些深度學習優(yōu)秀算法性能往往優(yōu)于傳統(tǒng)機器算法,增加這些算法在地震預測的使用是提高地震預測效果的一種途徑。

        一般意義上的地震預測需要預測出地震發(fā)生的大概時間、地點和震級,而現(xiàn)有的大部分機器學習地震預測并不會提供準確的時間、地點和震級,而是通過比較不同預測算法的效能,獲取在某一區(qū)域或基于某一數(shù)據(jù)集表現(xiàn)最好的算法;基于回歸算法地震預測給出的預測震級,是基于某一區(qū)域內(nèi)震例的震級,預測的范圍相對較廣,很難定位到某個特定地點。

        總體來說,現(xiàn)階段基于機器學習地震預測很難給出較為準確的地震時間、地點和震級,主要原因是神經(jīng)網(wǎng)絡有限的特征參數(shù)很難完全體現(xiàn)地震孕育的復雜因素,以及神經(jīng)網(wǎng)絡內(nèi)部的運算過程難以完全匹配地震的復雜發(fā)震機制?;跈C器學習地震預測的學術(shù)研究到地震預測的真正應用之間還有很長一段路程。

        猜你喜歡
        震級機器神經(jīng)網(wǎng)絡
        機器狗
        基于累積絕對位移值的震級估算方法
        機器狗
        地震后各國發(fā)布的震級可能不一樣?
        新震級國家標準在大同臺的應用與評估
        山西地震(2020年1期)2020-04-08 07:34:26
        神經(jīng)網(wǎng)絡抑制無線通信干擾探究
        電子制作(2019年19期)2019-11-23 08:42:00
        未來機器城
        電影(2018年8期)2018-09-21 08:00:06
        基于神經(jīng)網(wǎng)絡的拉矯機控制模型建立
        重型機械(2016年1期)2016-03-01 03:42:04
        復數(shù)神經(jīng)網(wǎng)絡在基于WiFi的室內(nèi)LBS應用
        中國地震臺網(wǎng)面波震級與矩震級的統(tǒng)計關(guān)系
        精品三级久久久久久久电影| 精品国产天堂综合一区在线| 久久综合九色综合97欧美| 免费av片在线观看网站| 久久99久久99精品免视看国产成人| 麻豆精品国产免费av影片| 欧美白人战黑吊| 少妇无码av无码专区线| 国产91 对白在线播放九色| 精品国产夫妻自拍av| 高级会所技师自拍视频在线 | 久久久久亚洲女同一区二区| 永久免费在线观看蜜桃视频| 日本一区二区视频在线| 国产亚洲一本大道中文在线| 97se在线观看| 亚洲视频中文字幕更新| 日本熟女中文字幕在线| 亚洲国色天香卡2卡3卡4| 久久无码人妻一区=区三区| 亚洲视一区二区三区四区| 午夜视频在线观看一区二区小| 日本人与黑人做爰视频网站| 激情人妻在线视频| 伊人久久大香线蕉av色婷婷| 久久久亚洲欧洲日产国码二区| 国产69精品久久久久9999| 午夜无码亚| 国产精品亚洲一区二区三区16| 亚洲av无码成人网站在线观看| 国产最新地址| 国内激情一区二区视频| 亚洲综合网国产精品一区| 亚洲精品一区二区三区大桥未久| 中文字幕大乳少妇| 国语对白在线观看免费| 人妻少妇不满足中文字幕| 午夜毛片午夜女人喷潮视频| 亚洲国产综合精品中文| 最新国产毛2卡3卡4卡| 国产一区二区三区av在线无码观看 |