亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于粗糙集的BP神經(jīng)網(wǎng)絡(luò)在震例中的應(yīng)用研究*

        2012-01-09 03:01:22董曉娜蘇道磊李希亮張慧峰
        地震研究 2012年2期
        關(guān)鍵詞:震例約簡粗糙集

        董曉娜,蘇道磊,李希亮,曲 利,張慧峰,吳 晨

        (1.山東省地震局,山東濟南250014;2.濟南市地震局,山東濟南250001)

        基于粗糙集的BP神經(jīng)網(wǎng)絡(luò)在震例中的應(yīng)用研究*

        董曉娜1,蘇道磊2,李希亮1,曲 利1,張慧峰1,吳 晨1

        (1.山東省地震局,山東濟南250014;2.濟南市地震局,山東濟南250001)

        采用《中國震例》作為數(shù)據(jù)源,通過初步整理分析和預(yù)處理,構(gòu)建了較完備的震例研究樣本集。嘗試將粗糙集與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法引入到震例研究中,用基于粗糙集的屬性約簡算法從眾多復(fù)雜的地震異常指標中篩選出對最終分類起決定作用的核心異常作為輸入,震級作為輸出,構(gòu)建了泛化能力強的BP神經(jīng)網(wǎng)絡(luò)模型來模擬異常與地震之間的不確定關(guān)系。仿真測試結(jié)果表明:地震震級預(yù)測精度誤差基本控制在-0.5~0.5級之間。

        粗糙集;神經(jīng)網(wǎng)絡(luò);震例研究;地震異常指標

        0 引言

        1 理論基礎(chǔ)

        地震預(yù)測是世界性科學(xué)難題,因為地震的孕育和發(fā)生是很復(fù)雜的自然現(xiàn)象。在研究探索中,人們發(fā)現(xiàn)地震發(fā)生前會出現(xiàn)大量異?,F(xiàn)象,且異?,F(xiàn)象出現(xiàn)的種類多少、持續(xù)時間與地震之間有一定的關(guān)系,但這種關(guān)系具有很強的不確定性,是一種非線性映射關(guān)系,很難通過簡單的解析表達式來描述,這使得地震預(yù)測具有較高的難度。

        神經(jīng)網(wǎng)絡(luò)可以通過學(xué)習(xí)大量樣本得到輸入與輸出之間高度非線性映射關(guān)系,這與一些學(xué)者從歷史震例中總結(jié)出某些規(guī)律的地震預(yù)測思路相一致。但在實際信息處理時,一旦輸入信息量過大,神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)就會變復(fù)雜,使得訓(xùn)練時間大大延長,實效性變差。粗糙集可以解決這個問題,它可以通過發(fā)現(xiàn)數(shù)據(jù)之間的內(nèi)在關(guān)系、去掉冗余、抽取核心屬性從而簡化輸入。因此,本文嘗試將粗糙集與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合應(yīng)用于震例研究中,通過粗糙集屬性約簡算法對震例數(shù)據(jù)進行處理,將眾多地震異常中篩選出的核心異常作為輸入,將震級作為輸出,構(gòu)建泛化能力強的神經(jīng)網(wǎng)絡(luò)模型來模擬異常與地震之間的不確定關(guān)系,為地震預(yù)測研究提供更客觀的指導(dǎo)。

        1.1 粗糙集

        1.1.1 概述

        粗糙集理論 (Rough Set,簡稱RS),是波蘭學(xué)者Pawlak(1982)提出的一種能夠定量分析處理不精確、不一致、不完整信息與知識的理論方法。從本質(zhì)上講,粗糙集反映了認知過程在非確定性、非模型化信息處理方面的機制和特點,是一種有效的非單調(diào)推理工具。粗糙集和其它處理不確定問題的理論最顯著的區(qū)別是:它無需提供任何先驗信息,只需從給定問題的描述集合出發(fā),找出該問題的內(nèi)在規(guī)律,所以對問題的描述和處理是比較客觀的。

        1.1.2 可辨識矩陣

        可辨識矩陣 (Discernibility Matrix)是由波蘭華沙大學(xué)的著名數(shù)學(xué)家Skowron和 Stepaiuk(1994)提出來的,是近年來在粗糙集約簡上出現(xiàn)的一個有力工具,在粗糙集理論中,它的地位非常重要。其核心思想是:將數(shù)據(jù)表中所有與屬性區(qū)分有關(guān)的信息都濃縮在一個矩陣中,把存在于復(fù)雜的信息系統(tǒng)中的全部不可區(qū)分關(guān)系表達出來,且不改變原來系統(tǒng)中的潛在知識,從而大大提高系統(tǒng)獲得知識的效率。通過該方法可以很容易求得約簡和核,所以基于可辨識矩陣的屬性約簡算法簡單易行,許多屬性約簡算法都將它作為基礎(chǔ)。

        設(shè)S=(U,C∪D,V,f)為一個決策表,其中,U=(x1,x2,…,xn) 為論域,C={c1,c2,…,cm} 為條件屬性集,D=ttr5bh5為決策屬性集,且A=C∪D,V是屬性的值域集,f是屬性空間向值域空間的映射函數(shù)f∶U×A→V,則可辨識矩陣可定義為M(S)=[mij]n×n。其中矩陣項定義為 mij(i,j=1,2,…,n;k=1,2,…,m),公式如下:

        由式 (1)可知,當(dāng)兩個樣本的決策屬性值相同時,矩陣元素mij定義為0,表明這種情況不能區(qū)分兩個樣本;當(dāng)兩個樣本的決策屬性值不同時,分為兩種情況:(1)條件屬性值不完全相同時,矩陣元素mij定義為條件屬性值不相同的所有屬性集合;(2)條件屬性值完全相同,說明這兩個樣本發(fā)生沖突,互不相容,矩陣元素mij定義為空集。

        可辨識矩陣的定義表明:矩陣中的屬性組合數(shù)為1的元素項是對最終決策起決定作用的,是決策表的核屬性 (核屬性可能為空),是必須保留的。顯然,凡是條件屬性組合中包含有核屬性的矩陣元素,都可以僅用核屬性就把決策表中決策值不同的記錄區(qū)分開來,也就是說對于包含有核屬性的矩陣元素而言,其屬性組合中除核屬性外的其他條件屬性都是多余的,則這些元素項可被約簡。因此,通過可辨識矩陣可以很容易地得到核屬性。

        1.1.3 屬性約簡算法

        屬性約簡是基于粗糙集理論的重要研究內(nèi)容之一,范君暉等 (2007)、張運陶和丁保淼(2007)、周必水和黃小克等 (2007)、孫林嘉等(2009)、徐妙君和吳遠紅 (2009)、董曉娜等(2010)已陸續(xù)將基于粗糙集的屬性約簡算法應(yīng)用到了工業(yè)、商業(yè)、社會科學(xué)、醫(yī)學(xué)、生物學(xué)、網(wǎng)絡(luò)安全、地震等研究領(lǐng)域中。

        基于可辨識矩陣的屬性約簡算法如下:

        算法1

        輸入:決策表T;輸出:約簡RED(初始時,設(shè)置RED=?)。

        步驟1:計算決策表T的可辨識矩陣M,并刪除可辨識矩陣M中的重復(fù)項;

        步驟2:依次掃描可辨識矩陣M的各元素,如果存在只含有一個屬性的元素,則記為核屬性CORE(CORE∈C),令 RED=RED∪{CORE},轉(zhuǎn)至步驟3。如果不存在只含有一個屬性的元素,轉(zhuǎn)至步驟5;

        步驟3:刪除可辨識矩陣M中包含CORE的其他所有元素項;

        步驟4:如果M=?,則輸出RED,算法結(jié)束。否則,轉(zhuǎn)至步驟2繼續(xù)循環(huán);

        步驟5:計算剩余屬性的重要性 (楊帆,2005),并按照其重要性大小進行排序,選出其中最重要的屬性Csig(Csig∈C),令RED=RED∪{Csig},并刪除可辨識矩陣M中含Csig的其他所有元素項;

        步驟6:如果M=?,則輸出RED,計算結(jié)束。否則,轉(zhuǎn)至步驟5繼續(xù)循環(huán)。

        1.2 BP神經(jīng)網(wǎng)絡(luò)

        1.2.1 人工神經(jīng)網(wǎng)絡(luò)

        人工神經(jīng)網(wǎng)絡(luò) (Artificial Neural Network,簡稱ANN)是20世紀80年代中期興起的一門科學(xué),它模擬人腦的一些基本特征,利用非線性映射和并行處理方法,通過不斷學(xué)習(xí)和訓(xùn)練,完成輸入與輸出之間的映射關(guān)系。ANN在模式識別、機器學(xué)習(xí)、決策支持、知識發(fā)現(xiàn)和數(shù)據(jù)挖掘等領(lǐng)域都得到廣泛的應(yīng)用。

        1.2.2 BP神經(jīng)網(wǎng)絡(luò)

        1986年,美國加州大學(xué)的 Rumelhart和 Mc-Clelland(1986)在研究并行分布式信息處理方法時,提出了利用誤差反向傳播訓(xùn)練算法構(gòu)造的一種神經(jīng)網(wǎng)絡(luò)Back-Propagation Network,簡稱BP神經(jīng)網(wǎng)絡(luò)。

        據(jù)統(tǒng)計,在人工神經(jīng)網(wǎng)絡(luò)的應(yīng)用中,80%以上所采用的是BP神經(jīng)網(wǎng)絡(luò),因為其很好地體現(xiàn)了人工神經(jīng)網(wǎng)絡(luò)最完美、最精華的部分。它在結(jié)構(gòu)上類似于多層感知器,是一種有隱含層的多層前饋型網(wǎng)絡(luò),可對非線性可微分函數(shù)進行權(quán)值訓(xùn)練,很好地解決了多層網(wǎng)絡(luò)中隱含單元連接權(quán)的學(xué)習(xí)問題 (Robert,1987)。由于其具備了結(jié)構(gòu)簡單、可調(diào)用參數(shù)多、訓(xùn)練算法全、可操控性強等優(yōu)勢,因此得到廣泛應(yīng)用。

        具有隱含層BP網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示,網(wǎng)絡(luò)包括輸入層、隱含層、輸出層。其中隱含層可以由多層組成,每一層有若干個節(jié)點,前層和后層通過權(quán)值連接,同一層上的各節(jié)點之間無耦合連接。BP網(wǎng)絡(luò)結(jié)構(gòu)的每一層連接權(quán)值都可以通過學(xué)習(xí)來調(diào)節(jié),它的基本處理單元 (輸入層除外)為非線性的輸入輸出關(guān)系,一般選Sigmoid型函數(shù)作為傳遞函數(shù)。

        圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖Fig.1 Structure schematic of the BP neural network

        2 基于粗糙集的BP神經(jīng)網(wǎng)絡(luò)在震例中的應(yīng)用研究

        2.1 基于粗糙集的BP神經(jīng)網(wǎng)絡(luò)應(yīng)用模型

        震前異常的種類多少、持續(xù)時間與震級大小之間的關(guān)系是一種非線性映射關(guān)系,很難通過簡單的解析表達式對其進行描述,如何客觀合理地分析這種關(guān)系,是地震預(yù)測研究領(lǐng)域中的關(guān)鍵問題。神經(jīng)網(wǎng)絡(luò)最大的優(yōu)勢是可以通過輸入信息充分逼近任意復(fù)雜的非線性關(guān)系,具有自學(xué)習(xí)、自適應(yīng)能力,并有很強的容錯性,對輸入數(shù)據(jù)中存在的噪聲也不敏感。因此,選用神經(jīng)網(wǎng)絡(luò)模型可以很好地模擬地震異常指標與震級之間的關(guān)系。但震前出現(xiàn)的異常數(shù)量繁多,如果不作處理,將全部指標作為輸入來構(gòu)造神經(jīng)網(wǎng)絡(luò),會使得網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,訓(xùn)練時間過長,甚至得不出想要的結(jié)果。一些學(xué)者憑經(jīng)驗或數(shù)理統(tǒng)計挑選一些異常指標構(gòu)造神經(jīng)網(wǎng)絡(luò),這樣有些主觀和盲目,對實際的預(yù)測結(jié)果也可能有一定影響。通過粗糙集屬性約簡算法提取核心異常指標作為輸入,可以降低網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜程度,縮短訓(xùn)練時間。因此,本文提出了一種基于粗糙集的BP神經(jīng)網(wǎng)絡(luò)在震例中的應(yīng)用模型 (圖2)。

        圖2 基于粗糙集的BP神經(jīng)網(wǎng)絡(luò)在震例中的應(yīng)用模型Fig.2 Application model of the BP neural network based on Rough Set in the earthquake case

        基于粗糙集的BP神經(jīng)網(wǎng)絡(luò)在震例中的應(yīng)用模型包括粗糙集屬性約簡模塊、神經(jīng)網(wǎng)絡(luò)構(gòu)造及訓(xùn)練模塊、神經(jīng)網(wǎng)絡(luò)仿真測試模塊。各模塊的主要功能如下:(1)粗糙集屬性約簡模塊:從震例數(shù)據(jù)庫中提取數(shù)據(jù),對其進行異常賦值、震級離散化等相關(guān)預(yù)處理。將處理后的異常指標構(gòu)造可辨識矩陣,利用基于可辨識矩陣的屬性約簡算法進行計算,提取核心異常指標;(2)神經(jīng)網(wǎng)絡(luò)構(gòu)造及訓(xùn)練模塊:在Matlab環(huán)境下,將甄選出的核心異常指標作為輸入神經(jīng)元,離散化震級作為輸出神經(jīng)元,構(gòu)造BP神經(jīng)網(wǎng)絡(luò)。調(diào)用震例數(shù)據(jù)庫中75%的數(shù)據(jù)作為訓(xùn)練樣本集進行訓(xùn)練,從而建立核心異常指標與震級之間的一種非線性映射關(guān)系;(3)神經(jīng)網(wǎng)絡(luò)仿真測試模塊:調(diào)用震例數(shù)據(jù)庫中剩余25%的數(shù)據(jù)作為測試樣本集,使用訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)進行仿真測試,嘗試對震級進行預(yù)測。

        2.2 數(shù)據(jù)的選取

        2.2.1 數(shù)據(jù)概況

        《中國震例》(張肇誠等,1988,1990a,b,1999,2000;陳棋福等,2002a,b,c,2008) 收錄了1966~2002年中國大陸發(fā)生的所有5.0級以上地震的震例研究報告,后又增補了4條4.5~4.9級的地震震例,書中對每條震例的地震基本參數(shù)及震前異常等都做了詳細分析和總結(jié),是迄今為止國內(nèi)最完整、最豐富的震例資料,是地震預(yù)測研究和探索地震規(guī)律的重要科學(xué)資料。在一些學(xué)者關(guān)于震例的研究中,已有很多重要的理論成果 (付虹等,2008;蔣海昆等,2009)

        異常和地震的關(guān)系可歸納為4種:1.異常出現(xiàn),有地震發(fā)生;2.異常未出現(xiàn),有地震發(fā)生;3.異常出現(xiàn),無地震發(fā)生;4.異常未出現(xiàn),也無地震發(fā)生。這4種關(guān)系可以描述為以下4種情況:A.從異常出現(xiàn)層面來說,1和3構(gòu)成理論上的完備集;B.從地震發(fā)生層面來說,1和2構(gòu)成理論上的完備集;C.從異常未出現(xiàn)層面來說,2和4構(gòu)成理論上的完備集;D.從無地震發(fā)生層面來說,3和4構(gòu)成理論上的完備集。其中,4無有用信息,包含4的C和D在實際研究中價值不大。2和3的情況很常見,也正是造成大量“漏報” (報無實有)和“虛報”(報有實無)的原因 (吳紹春,2005)。完整意義下的研究應(yīng)該是A和B的總和,但是由于3的缺失或不完備使得A成了實際上的不完備集,所以無法開展研究。因此本文的研究只針對B。

        2.2.2 數(shù)據(jù)選取

        本文對《中國震例》中記載的209條震例的異常信息進行詳細整理,按觀測手段統(tǒng)計:測震學(xué)異常指標共計74項,前兆異常指標共計84項。經(jīng)整理分析和統(tǒng)計歸納,最終得到異常指標共106項,其中測震學(xué)指標41項,前兆指標65項,詳細信息如表1所示。

        表1 地震異常指標詳表Tab.1 Detailed table of seismic anomaly indicators

        2.3 數(shù)據(jù)預(yù)處理

        2.3.1 異常賦值

        異常種類多少及其持續(xù)時間是研究問題的兩個關(guān)鍵因素。異常的數(shù)量,可直接相加求得,但異常持續(xù)時間則無法直接獲取。本文根據(jù)每條震例中異常的出現(xiàn)情況,通過統(tǒng)計其起止時間進行賦值。以SAIi(Seismic Anomaly Indicator)來表示第i項異常指標,用Ti來表示第i(i=1,2,…,106)項異常指標的持續(xù)時間,單位為月。分以下3種情況來討論:

        (1)異常未出現(xiàn):如果某個地震之前,某項異常未出現(xiàn),也就是書中未記載該項異常信息,那么其對應(yīng)的T賦值為0。例如: “1975年2月4日遼寧海城7.3級地震”,未出現(xiàn)指標“應(yīng)變釋放”SAI8異常,因此,筆者給SAI8賦值為T8=0。

        (2)某項異常只在單測點出現(xiàn):某次地震之前,只有一個測點出現(xiàn)異常,T取該異常的持續(xù)時間。例如:“1976年4月6日內(nèi)蒙古和林格爾6.3級地震”,1962年5月至1973年4月在和林格爾地區(qū) (300×400)km2范圍內(nèi)應(yīng)變釋放出現(xiàn)加速密集異常現(xiàn)象,起止時間共計132個月。因此,筆者給第15號震例的屬性SAI8“應(yīng)變釋放”賦值為T8=132。

        (3)某項異常同時出現(xiàn)在多個測點:某次地震之前,也可能存在某項異常同時在多個測點出現(xiàn)的情況。對于這種情況,異常持續(xù)時間如何賦值是個關(guān)鍵問題,因為在構(gòu)造BP網(wǎng)絡(luò)時,要把異常持續(xù)時間作為輸入,如果處理不得當(dāng),會直接影響B(tài)P神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),從而得不到理想的結(jié)果(王煒等,2000;劉悅,2008)。本文采用加權(quán)求和法來解決以上問題,即把該異常出現(xiàn)在各測點的持續(xù)時間進行加權(quán)求和。假設(shè)某次地震前,某項異常指標SAIi(i=1,2,…,106)在多個測點j(j=1,2,…,n) 均出現(xiàn),則 SAIi的持續(xù)時間 Ti可定義為

        其中,tij表示第i項異常指標在第j個測點的持續(xù)時間,ωj為權(quán)值,定義如下:

        將式 (3)帶入式 (2),可得

        例如:“1973年2月6日四川爐霍7.6級地震”的“地震頻度”指標 (SAI11)在兩個測點均出現(xiàn)了異常,分別持續(xù)了2個月和20個月。因此,根據(jù)式 (4),可計算該震例的異常SAI11持續(xù)時間為T11=18.36。

        2.3.2 震級離散化

        由于粗糙集方法不能直接處理連續(xù)屬性,因此需要先把震級進行離散化處理,本文選擇等距離離散法將震級劃分,如表2所示。

        表2 震級離散化Tab.2 Magnitude discretization

        2.4 基于粗糙集的屬性約簡

        2.4.1 構(gòu)造可辨識矩陣

        (1)論域

        由于異常指標共106項,數(shù)據(jù)量繁多,如果直接進行處理,可能會降低約簡算法的執(zhí)行效率。鑒于測震和前兆是相對獨立的研究體系,本文將震例數(shù)據(jù)分為測震學(xué)指標和前兆指標,并分別構(gòu)造可辨識矩陣來進行約簡。去除測震學(xué)指標中震前無任何測震異常的7條震例,剩余的202條震例信息構(gòu)成研究測震學(xué)指標的論域。同理,對于前兆指標,去除震前無任何前兆異常的17條震例,剩余的192條震例信息構(gòu)成研究前兆指標的論域。

        (2)條件屬性

        《中國震例》記載的每一條震例中,很多異常指標可能是震后通過研究認識到它與地震的關(guān)系后加上去的。根據(jù)目前的資料已無法分辨哪些異常是震前確實存在,并且被地震工作者識別到的;哪些異常是震前確實出現(xiàn)了,但無法斷定是否是異常;哪些異常是震后通過總結(jié)追加上去的。因此本文約定:無論哪種情況,凡是在某條震例記載中出現(xiàn)的異常指標,在決策表的條件屬性中都表示為1,未在震例記載中出現(xiàn)的則為0。

        (3)決策屬性

        如果決策屬性以“地震是否發(fā)生”來賦值,每一條震例的決策屬性都是1,就起不到?jīng)Q策作用。考慮到本文研究的是震前異常出現(xiàn)的種類多少、持續(xù)時間與震級的關(guān)系,所以選擇震級的大小作為決策屬性。

        綜上所述,就測震學(xué)指標而言,論域為202個震例,條件屬性為41個測震異常,決策屬性為震級。根據(jù)條件屬性的取值,每條震例可描述為一個由41個“0或1”組成的序列。那么,202個震例就對應(yīng)202個序列,可根據(jù)式 (1)生成測震學(xué)指標的可辨識矩陣,即 (202×202)階的矩陣,如表3所示。同理,對于前兆指標,論域為192個震例,條件屬性為65個前兆異常,決策屬性為震級,也可按上述原理生成前兆指標的可辨識矩陣,即 (192×192)階的矩陣。

        表3 測震學(xué)異常指標的可辨識矩陣Tab.3 Discernibility matrix of seismometry anomaly indicators

        2.4.2 基于可辨識矩陣的屬性約簡

        根據(jù)算法1,逐項掃描可辨識矩陣,對于重復(fù)項只保留其中一項。檢索可辨識矩陣中只含有一個屬性的項即核屬性Core,將其加入約簡RED,并刪除可辨識矩陣中含Core的所有項。若可辨識矩陣已為空,則RED就為最終所求的約簡,若不為空,則計算剩余屬性的重要性,依重要性排序,依次將目前最重要的屬性Csig加入到RED,并刪減掉包含Csig的所有項,直到矩陣為空為止。

        對測震學(xué)指標的可辨識矩陣進行約簡,最終得出測震學(xué)指標的核屬性依次為:06、11、10、02、08、25、16、37、12、04、01、15、14、20、39、09、21、17、34、19、31、22。然后將包含這些核屬性的矩陣項約簡后,矩陣為空,算法結(jié)束,以上的核屬性即為所求的約簡RED。整理可得經(jīng)過粗糙集屬性約簡后的核心測震學(xué)異常指標如表4所示。

        表4 約簡后的測震學(xué)異常核心指標Tab.4 Core indicators of seismometry anomaly after reduction

        同理可對前兆指標的可辨識矩陣進行分析,得到的核屬性依次為:33、03、64、09、44、18、19、29、16、10、02、11、01、25、27、17、28,將它們存入RED,并將包含這些核屬性的矩陣項約簡后,矩陣仍不為空。然后,計算剩余屬性的重要度Csig,依重要度遞減排序,按照排序繼續(xù)進行約簡,直到矩陣為空,該算法結(jié)束。又加入到RED 的屬性有:22、26、43、38、21、49、31。整理可得經(jīng)過粗糙集屬性約簡后的核心前兆異常指標如表5所示。由表4、表5可知,使用基于粗糙集屬性約簡的方法后,最終得出46項核心指標,其中測震學(xué)分類22項,前兆分類24項。整理所有經(jīng)過粗糙集屬性約簡后的震例信息,即對每條震例記錄中冗余信息進行刪減,只保留46項核心異常指標。

        表5 約簡后的前兆異常核心指標Tab.5 Core indicators of the precursory anomaly after reduction

        2.5 BP神經(jīng)網(wǎng)絡(luò)構(gòu)造訓(xùn)練及仿真測試

        (1)樣本選擇

        調(diào)用經(jīng)過粗糙集屬性約簡得到的核心屬性的震例數(shù)據(jù),將其中的162條震例 (約占總樣本數(shù)的75%)作為訓(xùn)練樣本,其余的40條震例 (約占總樣本數(shù)的25%)作為測試樣本,在MATLAB R2007a環(huán)境下構(gòu)造BP網(wǎng)絡(luò)模型。

        (2)歸一化與反歸一化

        由于隱含層中的神經(jīng)元選用Sigmoid型傳遞函數(shù),所以在構(gòu)造神經(jīng)網(wǎng)絡(luò)之前,先將訓(xùn)練樣本歸一化,使各樣本元素的值為 [0,1],這樣才能確保網(wǎng)絡(luò)對樣本具有足夠的輸入敏感性和良好的擬合性。訓(xùn)練好的BP網(wǎng)絡(luò)模型對測試樣本進行仿真之后,需對仿真結(jié)果進行反歸一化得到實際的震級。本文選用的歸一化與反歸一化方法如式 (5)和式 (6)所示。

        (3)BP神經(jīng)網(wǎng)絡(luò)的構(gòu)造、訓(xùn)練及仿真測試

        神經(jīng)網(wǎng)絡(luò)構(gòu)造的主要工作是確定神經(jīng)網(wǎng)絡(luò)的層數(shù)和各層的神經(jīng)元數(shù)目。輸入神經(jīng)元使用粗糙集屬性約簡后得出的46項核心指標,包括測震指標和前兆指標;輸出神經(jīng)元即震級大小。

        將訓(xùn)練樣本以矩陣的形式導(dǎo)入神經(jīng)網(wǎng)絡(luò)模型,本文訓(xùn)練樣本集共有162個樣本,因此,該神經(jīng)網(wǎng)絡(luò)的輸入為一個 (46×162)階矩陣,輸出為一個(1×162)階矩陣。在MATLAB R2007a環(huán)境下,建立了BP神經(jīng)網(wǎng)絡(luò)模型進行訓(xùn)練,如圖3所示。

        圖3 MATLAB下建立BP網(wǎng)絡(luò)模型Fig.3 BP neural network model based on MATLAB software

        本文中測試樣本集共有40個樣本,因此,輸入為一個 (46×40)階矩陣,輸出為一個 (1×40)階矩陣。在Matlab環(huán)境下,將測試樣本以矩陣的形式導(dǎo)入訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)模型進行仿真測試。

        (4)實驗結(jié)果及分析

        經(jīng)過反復(fù)實驗并對比多次實驗的結(jié)果,得到以下結(jié)論:當(dāng)隱含層神經(jīng)元數(shù)設(shè)為20,訓(xùn)練誤差設(shè)為0.01時,訓(xùn)練得到的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)最佳。用測試樣本進行仿真實驗,誤差結(jié)果如圖4所示。用來仿真實驗的40個測試樣本中,除了2個樣本的震級差略大 (圖中以圓圈表示),其余樣本的震級差都小于0.5(圖中虛線之間部分)。

        圖4 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練及仿真結(jié)果圖Fig.4 Training and simulation results of BP neural network

        本文將基于粗糙集的BP神經(jīng)網(wǎng)絡(luò)的仿真實驗誤差與陳以等 (2011)提出的組合人工神經(jīng)網(wǎng)絡(luò)的研究結(jié)果進行對比,結(jié)果如表6所示??梢?,無論是最大誤差還是預(yù)測誤差,基于粗糙集的BP神經(jīng)網(wǎng)絡(luò)預(yù)測效果都明顯優(yōu)于傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)。其中,最大誤差減少了36.92%,平均誤差減少了17.02%,在最大誤差上,基于粗糙集的BP神經(jīng)網(wǎng)絡(luò)的預(yù)測效果更占優(yōu)勢,最大誤差減少了0.080 7,但平均誤差卻增大0.047 4。因此,以上兩種研究方法各有優(yōu)劣,可在實際的應(yīng)用中根據(jù)需要來選擇。

        表6 誤差結(jié)果對比Tab.6 Contrast of error results

        3 結(jié)論與探討

        前人使用神經(jīng)網(wǎng)絡(luò)進行地震預(yù)測的研究中存在以下兩個問題:

        (1)樣本量小。蔡煜東等 (1993)、楊居義和易永宏 (2008)、陳一超等 (2008)、陳以等(2011)僅選用部分區(qū)域的部分震例進行研究。如:選用云南滇西南地震區(qū)的17條震例資料作為研究樣本。再如:王煒等 (2000)選用大華北地區(qū)1975年至1998年7月發(fā)生5級以上的32條震例資料作為研究樣本。選擇小量樣本進行研究,可能會導(dǎo)致研究結(jié)果以面概全,不夠客觀和全面。

        (2)人為選擇異常指標作為輸入。蔡煜東等(1993)、王煒等 (2000)、楊居義和易永宏(2008)、陳一超等 (2008)、陳以等 (2011)通常根據(jù)經(jīng)驗或簡單的數(shù)理統(tǒng)計,對神經(jīng)網(wǎng)絡(luò)模型的輸入人為進行選擇。這種做法可能會使得整個研究過程不夠客觀和全面。

        本文選用目前能夠收集到的最完整的震例數(shù)據(jù)作為研究樣本,以便在大量震例研究的基礎(chǔ)上提取共性特征,使得研究結(jié)果更具普適性。然后提出了一種基于粗糙集的神經(jīng)網(wǎng)絡(luò)在震例中的應(yīng)用模型,實現(xiàn)了用粗糙集屬性約簡算法來自動篩選核心地震異常指標,最后通過BP神經(jīng)網(wǎng)絡(luò)建立核心異常指標與地震震級之間的一種非線性映射關(guān)系,嘗試對地震震級進行預(yù)測。實驗結(jié)果如下:

        (1)對《中國震例》中記載的209條震例的異常信息做了詳細整理,最終得到異常指標共106項,其中測震學(xué)指標41項,前兆指標65項,構(gòu)成了進行震例研究的較完備樣本集。

        (2)使用基于粗糙集屬性約簡的方法,從106項異常指標篩選出了46項核心指標,其中測震異常22項,前兆異常24項。這46項中囊括了前人經(jīng)驗研究中常使用的異常指標,如測震學(xué)異常指標中的地震條帶、應(yīng)變釋放、b值和波速比等,前兆異常指標中的短水準、地傾斜、電位、水氡、水位等。這些指標可以從眾多指標中通過粗糙集屬性約簡算法被自動篩選出來,足以證明該算法在解決此問題上的科學(xué)性和正確性。另外,該方法還篩選出了:前震活動、地震遷移、地震平靜、地震活動增強等有關(guān)地震時空分布方面的屬性;以及小震調(diào)制比Rm、斷層面總面積∑(t)值、地震活動性指標、η值、GL值、振幅比等異常指標;形變學(xué)科中的重力、鉆孔應(yīng)變,電磁學(xué)科的電阻率、地磁低點位移、地磁Z、D、F,以及流體學(xué)科的氣溫、水溫、硫化氫等異常指標。根據(jù)粗糙集屬性約簡算法的特性,得出的核心屬性都是對最終分類起決定作用的。因此在今后的研究中,這部分異常指標的使用值得引起足夠重視,將它們合理地應(yīng)用到實際的地震預(yù)測研究中,可能會得到更客觀、更全面的結(jié)果。

        (3)最終預(yù)測的震級與實際的震級誤差基本控制在-0.5~0.5(即不超過0.5級),結(jié)果基本符合地震預(yù)測精度要求。因此,使用粗糙集與神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法對震級進行預(yù)測研究是行之有效的。今后,還可嘗試使用數(shù)據(jù)挖掘中的聚類分析、關(guān)聯(lián)規(guī)則、支持向量機等算法對核心異常開展進一步的探索研究。

        蔡煜東,甘俊人,姚林聲.1993.人工神經(jīng)網(wǎng)絡(luò)在地震綜合預(yù)報中的應(yīng)用[J].地震學(xué)報,15(2):257-260.

        陳棋福,鄭大林,車時,等.2008.中國震例(2000-2002)[M].北京:地震出版社.

        陳棋福,鄭大林,車時.2002a.中國震例(1992-1994)[M].北京:地震出版社.

        陳棋福,鄭大林,高榮勝.2002b.中國震例(1997-1999)[M].北京:地震出版社.

        陳棋福,鄭大林,劉桂萍,等.2002c.中國震例(1995-1996)[M].北京:地震出版社.

        陳一超,曾三友,張好春,等.2008.基于遺傳神經(jīng)網(wǎng)絡(luò)的地震預(yù)測研究[J].計算機應(yīng)用與軟件,25(4):135 -137.

        陳以,王穎.張晉魁.2011.組合人工神經(jīng)網(wǎng)絡(luò)在地震預(yù)測中的應(yīng)用研究[J].計算機仿真,28(1):190-193.

        董曉娜,段會川.2010.基于粗糙集的屬性約簡在地震異常指標識別中的應(yīng)用研究[J].山西地震,(1):21-24.

        董曉娜.2010.粗糙集支持的人工神經(jīng)網(wǎng)絡(luò)在地震預(yù)測中的應(yīng)用研究[D].濟南:山東師范大學(xué).

        范君暉,吳忠,李旭芳.2007.基于粗糙集和神經(jīng)網(wǎng)絡(luò)的上海最低工資標準研究[J].計算機工程與設(shè)計,28(12):2 918-2 921.

        付虹,李永莉,趙小艷,等.2008.云南M≥5地震震前異常的統(tǒng)計特征[J].地震研究,31(4):335-339.

        蔣海昆,苗青壯,吳瓊,等.2009.基于震例的前兆統(tǒng)計特征分析[J].地震學(xué)報,31(3):245-259.

        劉悅.2005.神經(jīng)網(wǎng)絡(luò)集成及其在地震預(yù)報中的應(yīng)用研究[D].上海:上海大學(xué).

        孫林嘉,李茹,屈元子.2009.煤礦瓦斯預(yù)測知識獲取模型的應(yīng)用研究[J].計算機工程,35(12):169-171.

        王煒,吳耿鋒,宋先月.2000.神經(jīng)網(wǎng)絡(luò)在地震學(xué)方法綜合預(yù)報中的應(yīng)用[J].地震學(xué)報,22(3):189-193.

        吳紹春.2005.地震預(yù)報中的數(shù)據(jù)挖掘方法研究[D].上海:上海大學(xué).

        徐妙君,吳遠紅.2009.基于粗糙集和神經(jīng)網(wǎng)絡(luò)結(jié)合的魚病診斷方法[J].計算機工程與設(shè)計,30(7):1738 -1741.

        楊帆.2005.粗糙集約簡算法及其應(yīng)用的研究[D].武漢:武漢科技大學(xué).

        楊居義,易永宏.2008.基于BP神經(jīng)網(wǎng)絡(luò)的地震預(yù)測研究[J].微電子學(xué)與計算機,25(10):129-132.

        張運陶,丁保淼.2007.RS-GA-SVM方法在真核生物DNA翻譯起始位點識別中的應(yīng)用[J].計算機與應(yīng)華學(xué),6(24):794-798.

        張肇誠,羅蘭格,李海華,等.1988.中國震例(1966-1975)[M].北京:地震出版社.

        張肇誠,羅蘭格,李海華,等.1990a.中國震例(1976-1980)[M].北京:地震出版社.

        張肇誠,羅蘭格,李海華,等.1990b.中國震例(1981-1985)[M].北京:地震出版社.

        張肇誠,鄭大林,徐京華.1999.中國震例(1986-1988)[M].北京:地震出版社.

        張肇誠,鄭大林,徐京華.2000.中國震例(1989-1991)[M].北京:地震出版社.

        周必水,黃小克.2008.基于粗糙集的案例推理在網(wǎng)絡(luò)行為安全審計監(jiān)控中的應(yīng)用[J].計算機應(yīng)用與軟件,3(25):249-251.

        Pawlak Z.1982.Rough sets[J].International Journal of Information and Computer Science,11(5):341 -356.

        Robert H N.1987.Counter propagation Networks[C].USA:San Diego.

        Rumelhart D E,McClelland J L.1986.Parallel Distributed Processing:Explorations in the Microstructure of Cognition[M].Cambridge,MA:MIT Press.

        Skowron A,Stepaiuk J.1994.Decision Rules Based on Descrenibility Matrices and Decision Matrices[C].Califomia:San Jose,602 -609.

        Application of BP Neural Network Based on Rough Set in the Earthquake Case

        DONG Xiao-na1,SU Dao-lei2,LI Xi-liang1,QU Li1,ZHANG Hui-feng1,WU Chen1
        (1.Earthquake Administration of Shandong Province,Jinan 250014,Shandong,China)
        (2.Earthquake Administration of Jinan Municipality,Jinan 250001,Shandong,China)

        Firstly,using“China earthquake case”as data source,we built a fairly complete sample set for earthquake case study through preliminary analysis and pretreatment and introduced the combination of Rough Set and BP Neural Network to the earthquake case.Secondly,we selected the core abnormalities which plays a decisive role in final classification from a number of complex seismic anomaly indicators as the input by use of attribute reduction algorithm based on Rough Set,and took the discrete magnitude as the output.Furthermore,we built a generalized BP Neural Network model to simulate the uncertain relationship between the seismic anomaly and the earthquake.Finally,the result of simulation tests showed that the precision errors of earthquake magnitude prediction is between-0.5 and 0.5.

        Rough Set;Neural Network;study of earthquake cases;seismic anomaly indicator

        P315

        A

        1000-0666(2012)02-0251-09

        2011-10-09.

        中國地震局地震科技星火計劃項目 (XH1017)與山東省地震局合同制項目 (08Q08、09Q14、10Q10)聯(lián)合資助.

        本文的撰寫得到山東師范大學(xué)信息科學(xué)與工程學(xué)院段會川教授的悉心指導(dǎo),在此表示誠摯感謝!

        猜你喜歡
        震例約簡粗糙集
        基于Pawlak粗糙集模型的集合運算關(guān)系
        基于二進制鏈表的粗糙集屬性約簡
        云南地區(qū)定點形變觀測異常特征與地震預(yù)測研究
        地震研究(2018年1期)2018-11-05 08:46:40
        實值多變量維數(shù)約簡:綜述
        基于震例的測震學(xué)異常輔助判定系統(tǒng)
        中國地震(2017年1期)2017-09-04 09:54:18
        基于模糊貼近度的屬性約簡
        大華北M≥6.0級地震前視應(yīng)變研究
        多?;植诩再|(zhì)的幾個充分條件
        岫巖一號井水溫異常分析
        雙論域粗糙集在故障診斷中的應(yīng)用
        亚洲国产免费公开在线视频| 欧洲精品免费一区二区三区| 四月婷婷丁香七月色综合高清国产裸聊在线| 国产成人cao在线| 国产亚洲精品免费专线视频| 4455永久免费视频| 精品午夜福利无人区乱码一区| 中文不卡视频| 青青草视频免费在线播放| 国产亚洲aⅴ在线电影| 一个人看的视频www免费| 精品国产免费久久久久久| 国产精品久久一区二区蜜桃| 日韩av无码一区二区三区| 国产白丝无码视频在线观看| 成人永久福利在线观看不卡| 久久精品国产在热亚洲不卡| 亚洲av乱码一区二区三区按摩| 亚洲欧美综合在线天堂| 免费无码黄网站在线观看| 亚洲第一女人的天堂av| 精品久久久久久无码中文字幕| 狠狠色狠狠色综合| 日本一区二区高清视频在线播放| 一区二区三区最新中文字幕| 粉嫩虎白女毛片人体| 超碰日韩AV在线| 日本女优五十路中文字幕| 99麻豆久久久国产精品免费| 亚洲一区二区观看播放| 好看午夜一鲁一鲁一鲁| 亚洲国产精品国自产拍久久蜜av| 免费拍拍拍网站| 中文不卡视频| 亚洲一区二区综合精品| 麻豆tv入口在线看| 国产人成无码中文字幕| 精品奇米国产一区二区三区| 国产一区二区精品久久岳| 免费做爰猛烈吃奶摸视频在线观看| 国产一区二区三区视频大全|