孫振宇,彭蘇萍,鄒冠貴
(中國(guó)礦業(yè)大學(xué)(北京) 煤炭資源與安全開(kāi)采國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100083)
基于SVM算法的地震小斷層自動(dòng)識(shí)別
孫振宇,彭蘇萍,鄒冠貴
(中國(guó)礦業(yè)大學(xué)(北京) 煤炭資源與安全開(kāi)采國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100083)
為了提高小斷層解釋的準(zhǔn)確率,構(gòu)建基于支持向量機(jī)(SVM)算法的斷層自動(dòng)識(shí)別方法。通過(guò)分析構(gòu)造部位和非構(gòu)造部位地震屬性特征,建立SVM兩分類的斷層識(shí)別模型。首先,研究支持向量機(jī)兩分類算法的基本原理和結(jié)構(gòu),表明支持向量機(jī)在兩分類問(wèn)題上具有準(zhǔn)確率高的優(yōu)點(diǎn);然后建立斷層正演模型,分析不同地震屬性的斷層響應(yīng)特征,表明斷層分布與屬性值變化趨勢(shì)相關(guān);通過(guò)對(duì)支持向量機(jī)算法和正演模型的分析,表明利用地震屬性作為支持向量機(jī)的輸入,預(yù)測(cè)小斷層具有可行性。從疊后地震數(shù)據(jù)中提取方差、曲率等與斷層相關(guān)的屬性集合;通過(guò)相關(guān)性分析和聚類分析評(píng)估屬性,確定4種互相關(guān)性低的地震屬性。利用14口鉆井、3條巷道的地震屬性和斷層信息共606個(gè)數(shù)據(jù),選取400個(gè)作為訓(xùn)練樣本,構(gòu)造SVM斷層識(shí)別模型;206個(gè)數(shù)據(jù)作為測(cè)試樣本,進(jìn)行斷層識(shí)別,識(shí)別正確率達(dá)到98%。利用地震屬性建立的SVM斷層自動(dòng)識(shí)別模型,能夠有效識(shí)別小斷層,降低人為主觀因素的影響,縮短了解釋周期;鉆孔分布越均勻、數(shù)目越多,解釋精度就越高。
支持向量機(jī);斷層;自動(dòng)識(shí)別;地震屬性
常規(guī)的斷層解釋通過(guò)觀察地震剖面上振幅、相位和時(shí)差等特征識(shí)別斷層,由于小斷層在時(shí)間剖面上的變化微小,難以肉眼識(shí)別[1],解釋結(jié)果受到解釋人員主觀因素影響較大。地震屬性是地震數(shù)據(jù)通過(guò)數(shù)學(xué)計(jì)算得到的運(yùn)動(dòng)學(xué)、動(dòng)力學(xué)、幾何學(xué)及統(tǒng)計(jì)學(xué)特征。在構(gòu)造解釋,地層巖性解釋等領(lǐng)域得到了廣泛應(yīng)用[2],能夠解釋時(shí)間剖面難以解釋的小斷層。相干屬性與曲率屬性是與斷層密切相關(guān)的地震屬性,相干屬性使用相鄰地震道信號(hào)的相似性描述地層的橫向不均勻性,能表示地層的不連續(xù)性;地層曲率屬性反映地層受構(gòu)造應(yīng)力擠壓時(shí)層面彎曲的程度,曲率的絕對(duì)值越大,說(shuō)明彎曲程度越大,小構(gòu)造越發(fā)育[3-5]。相干體和曲率體都被用于解釋斷層,相干體常用于解釋發(fā)生錯(cuò)斷的斷層,而曲率體常用于解釋褶曲性的斷層,故某一種屬性只能解釋地質(zhì)現(xiàn)象的某一個(gè)方面。因此,采用多屬性融合識(shí)別斷層的方法既能避免單一屬性的局限性,也能解決人工解釋不能識(shí)別的小斷層問(wèn)題;多屬性融合的優(yōu)點(diǎn)是把大量的地震屬性信息整合在一起,可充分挖潛數(shù)據(jù)內(nèi)含信息,去除重復(fù)冗雜信息[6],提高斷層解釋的精度和效率。
支持向量機(jī)(Support Vector Machine,簡(jiǎn)稱SVM)為一種新型的模式分類方法[7],是使用最為廣泛的核學(xué)習(xí)算法,應(yīng)用于煤層氣和瓦斯涌出量預(yù)測(cè)[8-9]、煤層頂板導(dǎo)水?dāng)嗔褞Ц叨阮A(yù)測(cè)、底板突水量預(yù)測(cè)及突水危險(xiǎn)性評(píng)價(jià)[10-12]。支持向量機(jī)在解決小樣本、非線性及高維模式識(shí)別中表現(xiàn)出特有優(yōu)勢(shì),具有優(yōu)良的泛化能力并且對(duì)解決分類問(wèn)題和回歸問(wèn)題具有魯棒性。
巖體在構(gòu)造應(yīng)力的作用下發(fā)生破裂,破裂面兩側(cè)的巖體發(fā)生顯著位移或失去連續(xù)性或完整性,形成斷層[13]??臻g上與某一斷裂帶有關(guān)的高裂縫巖石變形區(qū)都可以稱為破碎帶[14],斷層破碎帶的規(guī)模與地質(zhì)條件有關(guān)。斷層破碎帶由于張應(yīng)力或擠壓力的作用,使破碎帶處巖石經(jīng)歷復(fù)雜的地質(zhì)作用,甚至破碎帶兩側(cè)巖體的物性發(fā)生變化,如巖石密度、硬度、孔隙度,出現(xiàn)斷層泥和斷層角礫巖等。由于斷層處的物性發(fā)生變化,其地震上的響應(yīng)也會(huì)發(fā)生一定變化,可以利用地震屬性,比如頻率、振幅、傾角等,分析這種地質(zhì)變化。圖1,建立的斷層正演模型參數(shù)如下:模型分為3層:上、下兩層為砂巖層,速度均為3 000 m/s,密度為2.7 g/cm3;中間為煤層,埋深300~330 m,速度為2 000 m/s,密度1.5 g/cm3,層厚為10 m。煤層含有4個(gè)斷層,其中2個(gè)為正斷層,2個(gè)為逆斷層,自左至右斷層落差分別為10,5,10,5 m,對(duì)應(yīng)地震道號(hào)為40,60,95和135道。模型地震道間距為1 m,震源為雷克子波,頻率60 Hz,采用垂直激發(fā),模型正演剖面,如圖2所示。
圖1 斷層模型Fig.1 Model of faults
圖2 斷層模型正演剖面Fig.2 Cross-section of fault forward modeling
圖3 各屬性與斷層的關(guān)系Fig.3 Relationship between attributes and faults
對(duì)上述的正演模型提取方差、走向曲率、信號(hào)嘈雜程度、反射強(qiáng)度、瞬時(shí)相位、瞬時(shí)頻率、傾角導(dǎo)數(shù)、傾角連續(xù)性、衰減系數(shù)以及最大振幅共10種地震屬性。在屬性數(shù)據(jù)上,有斷層則用‘1’表示,無(wú)斷層則用‘0’表示,構(gòu)成屬性值和斷層信息的數(shù)據(jù)集。將每種屬性值和斷層信息分別投到平面直角坐標(biāo)系中,由于每種屬性的數(shù)量級(jí)不同,為將這些屬性用同一坐標(biāo)系顯示,對(duì)每個(gè)屬性進(jìn)行歸一化處理。通過(guò)觀察屬性值變化和斷層信息變化的特征,可以看出:斷層信息大致隨屬性值的變化呈現(xiàn)一定的規(guī)律性(圖3),圖中“豎直虛線”表示有斷層存在。圖3(a)顯示:無(wú)論是正曲率還是負(fù)曲率,一定范圍內(nèi)無(wú)絕對(duì)值最大處有斷層存在;方差屬性值在一定范圍內(nèi)的最大值處,有斷層存在;一定的范圍內(nèi),混沌體數(shù)值大位置,有斷層存在;傾角偏差的局部極大值位置,存在斷層;傾角連續(xù)性絕對(duì)值的局部極大值位置,存在斷層;圖3(b)顯示:瞬時(shí)頻率在局部極小值位置,存在斷層;一般情況下,發(fā)生正負(fù)相位轉(zhuǎn)換的位置,存在斷層;衰減系數(shù)的局部最小值處,存在斷層;局部范圍內(nèi),反射強(qiáng)度最小的位置,存在斷層;最大振幅屬性的局部極小值的位置,存在斷層。
以上10種屬性都能識(shí)別物性或幾何形態(tài)的變化;但反過(guò)來(lái),地層物性變化和幾何形態(tài)變化,不一定是由斷層引起的。如圖3(a)中方差屬性的第95道是局部最大值有斷層,第85道也是局部最大值,但沒(méi)有斷層,所以單獨(dú)使用方差體,不能完全正確識(shí)別斷層。同一數(shù)據(jù)點(diǎn),兩個(gè)屬性識(shí)別的結(jié)果不同,說(shuō)明單一屬性識(shí)別存在多解性,而兩種屬性同時(shí)識(shí)別能夠有效的減少多解性。
通過(guò)對(duì)上述屬性與斷層分布的分析,可以看出10種屬性都與斷層存在一定的關(guān)系;同時(shí),單獨(dú)利用某一種屬性,存在多解性。因此,應(yīng)該綜合利用上述屬性,減少斷層預(yù)測(cè)的多解性,提高識(shí)別精度。
通過(guò)對(duì)斷層與地震屬性響應(yīng)特征的分析,可以知道地震屬性與斷層存在密切的關(guān)系,但是這些屬性可能與斷層有相似的關(guān)系,因此需要對(duì)屬性進(jìn)行評(píng)估。屬性評(píng)估的主要目標(biāo)是找到獨(dú)立的變量,標(biāo)記出相關(guān)性好的屬性。首先,沿著目的層T0波開(kāi)1個(gè)寬度為10 ms的時(shí)窗,提取上述的10個(gè)屬性,組成屬性集合;然后,計(jì)算各屬性的相關(guān)系數(shù),見(jiàn)表1。表1中的數(shù)值越大,兩個(gè)屬性的相關(guān)性越強(qiáng),即說(shuō)明兩種屬性與斷層的關(guān)系更加相似。這種數(shù)值方法,與在屬性剖面上通過(guò)視覺(jué)的定性解釋類似,但是由于是通過(guò)數(shù)值計(jì)算得到的,因此擁有更多的定量描述。對(duì)這些屬性進(jìn)行評(píng)估,可以降低潛在的偽相關(guān)性。偽相關(guān)性是偶然發(fā)生的相關(guān)性,不是真正的物理相關(guān)性。偽相關(guān)性出現(xiàn)的概率與用于分類的地震屬性的數(shù)量成正比,與數(shù)據(jù)控制點(diǎn)的數(shù)量成反比。為了把出現(xiàn)偽相關(guān)性的概率降到最低,應(yīng)盡量多地選擇樣本數(shù)量。數(shù)據(jù)評(píng)估的結(jié)果證明了一些地震屬性的密切關(guān)系,表明屬性集中的一些屬性需要剔除。
為了更進(jìn)一步的評(píng)估各屬性之間的相關(guān)關(guān)系,通過(guò)統(tǒng)計(jì)測(cè)試,進(jìn)行R型聚類分析,根據(jù)聚類分析的結(jié)果,選擇相互獨(dú)立的屬性,即關(guān)系較小的屬性。
屬性評(píng)估之后,從屬性集合中剔除無(wú)效的屬性完成屬性選擇,為了確定一個(gè)選擇有效屬性的客觀流程,需要制定一套屬性選擇的標(biāo)準(zhǔn):① 選擇有限個(gè)屬性,在分類中限制地震屬性的數(shù)目,降低偽相關(guān)性發(fā)生概率,這對(duì)識(shí)別斷層尤為重要;② 每個(gè)屬性都有一個(gè)突出的地質(zhì)意義,一些地震屬性受多個(gè)地質(zhì)因素的影響,但是確定每個(gè)屬性所代表的地質(zhì)意義是非常必要的,見(jiàn)表1;③ 每個(gè)屬性都是獨(dú)立統(tǒng)計(jì)的,通常情況下,相關(guān)性強(qiáng)的屬性是不能用來(lái)進(jìn)行分類的。相關(guān)性強(qiáng)的屬性共同組成一個(gè)屬性簇,因此每個(gè)屬性簇里只能選擇一個(gè)屬性。
表1各地震屬性的地質(zhì)意義
Table1Geologicalmeaningofsomeseismicattributes
地震屬性沉積環(huán)境結(jié)構(gòu)連續(xù)性斷層厚度走向曲率——瞬時(shí)頻率——方差—混沌體—瞬時(shí)相位——衰減系數(shù)—傾角偏差——反射強(qiáng)度——傾角連續(xù)性——最大振幅——
注:‘—’表示具有該地質(zhì)意義。
某一種地震屬性單獨(dú)識(shí)別斷層,具有多解性。因此需要綜合利用地震屬性共同識(shí)別斷層。該問(wèn)題可以看作二分類問(wèn)題,即將樣本分為‘?dāng)鄬印汀菙鄬印瘍深?每個(gè)取樣點(diǎn)的各個(gè)屬性為樣本特征,即每個(gè)樣本點(diǎn)由各屬性值組成,利用支持向量機(jī)能夠解決二分類問(wèn)題。利用已知斷層信息和選擇的地震屬性組成學(xué)習(xí)樣本,構(gòu)建支持向量機(jī)模型,對(duì)采區(qū)未知區(qū)域進(jìn)行斷層識(shí)別。
WTX+b≥0,di=+1
WTX+b<0,di=-1
圖4 非線性可分?jǐn)?shù)據(jù)映射到高維空間Fig.4 Non-linear data mapping to high-dimensional space
構(gòu)建支持向量機(jī)模型需要選擇合適的核函數(shù)參數(shù)g和懲罰參數(shù)c,使模型識(shí)別的準(zhǔn)確率達(dá)到要求。人工選擇這些參數(shù)需要不斷的改變參數(shù),對(duì)比準(zhǔn)確率,工作量很大,并且很難短時(shí)間內(nèi)找到最合適的參數(shù),利用粒子群算法來(lái)尋找最合適的參數(shù),可以做到自動(dòng)尋優(yōu)。
粒子群算法是一種模擬鳥類相互協(xié)作尋找食物的智能算法[20]。鳥類尋找食物,首先在個(gè)體飛行過(guò)程中找到距離食物最近的地方,同時(shí)和其他同伴交流,找到群體中最接近食物位置,不斷縮小與食物的距離,最后找到食物。在粒子群算法中,每個(gè)解決方案稱為粒子,通過(guò)最優(yōu)粒子解決問(wèn)題[21]。粒子群算法是基于群體的,不依賴個(gè)體的演化,而是根據(jù)對(duì)環(huán)境的適應(yīng)度,找到群體的最優(yōu)值。在一維空間中,某個(gè)個(gè)體的位置表示為xi,該個(gè)體運(yùn)動(dòng)過(guò)程中,適應(yīng)值最好的位置為pi,群體中所有個(gè)體中適應(yīng)值最好的位置為pg,個(gè)體的運(yùn)動(dòng)速度為vi,則對(duì)于每一代,個(gè)體的位置和速度將進(jìn)行以下變化:
vi=wvi+c1rand( )(pi-xi)+
其中,w為慣性權(quán)重;c1和c2為加速常數(shù);rand( )和Rand( )為在0到1范圍內(nèi)的隨機(jī)值。w保證在全局范圍內(nèi)尋優(yōu),c1使個(gè)體在自身運(yùn)動(dòng)中尋優(yōu),c2在群落中信息共享。尋優(yōu)時(shí),重復(fù)(1),(2)直到找到最優(yōu)適應(yīng)值或達(dá)到最大代數(shù)時(shí)停止。粒子群算法易實(shí)現(xiàn),收斂速度快,所以在許多領(lǐng)域都廣泛應(yīng)用,如人工神經(jīng)網(wǎng)絡(luò)的訓(xùn)練、函數(shù)優(yōu)化、模式識(shí)別[22]、數(shù)據(jù)挖掘中的優(yōu)化問(wèn)題等[23]。
利用學(xué)習(xí)樣本對(duì)支持向量機(jī)進(jìn)行訓(xùn)練,同時(shí)應(yīng)用粒子群算法尋找到最適合的參數(shù)c和g,使模型分類正確率最高,得到最優(yōu)支持向量機(jī)模型。利用構(gòu)建的支持向量機(jī)模型,進(jìn)行采區(qū)未知區(qū)域的斷層識(shí)別。
以羊東礦的2號(hào)煤層為例,通過(guò)區(qū)內(nèi)測(cè)井標(biāo)定該煤層,利用斯倫貝謝公司捐贈(zèng)我校的Petrel地震解釋軟件,解釋得到2號(hào)煤的層位;采區(qū)地震數(shù)據(jù)的面元為5 m×10 m,在解釋軟件中的面元為5 m×5 m,對(duì)采區(qū)地震數(shù)據(jù)提取上述10種地震屬性,形成采區(qū)屬性數(shù)據(jù);屬性數(shù)據(jù)同樣為5 m×5 m的網(wǎng)格,采區(qū)內(nèi)共48 000個(gè)數(shù)據(jù)點(diǎn);將鉆井處、巷道處的屬性值和斷層信息,匯總成網(wǎng)絡(luò)的樣本數(shù)據(jù)。采區(qū)內(nèi)共有鉆井14口、巷道3條;提取鉆井處2號(hào)煤層和巷道處的10種屬性值,其中巷道中除揭露的斷層外,每5 m一個(gè)采樣點(diǎn)提取屬性值,并記錄每個(gè)取樣點(diǎn)處,是否存在斷層,“存在”用‘1’表示,“不存在”用‘0’表示,共提取606個(gè)樣本數(shù)據(jù)。
分析樣本數(shù)據(jù),計(jì)算各屬性間的相關(guān)系數(shù),見(jiàn)表2;然后進(jìn)一步分析,利用R型聚類分析,評(píng)估各屬性間的相關(guān)性,如圖5所示??梢缘贸?方差、傾角連續(xù)性、混沌體的相關(guān)性較高;反射強(qiáng)度、瞬時(shí)頻率和最大振幅3種屬性的相關(guān)性高;根據(jù)相關(guān)系數(shù)的計(jì)算和R型聚類分析的結(jié)果,可知:方差、走向曲率、瞬時(shí)相位和最大振幅相關(guān)性較差,相對(duì)獨(dú)立,同時(shí)4種屬性都具有斷層的地質(zhì)意義。因此,選擇這4種屬性作為支持向量機(jī)的樣本。
表2地震屬性相關(guān)系數(shù)
Table2Correlationcoefficientsofseismicattributes
參數(shù)1234567891011-0.0743-0.0771-0.5490.0051-0.14310.04750.23430.68320.63822-0.07431-0.06310.23570.44090.06490.0540-0.1151-0.0127-0.14583-0.0771-0.063110.27940.03790.22320.0772-0.1420-0.1003-0.00154-0.54900.23570.27941-0.00500.37140.3575-0.2144-0.3505-0.513050.00510.44090.0379-0.005010.1327-0.39690.06830.06700.07756-0.14310.06490.22320.37140.132710.31740.0039-0.1985-0.031570.04750.05400.07720.3575-0.39690.317410.0746-0.19440.107880.2343-0.1151-0.1420-0.21440.06830.00390.074610.04910.258890.6832-0.0127-0.1003-0.35050.0670-0.1985-0.19440.049110.0987100.6382-0.1458-0.0015-0.51300.0775-0.03150.10780.25880.09871
注:1—方差;2—衰減系數(shù);3—走向曲率;4—反射強(qiáng)度;5—瞬時(shí)相位;6—最大振幅;7—瞬時(shí)頻率;8—傾角偏差;9—傾角連續(xù)性;10—混沌體。
圖5 R型聚類分析Fig.5 R cluster analysis1—方差;2—衰減系數(shù);3—走向曲率;4—反射強(qiáng)度;5—瞬時(shí)相位;6—最大振幅;7—瞬時(shí)頻率;8—傾角偏差;9—傾角連續(xù)性;10—混沌體
由于4種屬性的量綱不同,影響網(wǎng)絡(luò)訓(xùn)練結(jié)果,所以在訓(xùn)練之前,對(duì)樣本進(jìn)行歸一化處理,以消除量綱。從處理后的數(shù)據(jù)中,選出已知的606個(gè)樣本數(shù)據(jù),其中斷層樣本105個(gè),非斷層樣本501個(gè)。從樣本數(shù)據(jù)中選取400個(gè)數(shù)據(jù)作為訓(xùn)練樣本,206個(gè)樣本作為測(cè)試數(shù)據(jù)。
利用粒子群算法,把預(yù)測(cè)斷層的支持向量機(jī)模型的正確率作為適應(yīng)度函數(shù),將模型的懲罰參數(shù)c和核函數(shù)參數(shù)g作為待優(yōu)化參數(shù),優(yōu)化預(yù)測(cè)斷層的支持向量機(jī)模型。通過(guò)優(yōu)化得到進(jìn)化代數(shù)和適應(yīng)度關(guān)系的曲線(圖6),可知進(jìn)化到20代后最佳適應(yīng)度值就不再發(fā)生變化,此時(shí)最佳的懲罰參數(shù)c=70.644 6,核函數(shù)參數(shù)g=62.326 0。經(jīng)過(guò)訓(xùn)練后的支持向量機(jī)模型的權(quán)值向量為w=[5.634 6,-2.792 0,-1.004 3,-4.607 8]T,偏置b為0.007 9,對(duì)訓(xùn)練后的模型進(jìn)行測(cè)試,模型預(yù)測(cè)的正確率達(dá)到了98.54%(表3)。
圖6 進(jìn)化代數(shù)與適應(yīng)度關(guān)系Fig.6 Relationship between evolutionary algebra and fitness
預(yù)測(cè)錯(cuò)誤個(gè)數(shù)數(shù)據(jù)總個(gè)數(shù)正確率/%均方誤差(MSE)平方相關(guān)系數(shù)(R2)320698.540.01460.9291
利用支持向量機(jī),通過(guò)對(duì)采區(qū)的斷層預(yù)測(cè)分析,得到斷層預(yù)測(cè)模型中各屬性的權(quán)值,見(jiàn)表4。由表4可以得出:預(yù)測(cè)斷層的屬性因子中由幾何特征和信號(hào)特征主導(dǎo);瞬時(shí)相位等與運(yùn)動(dòng)特征相關(guān)的屬性相對(duì)來(lái)說(shuō)權(quán)值較小,對(duì)斷層預(yù)測(cè)結(jié)果的影響較小。
表4屬性因子權(quán)重分析
Table4Analysisofattributeweight
判別因子幾何特征方差走向曲率運(yùn)動(dòng)特征瞬時(shí)相位信號(hào)特征最大振幅權(quán)值5.6346-2.7920-1.0043-4.6078順序1342
圖7(a)為常規(guī)的振幅剖面,巷道揭露6個(gè)斷層,圖7箭頭所指的位置,巷道揭露A處斷層的落差為10~15 m,B處斷層落差為8~10 m,C處斷層的落差為4~5 m,D處斷層落差為3~4 m,E處斷層落差為7~8 m,F(xiàn)處斷層落差為6~7 m。利用訓(xùn)練好的支持向量機(jī),對(duì)該剖面進(jìn)行斷層識(shí)別,結(jié)果如圖7(b)所示。圖7(a)中斷層的位置,在支持向量機(jī)模型識(shí)別的結(jié)果中均有斷層,說(shuō)明模型識(shí)別具有很高的正確率。將支持向量機(jī)模型與常規(guī)剖面解釋、單屬性解釋的斷層分布情況進(jìn)行對(duì)比分析:常規(guī)剖面解釋如果僅利用同相軸的錯(cuò)斷、扭曲、分叉、相位轉(zhuǎn)換等斷層的標(biāo)志,2號(hào)煤層的4個(gè)斷層,只解釋出斷層A,B,E,F,這4個(gè)斷層的落差較大,而C處和D處的同相軸沒(méi)有錯(cuò)斷、扭曲等斷層的標(biāo)志出現(xiàn),落差較小,因而不能識(shí)別C,D這種落差小的不明顯斷層;而圖7(b)中將常規(guī)剖面不能識(shí)別的C,D處的斷層識(shí)別出來(lái),體現(xiàn)了支持向量機(jī)模型較常規(guī)剖面識(shí)別小斷層方面的優(yōu)越性。
圖7 支持向量機(jī)模型與常規(guī)解釋的斷層識(shí)別對(duì)比Fig.7 Comparison of SVM model with conventional interpretation
利用方差體屬性識(shí)別斷層,剖面中錯(cuò)斷型斷層均識(shí)別出來(lái),但因?yàn)镃處和D處沒(méi)有錯(cuò)斷,所以沒(méi)有方差值異常,顯示無(wú)斷層存在;利用走向曲率體屬性識(shí)別斷層,C處有顏色變化,說(shuō)明有斷層存在,但是D處沒(méi)有顏色變化,走向曲率值接近于0,依然不能識(shí)別D處的斷層;利用瞬時(shí)相位屬性識(shí)別斷層,D處位于兩個(gè)不同相位的分界處,同時(shí)D處前后取樣點(diǎn)的瞬時(shí)相位值分別為26.74和-35.58,瞬時(shí)相位發(fā)生反轉(zhuǎn),說(shuō)明有斷層存在。瞬時(shí)相位屬性將方差屬性與走向曲率屬性不能識(shí)別的D處斷層識(shí)別出來(lái),但是通過(guò)瞬時(shí)相位屬性剖面,很難直接看出斷層的分布情況和趨勢(shì)。通過(guò)對(duì)比,每個(gè)屬性在識(shí)別斷層方面各具優(yōu)勢(shì),但支持向量機(jī)模型能夠準(zhǔn)確、直觀地識(shí)別斷層,更重要的是能夠識(shí)別出落差3~5 m的小斷層。
總體來(lái)看,支持向量機(jī)模型綜合每種屬性的識(shí)別能力,具有識(shí)別準(zhǔn)確率高,斷層傾向明顯、直觀,能夠識(shí)別小斷層的特點(diǎn),有效減少了斷層解釋的多解性,這些特點(diǎn)是常規(guī)剖面解釋和單屬性斷層解釋所不能比擬的。
通過(guò)支持向量機(jī)模型識(shí)別斷層,得到采區(qū)斷層分布,如圖8所示,可以看出:向量機(jī)模型預(yù)測(cè)斷層相對(duì)連續(xù)。
圖8 模型預(yù)測(cè)與人工解釋對(duì)比Fig.8 Comparison between model prediction and manual interpretation
在圖8的A處,利用方差體、走向曲率、瞬時(shí)相位單屬性預(yù)測(cè)均無(wú)斷層特征,說(shuō)明無(wú)斷層存在;但利用最大振幅屬性預(yù)測(cè)有斷層存在。向量機(jī)模型預(yù)測(cè)結(jié)果表明A處存在斷層,與常規(guī)人工解釋的結(jié)果相同,同時(shí)與鉆井資料吻合。表明支持向量機(jī)模型能夠融合各個(gè)屬性的特征,從不同角度挖掘斷層信息,發(fā)揮各屬性的優(yōu)勢(shì)。
在圖8的B處,利用方差體、走向曲率單屬性預(yù)測(cè)無(wú)斷層,而瞬時(shí)相位和最大振幅單屬性預(yù)測(cè)存在斷層,但是利用向量機(jī)模型預(yù)測(cè)的結(jié)果B處沒(méi)有斷層,與常規(guī)人工解釋B處存在斷層的結(jié)果相悖。由于B處沒(méi)有鉆井,就是說(shuō)B處沒(méi)有鉆井提供學(xué)習(xí)樣本,使得向量機(jī)模型存在誤差。因此,提高支持向量機(jī)模型預(yù)測(cè)斷層的準(zhǔn)確率,除了模型本身的準(zhǔn)度之外,對(duì)鉆井的數(shù)量和分布情況也有一定的要求:首先,鉆井的數(shù)目不能過(guò)少。學(xué)習(xí)樣本越豐富,模型學(xué)習(xí)的斷層信息就越全面,預(yù)測(cè)斷層的效果就越接近實(shí)際情況;其次,鉆井的分布要均勻,這樣得到的學(xué)習(xí)數(shù)據(jù)具有代表性,能夠代表整個(gè)采區(qū)斷層的特征。
通過(guò)對(duì)比模型解釋和人工解釋的結(jié)果,兩者的差異不是很大,斷層的主要分布格局基本相同,貫穿全區(qū)的3條大斷層,基本吻合,只有一些規(guī)模較小的斷層不吻合。同時(shí),模型解釋與人工解釋相比縮短了解釋周期,該采區(qū)利用模型解釋從屬性數(shù)據(jù)處理、評(píng)估到模型訓(xùn)練、預(yù)測(cè)所用的時(shí)間不到人工解釋時(shí)間的一半。
綜合從剖面和平面兩個(gè)角度的分析對(duì)比:無(wú)論是常規(guī)斷層解釋,還是單屬性斷層識(shí)別,都無(wú)法識(shí)別出所有類型的斷層,但支持向量機(jī)模型能夠識(shí)別所有種類的斷層,同時(shí)還具有快速、準(zhǔn)確、直觀、識(shí)別小斷層等優(yōu)點(diǎn)。
(1)支持向量機(jī)模型融合了各屬性預(yù)測(cè)斷層的優(yōu)勢(shì),從不同角度挖掘斷層信息,較單屬性預(yù)測(cè)的結(jié)果更準(zhǔn)確,基本與人工解釋相吻合,降低了解釋人員主觀因素對(duì)解釋結(jié)果的影響。
(2)采區(qū)鉆井空間分布的密度及均勻情況都直接影響到模型預(yù)測(cè)的準(zhǔn)確率。鉆井分布越密集,越均勻,學(xué)習(xí)樣本就越豐富,越具有代表性,預(yù)測(cè)的結(jié)果準(zhǔn)確率就越高。若采區(qū)的鉆井或巷道信息較少,也可以考慮利用常規(guī)剖面上能夠確定的斷層,作為學(xué)習(xí)樣本,這樣可以增加學(xué)習(xí)樣本的豐富程度,提高模型預(yù)測(cè)的準(zhǔn)確率。
(3)方差、走向曲率與最大振幅是影響斷層預(yù)測(cè)的主導(dǎo)因素,權(quán)重分析驗(yàn)證了屬性選取的科學(xué)性。因此,可以通過(guò)權(quán)重分析反證屬性選擇的合理性。
(4)在構(gòu)建支持向量機(jī)模型時(shí),模型本身的結(jié)構(gòu),如輸入樣本種類多少、參數(shù)選擇、直接影響模型識(shí)別準(zhǔn)確率外,地震屬性的選擇更加重要。采區(qū)不同,斷層類型不同,選擇的地震屬性也會(huì)不同,因此,選擇哪些地震屬性,需要根據(jù)采區(qū)斷層的具體情況決定。
(5)支持向量機(jī)模型預(yù)測(cè)斷層工作周期較常規(guī)人工解釋大幅縮短,能更有效的指導(dǎo)生產(chǎn)工作,提高生產(chǎn)的效率。
[1] 董守華,石亞丁,汪洋.地震多參數(shù)BP人工神經(jīng)網(wǎng)絡(luò)自動(dòng)識(shí)別小斷層[J].中國(guó)礦業(yè)大學(xué)學(xué)報(bào),1997,26(3):14-18.
[2] 王開(kāi)燕,徐清彥,張桂芳,等.地震屬性分析技術(shù)綜述[J].地球物理學(xué)進(jìn)展,2013,28(2):815-823.
WANG Kaiyan,XU Qingyan,ZHANG Guifang,et al.Summary of seismic attribute analysis[J].Progress in Geophysics,2013,28(2):815-823.
[3] DI Haibin,GAO Dengliang.A new algorithm for evaluating 3D curvature and curvature gradient for improved fracture detection[J].Computer & Geosciences,2014,70:15-15.
[4] 杜文鳳,彭蘇萍.利用地震層曲率進(jìn)行煤層小斷層預(yù)測(cè)[J].巖石力學(xué)與工程學(xué)報(bào),2008,27(S1):2901-2906.
DU Wenfeng,PENG Suping.Seismic horizon curvature for predicting small fault in coalseam[J].Chinese Journal of Rock Mechanics and Engineering,2008,27(S1):2901-2906.
[5] 杜文鳳,彭蘇萍,黎咸威.基于地震層曲率體屬性預(yù)測(cè)煤層裂隙[J].煤炭學(xué)報(bào),2006,31(S0):30-33.
DU Wenfeng,PENG Suping,LI Xianwei.Seismic horizon curvature attribute for predicting coalseam fracture[J].Journal of China Coal Society,2006,31(S0):30-33.
[6] 李婷婷,王釗,馬世忠,等.地震屬性融合方法綜述[J].地球物理學(xué)進(jìn)展,2015,30(1):378-385.
LI Tingting,WANG Zhao,MA Shizhong,et al.Summary of seismic attributes fusion method[J].Progress in Geophysics,2015,30(1):378-385.
[7] LIN Shihwei,LEE Znejung,CHEN Shihchieh,et al.Parameter determination of support vector machine and feature selection using simulated annealing approach[J].Applied Soft Computing,2008,8:1505-1512.
[8] 李艷芳,程建遠(yuǎn),王成.基于支持向量機(jī)的地震屬性優(yōu)選及煤層氣預(yù)測(cè)[J].煤田地質(zhì)與勘探,2012,40(6):75-78.
LI Yanfang,CHENG Jianyuan,WANG Cheng.Seismic attribute optimization based on support vector machine and coalbed methane prediction[J].Coal Geology & Exploration,2012,40(6):75-78.
[9] 邵良杉,張宇.基于小波理論的支持向量機(jī)瓦斯涌出量的預(yù)測(cè)[J].煤炭學(xué)報(bào),2011,36(S1):104-107.
SHAO Liangshan,ZHANG Yu.Mine gas gushing forecasting based on wavelet theory support vector machine[J].Journal of China Coal Society,2011,36(S1):104-107.
[10] 孫云普,王云飛,鄭曉娟.基于遺傳-支持向量機(jī)法的煤層頂板導(dǎo)水?dāng)嗔褞Ц叨鹊姆治鯷J].煤炭學(xué)報(bào),2009,34(12):1610-1615.
SUN Yunpu,WANG Yunfei,ZHENG Xiaojuan.Analysis the height of water conducted zone of coal seam roof based on GA-SVR[J].Journal of China Coal Society,2009,34(12):1610-1615.
[11] 曹慶奎,趙斐.基于遺傳-支持向量機(jī)的煤層底板突水量預(yù)測(cè)研究[J].煤炭學(xué)報(bào),2011,36(12):2097-2101.
CAO Qingkui,ZHAO Fei.Forecast of water inrush quantity from coal floor based on genetic algorithm-support vector regression[J].Journal of China Coal Society,2011,36(12):2097-2101.
[12] 施龍青,譚希鵬,王娟,等.基于PCA_Fuzzy_PSO_SVC的底板突水危險(xiǎn)性評(píng)價(jià)[J].煤炭學(xué)報(bào),2015,40(1):167-171.
SHI Longqing,TAN Xipeng,WANG Juan,et al.Risk assessment of water inrush based on PCA_Fuzzy_PSO_SVC[J].Journal of China Coal Society,2015,40(1):167-171.
[13] 羅勝元,何生,王浩.斷層內(nèi)部結(jié)構(gòu)及對(duì)封閉性的影響[J].地球科學(xué)進(jìn)展,2012,27(2):151-164.
LUO Shengyuan,HE Sheng,WANG Hao.Review on fault internal structure and the influence on fault sealing ability[J].Advances in Earth Science,2012,27(2):151-164.
[14] KIM Y S,PEACOCK D C P,SANDERSON D J.Mesoscale strike-slip faults and damage zones at Marsalforn,Gozo Island,Malta[J].Journal of Structural Geology,2003,25(5):793-812.
[15] SAMMA H,LIM C P,SALEH J M,et al.A memetic-based fuzzy support vector machine model and its application to license plate recognition[J].Memetic Computing,2016,8:235-251.
[16] LIN Shihwei,LEE Znejung,CHEN Shihchieh.Particle swarm optimization for parameter determination and feature selection of support vector machines[J].Expert Systems with Applications,2008,35:1817-1824.
[17] BARATI Masoud,SHARIFIAN Saeed.A hybrid heuristic-based tuned support vector regression model for cloud load prediction[J].The Journal of Supercomputing,2015,71:4235-4259.
[18] CHENG W Y,JUANG C F.An incremental support machine-trained TS-type fuzzy system for online classification problems[J].Fuzzy Sets and Systems,2011,163:24-44.
[19] HONG W C.Chaotic particle swarm optimization algorithm in a support vector regression electric load forecasting model[J].Energy Conversion and Management,2009,50:105-117.
[20] 賈義鵬,呂慶,尚岳全.基于粒子群算法和廣義回歸神經(jīng)網(wǎng)絡(luò)的巖爆預(yù)測(cè)[J].巖石力學(xué)與工程學(xué)報(bào),2013,32(2):343-348.
JIA Yipeng,Lü Qing,SHANG Yuequan.Rockburst prediction using particle swarm optimization algorithm and general regression neural network[J].Chinese Journal of Rock Mechanics and Engineering,2013,32(2):343-348.
[21] KUO R J,WANG M J,HUANG T W.An application of particle swarm optimization algorithm to clustering analysis[J].Soft Computing,2011,15:533-542.
[22] BONYADI M R,MICHALEWICZ Z,LI Xiaodong.An analysis of the velocity updating rule of the particle swarm optimization algorithm[J].Journal of Heuristics,2014,20:417-452.
[23] 劉建華.粒子群算法的基本理論及其改進(jìn)研究[D].長(zhǎng)沙:中南大學(xué),2009:8-9.
LIU Jianhua.The research of basic theory and improvement on particle swarm optimization[D].Changsha:Central South University,2009:8-9.
AutomaticidentificationofsmallfaultsbasedonSVMandseismicdata
SUN Zhenyu,PENG Suping,ZOU Guangui
(StateKeyLaboratoryofCoalResourcesandSafeMining,ChinaUniversityofMiningandTechnology(Beijing),Beijing100083,China)
In order to improve the seismic identification accuracy of small fault,an automatic fault recognition method based on support vector machine (SVM) is constructed.The fault identification model of SVM two classification was established by analyzing the characteristics of seismic attributes of tectonic and non-tectonic sites.Firstly,the basic principle and structure of the algorithm about SVM two classification were studied.It showed that SVM has the advantages of high accuracy in two classification problems.Then,a fault forward model was established to analyze the fault response characteristics of different seismic attributes,indicating that the fault distribution is related to the trend of the attribute value.By analyzing the SVM and forward model,it showed that it is feasible to use the seismic attribute as learning modules to predict small faults.A set of attributes related to faults,such as variance and curvature,was extracted from the post-stack seismic data.Four attributes with low correlation were determined by correlation and cluster analysis.Among total 606 data that consisted of the faults and attributes information from 14 drillings and 3 tunnels,400 data were used as training samples and constructed SVM fault identification model.The authors used 206 data as test samples to identify faults.The correct rate is 98%.The SVM fault identification established by seismic attributes can effectively identify faults,reduce the influence of human subjective factors,and shorten the time of interpretation.The more uniform the drilling distribution,the more the number,the higher the interpretation accuracy.
support vector machine;faults;automatic identification;seismic attributes
孫振宇,彭蘇萍,鄒冠貴.基于SVM算法的地震小斷層自動(dòng)識(shí)別[J].煤炭學(xué)報(bào),2017,42(11):2945-2952.
10.13225/j.cnki.jccs.2017.0972
SUN Zhenyu,PENG Suping,ZOU Guangui.Automatic identification of small faults based on SVM and seismic data[J].Journal of China Coal Society,2017,42(11):2945-2952.doi:10.13225/j.cnki.jccs.2017.0972
P631.4
A
0253-9993(2017)11-2945-08
2017-07-14
2017-09-22責(zé)任編輯韓晉平
國(guó)家自然科學(xué)基金青年基金資助項(xiàng)目(41402143);國(guó)家重點(diǎn)研發(fā)計(jì)劃資助項(xiàng)目(2016YFC0501102);國(guó)家科技重大專項(xiàng)資助項(xiàng)目(2016ZX05066001-001)
孫振宇(1991—),男,吉林松原人,碩士研究生。E-mail:szy93126@126.com。
彭蘇萍(1959—),男,江西萍鄉(xiāng)人,中國(guó)工程院院士。E-mail:psp@cumtb.edu.cn