楊玲
摘 要: 地層劃分是一個復雜的非線性系統(tǒng),根據(jù)地層結(jié)構(gòu),本文提出了一種基于SVM(支持向量機)的劃分方法。該方法利用同一區(qū)域地質(zhì)結(jié)構(gòu)相似、地質(zhì)結(jié)構(gòu)有序連續(xù)的特征,使用有序?qū)W習多分類模型,以高斯核函數(shù)為核函數(shù),建立了地層自動分層模型,最終得到樣本空間的分類結(jié)果。實驗結(jié)果表明,按照所提方法訓練出的SVM可以很好地劃分同一區(qū)域內(nèi)其他井的地層,有效地提高地層劃分的效率。
關(guān)鍵詞: 地層劃分;SVM;高斯核函數(shù)
0 引言
地層劃分的目的是把地層由上至下切割成不同的片段,劃分出不同等級的地層單位,即把一個地區(qū)的地層進行縱向劃分,以便與地質(zhì)單層相對應。目前采用的方法主要有人工解釋方法,數(shù)理統(tǒng)計方法和人工智能方法。
人工解釋的方法對測井曲線進行分層,該方法不僅費時費力,而且分層取值過程中受測井分析人員的經(jīng)驗知識和熟練程度影響較大,主觀性較強;數(shù)理統(tǒng)計方法能夠保持巖層內(nèi)部的均一性,但計算量比較大,同時對測井信息和地質(zhì)信息的一一對應有很高的要求,如果達不到(事實上也無法完全做到一一對應),則分層結(jié)果不易達到地質(zhì)應用的要求。人工智能是一種現(xiàn)代化方法,主要有神經(jīng)網(wǎng)絡(luò)和機器學習等,其具有較好地學習和自適應能力,但在地質(zhì)分層應用中目前仍處于探索階段。
本文采用SVM機器學習方法對測井曲線進行地層劃分,以同一區(qū)域已有的分層井數(shù)據(jù)變化特點為切入點,結(jié)合每口井測井曲線數(shù)據(jù)以及代表地層特性測井曲線數(shù)據(jù)的變化特點,建立合理的數(shù)學模型,實現(xiàn)自動分層。實踐證明,根據(jù)實際問題合理選擇二類分類模型和核函數(shù),SVM方法對于測井曲線劃分是行之有效的。
1 SVM簡介
SVM方法是建立在統(tǒng)計學習理論基礎(chǔ)上的機器學習方法,其目的在于尋找一個超平面H(d),該超平面可以將訓練集中的數(shù)據(jù)分開,且與類域邊界的沿垂直于該超平面方向的距離最大,故SVM法亦被稱為最大邊緣(Maximum Margin)算法。通過學習算法,SVM可以自動尋找出那些對分類有較好區(qū)分能力的支持向量,構(gòu)造出的分類器可以最大化識別類與類的間隔,因而有較好的適應能力和較高的分準率。目前,構(gòu)造SVM多類分類器的方法主要有兩類:一類是直接法,直接在目標函數(shù)上進行修改,將多個分類面的參數(shù)求解合并到一個最優(yōu)化問題中,通過求解該最優(yōu)化問題“一次性”實現(xiàn)多類分類。這種方法看似簡單,但其計算復雜度比較高,實現(xiàn)起來比較困難,只適合用于小型問題;另一類是間接法,主要是通過組合多個二分類器來實現(xiàn)多分類器的構(gòu)造,常見的方法有一對多法和一對一法兩種。不同的構(gòu)造方法訓練時需要的分類器個數(shù)不同,實際應用時,可根據(jù)問題背景選擇合適的分類方法。
2 SVM測井曲線分層
測井曲線分層是通過多條測井曲線數(shù)據(jù)對地層進行劃分的過程,由于地層具有連續(xù)性且在同一區(qū)域內(nèi)地質(zhì)特征相似,而對某采樣點進行分類時,其只可能屬于兩個連續(xù)地層中的某一層,因此測井曲線分層可以歸為有序多分類問題。
2.1 設(shè)計多類分類模型
對測井曲線分層,采用優(yōu)化的一對一的方法,將多類問題轉(zhuǎn)化為二類問題。按照地層順序,建立N-1個相鄰地層的二類模型。
已知測井曲線數(shù)據(jù)X={Xij}r×s,r為樣本個數(shù);地層分類L={li}n×1,N為地層個數(shù)。將X按照已知的分層結(jié)果分為N個子集:Xl,l=1,2,...,N,按照順序依次建立Xl和Xl+1的二類模型。
2.2 分層模型
對測井曲線分層,重點是尋找地層分層界面。但是由于地質(zhì)的隨機性、復雜性和不可預見性,單獨一個或幾個采樣點并不能代表某一連續(xù)區(qū)域的地質(zhì)特征。因此,需在一定區(qū)域內(nèi)多達幾十個、甚至幾百個的連續(xù)采樣點的二分類基礎(chǔ)上做進一步分析。尋找出分類結(jié)果的分類面從而確定出地層的分界面。
假設(shè)已知連續(xù)樣本集X={xij}m*s,為l和l+1層的樣本點,其中m為樣本個數(shù);l和l+1的分界樣本點為Xt,t∈{1,2,...,m}。
由二類模型的決策函數(shù)f(X)=sgn(g(X)),可以計算得到Y(jié)={yi}m*1,其中Yi∈{+1,-1}。假設(shè)Xt為兩類分類面,由于二類分類問題存在錯判的情況,只能保證Y={yi},y=1,2,...,t中大部分應該為+1,而Yl+1={yi},i=t,t+i,...,m中大部分應該為-1。此時,為了得到分界點Xt,需要求解如下模型:
但是根據(jù)上述假設(shè),需要確定樣本集X可以被分為兩類,因此可以增加約束條件:
其中C∈{0,1,...m/4}為兩類樣本個數(shù)的差值的閥值,根據(jù)樣本個數(shù)可以適當選擇數(shù)值。
2.3 曲線分層
由于每次只能對連續(xù)兩層的樣本數(shù)據(jù)進行分類,因此采用循環(huán)步進的方式實現(xiàn)分層,流程如圖1所示。
每次從樣本集中選擇連續(xù)的t個樣本點,根據(jù) l 和 l+1 層的學習結(jié)果進行分類,則可能有三種結(jié)果:第一種大部分為 l 層,則向前步進選取新的 t 個樣本點;第二種大部分為 l+1 層,則退回上層分層線重新選取新的 t 個樣本點,并更新l=l+1;第三種兩層點比較均衡,此時通過分層模型確定分層界面。循環(huán)上述步驟,直到分層結(jié)束。
3. 結(jié)果比較與分析
首先對樣本井進行學習并對其進行自動分層,然后根據(jù)樣本井的學習結(jié)果對 B-D 號井進行自動分層,人工與自動分層結(jié)果比較如表4-1.
表 4-1 B-D 號井分層結(jié)果比較
由實驗結(jié)果可知,與人工解釋方法相比,SVM應用于測井曲線自動分層效果良好,在測井數(shù)據(jù)較少的情況下也可以很好的實現(xiàn)分層,大大提高了工作效率,并減少了人為主觀性及經(jīng)驗性對分層結(jié)果的影響。
參考文獻
[1] Hsu C W, Lin C J. A comparison of methods for multi-class support vector machines. IEEE Transactions on Neural Networks. 2002.