陳鋼花, 王軍, 程探探, 隋淑玲, 黃麗娜
(1.中國石油大學(xué)(華東), 山東 青島 266580; 2.中國石油化工股份有限公司勝利油田分公司地質(zhì)科學(xué)研究院, 山東 東營 257015; 3.山東科瑞石油工程技術(shù)研究院, 山東 東營 257067)
砂礫巖體在沉積過程中受水流能量和物源供給的影響,使得沉積旋回變化頻繁,巖性變化快,具有非常強(qiáng)的非均質(zhì)性和各向異性,造成砂礫巖體地質(zhì)特征和測井響應(yīng)之間的關(guān)系不再是單純的線性關(guān)系,導(dǎo)致測井儲層評價困難;砂礫巖體巖性對儲層物性、含油性影響較大,準(zhǔn)確劃分巖性對計算儲層參數(shù)、評價儲層含油性都具有非常重要的意義。利用傳統(tǒng)的統(tǒng)計方法可以劃分出儲層與非儲層,對于復(fù)雜砂礫巖體則很難精確劃分[1]。
支持向量機(jī)的基本思想是通過使用非線性映射將低維輸入空間的樣本映射到高維屬性空間使其變?yōu)榫€性情況,使得在高維屬性空間采用線性算法對樣本的非線性進(jìn)行分析成為可能[2-3]。其中核函數(shù)的選取和參數(shù)優(yōu)化對回歸模型的精度起到?jīng)Q定性的作用。粒子群算法PSO(Particle Swarm Optimization)和遺傳算法相似,是從隨機(jī)解出發(fā),通過迭代尋找最優(yōu)解。這種算法相比于遺傳算法具有實(shí)現(xiàn)容易、精度高、收斂快的優(yōu)點(diǎn)。本文針對砂礫巖地層巖性變化大、非均質(zhì)性強(qiáng)、常規(guī)測井曲線的影響因素多、砂礫巖地層地質(zhì)特征與測井曲線呈現(xiàn)非線性關(guān)系等特點(diǎn),采用支持向量機(jī)方法對地層巖性進(jìn)行劃分。選用粒子群算法對支持向量機(jī)(SVM)參數(shù)進(jìn)行優(yōu)化,得到巖性識別模型;根據(jù)模型對研究區(qū)的30多口井的巖性進(jìn)行劃分,取得良好的地質(zhì)應(yīng)用效果。
在SVM的實(shí)際應(yīng)用中涉及到參數(shù)選取問題。這些參數(shù)對分類器的分類效果具有很大的影響,直接關(guān)系到分類器分類效果。通常,需要優(yōu)選的2個參數(shù)是核函數(shù)參數(shù)γ和懲罰因子C。
參數(shù)優(yōu)選的原則是尋求一組最優(yōu)參數(shù),使訓(xùn)練得到的支持向量機(jī)對測試樣本的分類預(yù)測準(zhǔn)確率最高。本文采用k折交叉驗(yàn)證方法獲得較為穩(wěn)定的預(yù)測正確率。具體實(shí)現(xiàn)過程是將訓(xùn)練數(shù)據(jù)分成k個子集(一般是均分),先用其中(k-1)個子集作為訓(xùn)練樣本得到一個SVM,用剩下的子集作為測試集,測試該分類器的分類準(zhǔn)確率。如此循環(huán)進(jìn)行k次,直到所有子集都作為測試樣本被預(yù)測一遍,最終取該k次預(yù)測所得準(zhǔn)確率的平均值作為最終的準(zhǔn)確率值。實(shí)際操作時,k一般取5~10。本文采用粒子群算法對參數(shù)γ和C進(jìn)行優(yōu)選。
PSO算法[4]是根據(jù)鳥群覓食的規(guī)律演化出來的一種算法。PSO算法中的每一個粒子都是這個空間中的一個解。根據(jù)自己和同伴覓食的經(jīng)驗(yàn)選擇不同的飛行方向。所有的粒子都有一個被優(yōu)化的函數(shù)決定的適應(yīng)值,每個粒子都有一個速度決定該粒子的飛行距離和方向。然后粒子們就追尋當(dāng)前的最優(yōu)粒子在空間內(nèi)尋找最優(yōu)位置,每個粒子在飛行過程中所經(jīng)歷過的最好位置,就是粒子本身找到的最優(yōu)解:整個種群所經(jīng)歷過的最優(yōu)位置,就是整個種群到目前為止找到的最優(yōu)解。單個粒子的最優(yōu)位置被稱為個體極值,整個種群的最優(yōu)位置叫作全局極值。每個粒子都通過上述的2個極值不斷更新自己的位置和速度,從而產(chǎn)生新一代群體。
利用PSO算法約束優(yōu)化問題其關(guān)鍵在于如何處理好約束,即解的可行性?;赑SO算法的約束優(yōu)化工作主要分為2類:①懲罰函數(shù),旨在解放優(yōu)化問題的約束限制;②將粒子群的搜索范圍都限制在條件約束簇內(nèi),即在可行解范圍內(nèi)尋優(yōu)。
據(jù)文獻(xiàn)介紹,Parsopoulos等[5]運(yùn)用粒子群算法與遺傳算法同時求解同一問題,仿真結(jié)果顯示PSO算法相對遺傳算法更具有優(yōu)越性;Hu等[6]采用可行解保留政策處理約束,即一方面更新存儲中所有粒子時僅保留可行解,另一方面在初始化階段所有粒子均從可行解空間取值;Ray等[7]提出了具有多層信息共享策略的粒子群原理處理約束,根據(jù)約束矩陣采用多層Pareto排序機(jī)制產(chǎn)生優(yōu)良粒子,進(jìn)而用一些優(yōu)良的粒子決定其余個體的搜索方向。
圖1 粒子群算法適應(yīng)度曲線圖
應(yīng)用粒子群算法進(jìn)行SVC參數(shù)預(yù)測時先設(shè)置核函數(shù)γ和懲罰因子C的初始值,一般取值范圍是0~1 000,種群大小值是20,最大的進(jìn)化代數(shù)是50。利用這種方法得到的最優(yōu)的核函數(shù)和懲罰因子參數(shù)值為γ=13.5987、C=45.3724,對應(yīng)的驗(yàn)證準(zhǔn)確率為98.943%,測試數(shù)據(jù)的準(zhǔn)確率為83.562%。粒子群算法適應(yīng)度變化的趨勢見圖1。 通過對比粒子群算法和遺傳算法,兩者的準(zhǔn)確度都較高,回判準(zhǔn)確率達(dá)到95%以上,測試準(zhǔn)確率也非常高。從算法的運(yùn)行過程中發(fā)現(xiàn),粒子群算法的運(yùn)行時間要比遺傳算法的運(yùn)行時間短,所以最終選擇粒子群優(yōu)化算法對SVM參數(shù)進(jìn)行優(yōu)選。
采用支持向量機(jī)進(jìn)行砂礫巖體巖性識別,其關(guān)鍵是把測井信息與砂礫巖體巖性之間的非線性關(guān)系映射到多維空間的線性問題進(jìn)行求解,所以首先要給定訓(xùn)練樣本集對測井信息進(jìn)行學(xué)習(xí),以便得到解釋模型。訓(xùn)練樣本集選取的好壞直接影響到訓(xùn)練結(jié)果和預(yù)測模型的準(zhǔn)確程度。訓(xùn)練樣本選取應(yīng)注意:①選出研究區(qū)各種巖性及相同巖性不同測井響應(yīng)的樣本;②剔除個別異常樣本點(diǎn);③適當(dāng)控制樣本點(diǎn)個數(shù);④要對所選的樣本集進(jìn)行歸一化處理,消除測井參數(shù)量綱不一致對訓(xùn)練結(jié)果造成的影響。
選取反映砂礫巖體巖性的自然電位(SP)、自然伽馬(GR)、聲波時差(AC)、補(bǔ)償中子(CNL)、地層密度(DEN)、電阻率(Rt)等6種測井參數(shù)作為輸入?yún)?shù),砂礫巖地層的巖性編碼作為輸出參數(shù)。對砂礫巖地層巖性進(jìn)行預(yù)測。共選取了729個樣本,其中656個樣本用于訓(xùn)練建模,73個樣本用于測試。
為了對比粒子群算法優(yōu)化支持向量機(jī)參數(shù)對巖性判別的準(zhǔn)確性,本文同時采用了遺傳算法對支持向量機(jī)參數(shù)進(jìn)行優(yōu)選。對比結(jié)果如表1所示。從表1中數(shù)據(jù)可以看出粒子群算法的優(yōu)化精度高于遺傳算法,程序運(yùn)行粒子群算法需要自己手動調(diào)節(jié)的參數(shù)要少于遺傳算法,同時,粒子群算法達(dá)到同樣的精度所需時間明顯縮短。采用該種方法對支持向量機(jī)參數(shù)進(jìn)行優(yōu)選對砂礫巖地層的巖性進(jìn)行預(yù)測具有很好的可行性。
將研究區(qū)塊砂礫巖儲層的巖性統(tǒng)計歸類為15種,對656個訓(xùn)練樣本進(jìn)行回判,其中有645個樣本驗(yàn)判正確,回判準(zhǔn)確率為98.323%。取73個樣本作為測試樣本,正確的樣本個數(shù)為61個, 測試準(zhǔn)確率為83.562%,取得了理想的應(yīng)用結(jié)果。利用該算法對研究區(qū)30多口井進(jìn)行了處理,取得良好的地質(zhì)應(yīng)用效果。圖2為研究區(qū)某井的巖性劃分效果圖。
表1 粒子群算法與遺傳算法結(jié)果比較表
注:1—泥巖;2—砂質(zhì)泥巖;3—含礫泥巖;4—泥質(zhì)砂巖;5—砂巖;6—含礫砂巖;7—礫狀砂巖;8—含泥中礫巖;9—含砂細(xì)礫巖;10—含砂中礫巖;11—含砂粗礫巖;12含砂礫巖;13—細(xì)礫巖;14—中礫巖;15—粗礫巖。
圖2 基于粒子群優(yōu)化算法對砂礫巖地層巖性劃分示意圖
(1) 針對砂礫巖體巖性復(fù)雜多變、非均質(zhì)性強(qiáng)、地層地質(zhì)特征與測井響應(yīng)之間不再是單純的線性關(guān)系的特點(diǎn),從尋找常規(guī)測井曲線和砂礫巖體巖性的相關(guān)性出發(fā),建立常規(guī)測井曲線和砂礫巖體巖性的統(tǒng)一關(guān)系,最終達(dá)到利用常規(guī)測井曲線識別巖性的目的。
(2) 對于砂礫巖體巖性與測井響應(yīng)之間的非線性關(guān)系,采用支持向量機(jī),把非線性的問題轉(zhuǎn)化到高維的線性問題,從而求得測井響應(yīng)與巖性的最優(yōu)對應(yīng)關(guān)系。
(3) 根據(jù)粒子群算法的精度高、收斂快、容易實(shí)現(xiàn)等優(yōu)點(diǎn),采用粒子群算法對支持向量機(jī)的參數(shù)進(jìn)行優(yōu)選,能夠精確劃分砂礫巖體的巖性。
參考文獻(xiàn):
[1] 陳鋼花, 王有濤, 董維武, 等. 深層砂礫巖儲層測井精細(xì)評價 [J]. 海洋石油, 2010(2): 82-86.
[2] 趙宇, 王志良, 劉冀偉. 一種基于支持向量機(jī)的測井巖性預(yù)測新方法 [J]. 微計算機(jī)信息, 2004, 20(6).
[3] 李新虎, 基于不同測井曲線參數(shù)集的支持向量機(jī)巖性識別對比 [J]. 煤田地質(zhì)與勘探, 2007(3): 72-76.
[4] 楊維, 李歧強(qiáng). 粒子群優(yōu)化算法綜述 [J]. 中國工程科學(xué), 2004, 6(5).
[5] Parsopoulos K E, Vrahatis M. N. Particle Swarm Optimization Method in Multiobjective Problems [C]∥Proceedings of the 2002 ACM Symposium on Applied Computing (SAC 202) 2002: 603-607.
[6] Hu X, Eberhart R C. Multiobjective Optimization Using Dynamic Neighborhood Particle Swarm Optimization [C]∥Proceedings of the IEEE World Congress on Computational Intelligence, Hawaii, USA, 2002: 1666-1670
[7] Ray T, Liew K M. A Swarm Metaphor for Multiobjective Design Optimization [J]. Eng Opt, 2002, 34(2): 141-153.