王鵬,王志章,紀(jì)友亮,段文浩,潘潞
(1.中國(guó)石油大學(xué)(北京)油氣資源與探測(cè)國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京102249;2.中國(guó)石油煤層氣有限責(zé)任公司,北京100028)
對(duì)于火山巖[1-4]巖性識(shí)別,測(cè)井交會(huì)圖是巖性識(shí)別常用的方法,國(guó)外Sanyal等[5]通過(guò)利用測(cè)井曲線繪制直方圖和交會(huì)圖的方法識(shí)別流紋巖、玄武巖以及凝灰?guī)r。斯倫貝謝公司[6]的ECS元素測(cè)井能從巖石成分角度解決火山巖巖性識(shí)別所存在的困難,但其價(jià)格昂貴,實(shí)際應(yīng)用不多,常常只被作為地區(qū)識(shí)別的標(biāo)志性資料。中國(guó)目前通?;跍y(cè)井資料和地震資料,利用交會(huì)圖法[7-8]、聚類(lèi)分析[9]、模糊數(shù)學(xué)[10]、神經(jīng)網(wǎng)絡(luò)[11-12]、支持向量機(jī)[13]等方法進(jìn)行火山巖巖性識(shí)別。但由于識(shí)別方法本身?xiàng)l件的限制,使得交會(huì)圖方法對(duì)于在實(shí)際應(yīng)用中不具備線性可分條件的復(fù)雜火山巖巖性識(shí)別變得困難;聚類(lèi)分析方法只有在訓(xùn)練樣本趨于無(wú)窮大時(shí),其性能才能在理論上得以保證;神經(jīng)網(wǎng)絡(luò)的最優(yōu)參數(shù)和最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)確定沒(méi)有較好的方法,且易于陷入過(guò)度擬合,并且泛化能力不夠理想;支持向量機(jī)中加入了懲罰參數(shù),即當(dāng)有些點(diǎn)是誤判的時(shí)候,加入懲罰參數(shù)來(lái)進(jìn)行更正,這樣對(duì)一些奇異值點(diǎn)不容易進(jìn)行分析。
基于國(guó)內(nèi)外研究現(xiàn)狀和目前常用識(shí)別方法存在的局限性,將核Fisher(KFDA)判別分析方法應(yīng)用于火山巖巖性識(shí)別中。該技術(shù)在油氣儲(chǔ)層預(yù)測(cè)以及儲(chǔ)層流體識(shí)別方面取得了良好的效果[14-16],但針對(duì)火山巖儲(chǔ)層的巖性識(shí)別方面還未開(kāi)展深入研究。據(jù)此,根據(jù)研究區(qū)8口井的349個(gè)薄片數(shù)據(jù)信息,從8口井隨機(jī)選取70%的樣本點(diǎn)參與KFDA的模型建立,剩余30%的樣本點(diǎn)用于進(jìn)行檢驗(yàn)。與支持向量機(jī)(SVM)、BP神經(jīng)網(wǎng)絡(luò)和Fisher(FDA)方法識(shí)別巖性的正確率進(jìn)行比較,KFDA判別正確率較高,在圖形化顯示方面,直觀性更強(qiáng)是一種新的有效識(shí)別火山巖巖性的方法。
核Fisher(KFDA)判別分析是在Fisher(FDA)判別分析基礎(chǔ)上發(fā)展起來(lái)的一種非線性方法,該方法是Mika等將核方法引入Fisher(FDA)非線性判別分析中得到的[17],Baudat在此基礎(chǔ)上進(jìn)一步提出了多類(lèi)分類(lèi)的 KFDA[18]。核 Fisher(KFDA)的基本思想是對(duì)在輸入原始空間線性不可分的樣本,通過(guò)某種映射變換到一個(gè)高維的特征空間,在特征空間中應(yīng)用Fisher(FDA)方法,從而實(shí)現(xiàn)樣本的線性可分(見(jiàn)圖1)。
核Fisher解決巖性識(shí)別問(wèn)題就是通過(guò)映射φ(x)把巖性樣本投影到一個(gè)高維的特征空間F中,尋找最佳投影向量ν,使得同類(lèi)巖性的樣本有最大的類(lèi)間散度,而不同類(lèi)巖性的樣本有最小類(lèi)內(nèi)散度,即通過(guò)最優(yōu)化核Fisher準(zhǔn)則函數(shù)式(1)找到一個(gè)最優(yōu)的投影矩陣Vopt
式中,Sw為類(lèi)內(nèi)離散度矩陣;Sb為類(lèi)間離散度矩陣。
特征空間F維數(shù)很高或者無(wú)窮維,最大的障礙則是在高維特征空間運(yùn)算時(shí)存在的“維數(shù)災(zāi)難”,對(duì)得到最優(yōu)Fisher判別向量造成阻礙。采用核技巧可以有效地解決這個(gè)問(wèn)題,對(duì)投影后的數(shù)據(jù)進(jìn)行內(nèi)積運(yùn)算,從而避免“維數(shù)災(zāi)難”。
根據(jù)再生核理論,ν又可表示為
式中,αi為待定系數(shù)。將式(3)代入式(1)并用K(χi,χj)代替其中的內(nèi)積運(yùn)算,經(jīng)過(guò)適當(dāng)?shù)耐茖?dǎo)可得到與在高維特征空間F最大優(yōu)化判別準(zhǔn)函數(shù)[式(1)]等價(jià)于[式(4)]
式中,Kw為核類(lèi)內(nèi)散度矩陣;Kb為核類(lèi)間散度矩陣。
根據(jù)廣義Rayleigh商的極值性質(zhì),使最大優(yōu)化判別準(zhǔn)函數(shù)式(4)等價(jià)于求解廣義特征方程式(5)。并將求解的特征值和特征向量組成核函數(shù)矩陣,建立核Fisher判別式,對(duì)待判樣本進(jìn)行判別。
核Fisher(KFDA)判別分析過(guò)程就是將具有非線性特征的樣本通過(guò)構(gòu)造核函數(shù)矩陣投影到高維空間,最終提取樣本的非線性分類(lèi)特征。流程見(jiàn)圖2。
圖2 巖性識(shí)別流程圖
克拉美麗氣田滴西地區(qū)位于準(zhǔn)噶爾盆地滴南凸起上,研究區(qū)地表為沙漠環(huán)境,地面海拔650~700m。鉆井資料顯示,研究區(qū)石炭系沉積主要為火山碎屑巖與海陸過(guò)渡相、陸相的沉積巖。地層為1套酸性、中性、基性火山巖,具有巖相變化快、巖性復(fù)雜、分布不穩(wěn)定等特點(diǎn)。研究區(qū)滴西14、滴西17和滴西18井區(qū)以凝灰?guī)r、玄武巖、流紋巖、粗面巖、安山巖、英安巖和正長(zhǎng)斑巖為主。
常規(guī)自然伽馬射線的放射性強(qiáng)度受巖石中鉀的含量和酸性巖的鈾、釷含量影響,由基性巖、中性巖到酸性巖,巖石放射性逐漸增強(qiáng),自然伽馬測(cè)井曲線響應(yīng)也有增大的趨勢(shì)。在同一類(lèi)巖石中,巖石的結(jié)構(gòu)對(duì)放射性也有影響,例如,研究區(qū)的中性巖樣本中,粗面巖的自然伽馬測(cè)井曲線值較安山巖和正長(zhǎng)斑巖小些??傮w上,基性巖自然伽馬測(cè)井值在50 API左右,中性巖在40~110API之間變化,酸性巖一般大于110API。
電阻率測(cè)井反映巖石的礦物成分,熱液蝕變、孔洞和裂縫發(fā)育程度、流體性質(zhì)及含油氣性的變化,火山巖的復(fù)雜巖性會(huì)使電阻率曲線產(chǎn)生顯著差異,但與自然伽馬曲線相比,其值在火山巖從基性、中性到酸性的變化過(guò)程中,并沒(méi)有特別明顯的規(guī)律性。
中子測(cè)井受地層巖性、流體性質(zhì)影響較大,巖性從基性到中性的變化過(guò)程中,中子測(cè)井值有逐漸減小的趨勢(shì),酸性巖中凝灰?guī)r由于巖性疏松,裂縫發(fā)育,中子測(cè)井值相對(duì)較高。
密度測(cè)井受巖石礦物成分、孔隙、裂隙影響,隨著火山巖巖性從基性到酸性的變化,巖石中鈣鎂礦物含量逐漸減少,密度表現(xiàn)為逐漸降低。但克拉美麗氣田熔巖蝕變的普遍發(fā)育,破壞了這一規(guī)律。但總體上看,火山巖巖性從基性、中性到酸性,密度測(cè)井值有降低趨勢(shì)。
聲波測(cè)井受礦物成分、致密程度及巖石孔隙流體等多因素影響,外加火山巖巖性的非均質(zhì)性強(qiáng),導(dǎo)致聲波時(shí)差規(guī)律性不強(qiáng),從基性到酸性的巖性值域變化不大(見(jiàn)表1)。
表1 研究區(qū)火山巖地層組分測(cè)井響應(yīng)值
基于對(duì)克拉美麗氣田石炭系地層測(cè)井曲線特征的分析可以看出,各種巖性常規(guī)測(cè)井值互相重疊,即使選擇雙因素、多因素分析仍然不易區(qū)分巖性,特別是巖石成分相近,結(jié)構(gòu)略有差異的巖性難以細(xì)分。該研究選取克拉美麗氣田8口取心井349個(gè)火山巖薄片的自然伽馬(GR)、電阻率(Rt)、中子(CNL)、密度(DEN)及聲波時(shí)差(AC)作為特征變量樣本進(jìn)行訓(xùn)練和學(xué)習(xí)。其中基性玄武巖數(shù)據(jù)點(diǎn)21個(gè),中性安山巖數(shù)據(jù)點(diǎn)31個(gè),中性正長(zhǎng)斑巖數(shù)據(jù)點(diǎn)36個(gè),中性粗面巖數(shù)據(jù)點(diǎn)24個(gè),酸性英安巖數(shù)據(jù)點(diǎn)55個(gè),酸性流紋巖數(shù)據(jù)點(diǎn)108個(gè),酸性凝灰?guī)r數(shù)據(jù)點(diǎn)74個(gè)。
利用核Fisher(KFDA)判別分析進(jìn)行訓(xùn)練時(shí),首先對(duì)所有數(shù)據(jù)點(diǎn)進(jìn)行了歸一化處理,并從8口取心井349個(gè)火山巖薄片中隨機(jī)的選取其中70%的數(shù)據(jù)點(diǎn)作為訓(xùn)練樣本參與KFDA的建模(見(jiàn)圖3),剩余30%的數(shù)據(jù)點(diǎn)作為測(cè)試集,實(shí)驗(yàn)重復(fù)30次,核函數(shù)采用高斯核函數(shù)。核參數(shù)σ=0.3154,取核矩陣前3個(gè)最大特征值對(duì)其對(duì)應(yīng)的特征向量構(gòu)造單位化特征向量α1、α2和α3,將7類(lèi)待識(shí)別巖性樣本投影在向量α1、α2和α3上,Direction1為第1核Fisher投影方向,Direction2為第2核Fisher投影方向,Direction3為第3核Fisher投影方向(見(jiàn)圖4),7類(lèi)不同的火山巖巖性得到了很好的區(qū)分,每類(lèi)樣本都有屬于各自的聚類(lèi)中心,由于樣本點(diǎn)在3D空間展布顯示,不同的角度觀測(cè)到樣本點(diǎn)的分布效果會(huì)有所不同,但實(shí)際結(jié)果樣本點(diǎn)并沒(méi)有混雜或重疊。
圖3 核Fisher(KFDA)判別訓(xùn)練模型
圖4 核Fisher(KFDA)判別測(cè)試數(shù)據(jù)分類(lèi)結(jié)果
表2 不同方法判別正確率對(duì)比
圖5 滴西×井巖性識(shí)別綜合解釋圖
為進(jìn)一步驗(yàn)證核Fisher(KFDA)判別分析的優(yōu)越性,將其與有類(lèi)似應(yīng)用技巧的支持向量機(jī)(SVM)算法、BP神經(jīng)網(wǎng)絡(luò)和Fisher(FDA)方法進(jìn)行比較,對(duì)比結(jié)果見(jiàn)表2。核Fisher(KFDA)判別方法的正確率略高于支持向量機(jī)(SVM),由于SVM預(yù)測(cè)中加入的懲罰參數(shù)對(duì)一些奇異值點(diǎn)不能很好進(jìn)行分析,而核Fisher(KFDA)方法中并未加入懲罰因子,它是通過(guò)維數(shù)升高來(lái)獲取更多分類(lèi)信息,進(jìn)而通過(guò)維數(shù)降低來(lái)提取這些分類(lèi)信息,剔除冗余,整個(gè)過(guò)程不需要使用懲罰參數(shù),即對(duì)離群信息有了更好的保留和分析,提高預(yù)測(cè)能力。而B(niǎo)P神經(jīng)網(wǎng)絡(luò)方法較前兩者方法的正確率偏低,作為傳統(tǒng)統(tǒng)計(jì)學(xué)理論方法而言,BP神經(jīng)網(wǎng)絡(luò)方法是基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則,該原則在訓(xùn)練樣本數(shù)目趨于無(wú)窮時(shí),對(duì)未知樣本具有較好的預(yù)測(cè)能力,但實(shí)際上樣本的數(shù)目總是有限的。所以,基于BP神經(jīng)網(wǎng)絡(luò)的測(cè)井巖性識(shí)別方法識(shí)別的精確度受樣本數(shù)目的影響較大,正判率相對(duì)較低。Fisher(FDA)本質(zhì)上屬于線性鑒別方法,可以很好的解決兩類(lèi)和多類(lèi)樣本的分類(lèi)問(wèn)題,但對(duì)于非均質(zhì)性強(qiáng),且?guī)r性存在非線性關(guān)系的火山巖儲(chǔ)層,難以取得良好的識(shí)別效果。
圖5為滴西×井巖性識(shí)別綜合解釋圖?!辆拭嫔现饕?種巖性:粗面巖、凝灰?guī)r、安山巖和正長(zhǎng)斑巖。核Fisher(KFDA)判別方法巖性識(shí)別結(jié)果與錄井信息吻合較好,證明了該方法對(duì)巖性識(shí)別的實(shí)用性及有效性。
(1)針對(duì)火山巖儲(chǔ)層巖性種類(lèi)多、巖性識(shí)別困難這一特點(diǎn),利用核Fisher(KFDA)判別分析方法,選取了合適的特征變量進(jìn)行巖性識(shí)別,有效區(qū)分出凝灰?guī)r、玄武巖、流紋巖、粗面巖、安山巖、英安巖和正長(zhǎng)斑巖等7類(lèi)巖性。
(2)通過(guò)與支持向量機(jī)(SVM)、BP神經(jīng)網(wǎng)絡(luò)和Fisher(FDA)方法對(duì)訓(xùn)練樣本數(shù)據(jù)和測(cè)試樣本數(shù)據(jù)的正判率進(jìn)行比較,核Fisher(KFDA)判別方法具有較高的正判率,識(shí)別精度高。
(3)核Fisher(KFDA)判別方法具有較強(qiáng)的非線性特征提取能力,在樣本處于線性不可分的情形下,能夠以較高的正確率對(duì)巖性數(shù)據(jù)進(jìn)行劃分,且在圖形化顯示方面具有較強(qiáng)的直觀性,可作為油氣預(yù)測(cè)和巖性識(shí)別的一種有效方法,具有很好的應(yīng)用前景。
[1]張子樞,吳邦輝.國(guó)內(nèi)外火山巖油氣藏研究現(xiàn)狀及勘探技術(shù)調(diào)研[J].天然氣勘探與開(kāi)發(fā),1994,16(1):1-26.
[2]楊輝,張研,鄒才能,等.松遼盆地北部徐家圍子斷陷火山巖分布及天然氣富集規(guī)律[J].地球物理學(xué)報(bào),2006,49(4):1136-1143.
[3]戴詩(shī)華,姜淑云,王軍.準(zhǔn)噶爾盆地石西油田火山巖儲(chǔ)集層的測(cè)井描述[J].新疆石油地質(zhì),1997,18(2):125-129.
[4]張慶國(guó),徐冬燕.風(fēng)化店火山巖油藏測(cè)井解釋方法研究[J].測(cè)井技術(shù),1996,20(4):256-260.
[5]Sanyal S K,Juprasert S,Jubasehe J.An Evaluation of Rhyolite-basalt-voleanic Ash Sequence from Welllogs[J].The Log Aanalyst,1980,Jan-Feb.
[6]王擁軍,冉啟全,童敏,等.ECS測(cè)井在火山巖巖性識(shí)別中的應(yīng)用[J].國(guó)外測(cè)井技術(shù),2006,21(1):13-16.
[7]匡立春.克拉瑪依油田5-8區(qū)二疊系佳木河組火成巖巖性識(shí)別[J].石油與天然氣地質(zhì),1990,11(2):195-201.
[8]范宜仁,黃隆基,代詩(shī)華.交會(huì)圖技術(shù)在火山巖巖性與裂縫識(shí)別中的應(yīng)用[J].測(cè)井技術(shù),1999,23(1):53-56.
[9]陳建文,魏斌,李長(zhǎng)山,等.火山巖巖性的測(cè)井識(shí)別[J].地學(xué)前緣,2000,7(4):458-459.
[10]黃布宙,潘保芝.松遼盆地北部深層火成巖測(cè)井響應(yīng)特征及巖性劃分[J].石油物探,2001,40(3):42-47.
[11]王玉娟,閆磊,張曉明,等.松遼盆地東嶺地區(qū)深層火成巖測(cè)井特征與巖性識(shí)別[J].吉林大學(xué)學(xué)報(bào):地球科學(xué)版,2007(增刊1):147-150.
[12]張瑩,潘保芝.基于主成分分析的SOM神經(jīng)網(wǎng)絡(luò)在火山巖巖性識(shí)別中的應(yīng)用[J].測(cè)井技術(shù),2009,33(6):550-554.
[13]張瑩,潘保芝.支持向量機(jī)與微電阻率成像測(cè)井識(shí)別火山巖巖性[J].物探與化探,2011,35(5):634-638.
[14]許建華,張學(xué)工,李衍達(dá).應(yīng)用核Fisher判別技術(shù)預(yù)測(cè)油氣儲(chǔ)集層[J].石油地球物理勘探,2002,37(2):170-174.
[15]徐正光,王淑盛,劉冀偉,等.基于主成分分析的核Fisher判別方法在油水識(shí)別中的應(yīng)用[J].北京科技大學(xué)學(xué)報(bào),2005,27(1):126-128.
[16]羅德江.基于核Fisher判別的碎屑巖儲(chǔ)層流體識(shí)別[J].地球物理學(xué)進(jìn)展,2013,28(4):1919-1924.
[17]Mika S,Ratsch G,Weston J,et al.Fisher Discriminant Analysis with Kernels[C]∥Proceedings of the 1999IEEE Signal Processing Society Workshop,Madison,Wisconsin,USA,1999:41-48.
[18]Baudat G,Anouar F.Generalized Discriminant Analysis Using a Kernel Approach[J].Neural Computation,2000,12(10):2385-2404.