施冬,張春生,施斌全
(1.長(zhǎng)江大學(xué)地球科學(xué)學(xué)院,湖北 荊州 434023;2.中國(guó)石化勝利油田鉆井工藝研究院,山東 東營(yíng) 257017)
低電阻率油層主要是指油層電阻率小于或接近其圍巖電阻率或鄰近水層電阻率,含油飽和度一般小于50%的油層。采用常規(guī)測(cè)井解釋方法進(jìn)行低電阻率油層的識(shí)別時(shí),由于其在電性上所表現(xiàn)的特殊性,常常會(huì)出現(xiàn)油水層誤判的問(wèn)題。同時(shí),在評(píng)價(jià)過(guò)程中,通常都是根據(jù)所研究的油田特征選取不同的判別指標(biāo)進(jìn)行油水層的識(shí)別,而這些判別指標(biāo)的選擇存在較大的經(jīng)驗(yàn)性[1]。
粗糙集Rough Set(RS)理論是Z.Pawlak教授在1982年提出的一種完全數(shù)據(jù)驅(qū)動(dòng)的多指標(biāo)綜合評(píng)價(jià)方法[2]。它可分析不完整的數(shù)據(jù),找出數(shù)據(jù)間的關(guān)系,從而提取有價(jià)值的屬性。該方法克服了以往評(píng)價(jià)參數(shù)選擇的主觀性,但也存在容錯(cuò)和推廣能力相對(duì)較弱、只處理量化數(shù)據(jù)等問(wèn)題。而灰色系統(tǒng)恰恰具有相對(duì)較強(qiáng)的容錯(cuò)和推廣能力,但存在不能選擇條件屬性組合等缺點(diǎn)。因此,將粗糙集與灰色系統(tǒng)相結(jié)合解決低電阻率油層評(píng)價(jià)問(wèn)題具有較強(qiáng)的互補(bǔ)性,可以獲得很好的判別效果。由此,本文提出了基于粗糙集和灰色關(guān)聯(lián)相結(jié)合的方法識(shí)別該類儲(chǔ)層。
粗糙集理論[3-5]是一種研究不精確或不確定性知識(shí)的數(shù)學(xué)工具。屬性約簡(jiǎn)就是在保持分類能力不變的前提下,通過(guò)對(duì)知識(shí)的約簡(jiǎn)獲得分類的規(guī)則,以便人們做出快速而準(zhǔn)確的決策。
定義1:信息系統(tǒng)S=(U,A),其中,U={x1,x2,…,xn}為論域,是所有樣本的集合;A是有限屬性集,分為條件屬性集P(反映對(duì)象特征)和決策屬性集Q(反映對(duì)象類別),即A=P∪Q,P∩Q=Φ。
定義2:當(dāng)2個(gè)不同的對(duì)象由相同的屬性描述時(shí),這2個(gè)對(duì)象在該系統(tǒng)中被歸于同一類,它們的關(guān)系稱之為不可分辨關(guān)系(indiscernibility relation),即對(duì)于任一屬性子集P?A,如果對(duì)象xi,xj∈U,?r∈P,當(dāng)且僅當(dāng)f(xi,r)=f(xj,r)時(shí),xi與xj是不可分辨的,簡(jiǎn)記為ind(P)。
定義3:給定論域U,對(duì)于每個(gè)子集X?U和一個(gè)等價(jià)關(guān)系R∈ind(S),定義2個(gè)子集
分別稱它們?yōu)閄的R下近似集和上近似集。POSR(X)=稱為X的R正域。
定義4:令R為一等價(jià)關(guān)系,且r∈R,若有ind(R)=ind(R-r),則稱r為R 中可省略的;否則,稱r為R中不可省略的。P中所有不可省略關(guān)系的集合,稱為P的核,記作CORE(P)。即
CORE(P)=∩red(P),其中red(P)是P 的所有簡(jiǎn)化族。
定義5:知識(shí)的依賴性可形式化地定義如下:令S=(U,R)為一知識(shí)庫(kù),且P,Q?R,k=γp(Q)=稱知識(shí)Q是k度依賴于知識(shí)P的(0≤k≤1),記作P?kQ。系數(shù)k或γp(Q)可看作Q和P間的依賴度。
定義6:根據(jù)粗糙集理論屬性重要度的概念,定義指標(biāo)a在指標(biāo)體系中的重要性為
式中,P為條件屬性的集合;Q決策屬性的集合。
指標(biāo)r的權(quán)重為
式中,ωa為指標(biāo)a的權(quán)重;i為指標(biāo)集合P 中的指標(biāo)。
粗糙集重要性算法步驟見圖1。
圖1 屬性重要性算法步驟
首先利用相對(duì)正域求出信息系統(tǒng)的核,然后,以屬性的依賴度定義屬性的重要度,選擇重要度大的屬性加入約簡(jiǎn)集,直到滿足終止條件為止,假設(shè)依賴度閾值為ε。
灰色系統(tǒng)理論認(rèn)為,任何隨機(jī)過(guò)程都是在一定幅值范圍和一定時(shí)域內(nèi)變化的。對(duì)于油、氣、水層,油、氣、水層的各類特征參數(shù)均不是確定值,而是在一定范圍內(nèi)變化,即為灰數(shù)。由它們的界限值組成的信息系統(tǒng),數(shù)據(jù)離散、雜亂,包含了多種影響因素,對(duì)此很難作出定量描述,但它們作為灰色信息系統(tǒng)來(lái)講是一個(gè)整體,是有序的[6-7]。
依據(jù)有效厚度標(biāo)準(zhǔn)的結(jié)果列出油層、油水層、水層、干層等的評(píng)價(jià)數(shù)據(jù)列X0,根據(jù)上述Rough set簡(jiǎn)化后得到被比較數(shù)據(jù)列Xi和相應(yīng)的權(quán)值數(shù)據(jù)列T,表示為
式中,i=1,2,…,N,N為油水層的分類總數(shù)。若將儲(chǔ)層分為油層、水層和油水層,則N=3;n為評(píng)價(jià)參數(shù)的個(gè)數(shù)。若評(píng)價(jià)標(biāo)準(zhǔn)有地層電阻增大率、可動(dòng)水飽和度、電阻率等3個(gè)參數(shù),則n=3。
關(guān)聯(lián)性實(shí)質(zhì)上是曲線間幾何形狀的差別,因此將曲線間插值的大小作為關(guān)聯(lián)程度的衡量尺度。采用層點(diǎn)標(biāo)準(zhǔn)指標(biāo)絕對(duì)值的極值加權(quán)組合放大技術(shù)計(jì)算灰色關(guān)聯(lián)系數(shù)
式中,|X0(k)-Xi(k)|=Δi(k),k=1,2,…,n,i=1,2,…,N;Pi(k)為X0與Xi在k 點(diǎn)(參數(shù))的關(guān)聯(lián)系數(shù);Δi(k)為第k點(diǎn)X0與Xi的標(biāo)準(zhǔn)指標(biāo)絕對(duì)差;為標(biāo)準(zhǔn)指標(biāo)兩級(jí)最小差|X0(k)-Xi(k)|為標(biāo)準(zhǔn)指標(biāo)兩級(jí)最大差;T(k)為第k點(diǎn)的權(quán)值;A為灰色分辨系數(shù),一般在0.5~1之內(nèi)選取,通常取0.5。
可以得到關(guān)聯(lián)系數(shù)序列
由于關(guān)聯(lián)系數(shù)較多,信息過(guò)于分散,不便于比較優(yōu)選。為此采用綜合歸一技術(shù),將各個(gè)判別類型的關(guān)聯(lián)系數(shù)集中為一個(gè)值,一般采用求平均值的方法。關(guān)聯(lián)度的一般表達(dá)式為
式中,Pi為灰色多元加權(quán)歸一系數(shù)的行矩陣。
得到關(guān)聯(lián)度序列
最后,利用矩陣作數(shù)據(jù)列處理,根據(jù)最大隸屬度原則
式中,Pmax為灰色多元加權(quán)歸一系數(shù)行矩陣最大隸屬值,相對(duì)應(yīng)的油水層類型就是樣品點(diǎn)的評(píng)價(jià)結(jié)果。
用于儲(chǔ)層含油性評(píng)價(jià)的定量參數(shù)很多,在這些參數(shù)中如何選取在儲(chǔ)層含油性評(píng)價(jià)中起關(guān)鍵作用的評(píng)價(jià)參數(shù)是油氣層評(píng)價(jià)的關(guān)鍵。應(yīng)用粗糙集理論的屬性重要性判斷方法,將儲(chǔ)層的采樣點(diǎn)作為研究對(duì)象,各測(cè)井曲線和儲(chǔ)層參數(shù)作為對(duì)象的屬性,測(cè)井值及參數(shù)值作為屬性值,對(duì)樣本點(diǎn)的含油性判斷作為決策屬性;通過(guò)對(duì)多個(gè)采樣點(diǎn)的研究可以判斷測(cè)井的響應(yīng)值在含油性判斷中哪些是重要的,以及重要曲線的相對(duì)重要程度,刪除多余信息。再利用灰色關(guān)聯(lián)方法對(duì)含油性作出判斷?;诖植诩蜌鈱踊疑u(píng)價(jià)的過(guò)程見圖2。
圖2 基于粗糙集的低電阻率油層灰色識(shí)別過(guò)程
首先對(duì)輸入數(shù)據(jù)的特征屬性進(jìn)行預(yù)處理,然后利用粗糙集理論屬性重要性方法對(duì)預(yù)處理后的多個(gè)屬性進(jìn)行約簡(jiǎn),消除冗余,再采用灰色關(guān)聯(lián)法對(duì)約簡(jiǎn)后的屬性樣本進(jìn)行判別分類,實(shí)現(xiàn)對(duì)低電阻率油層的識(shí)別。
(1)低電阻率油層識(shí)別參數(shù)的選取。低電阻率油層的識(shí)別是利用多種對(duì)低電阻率儲(chǔ)層敏感的測(cè)井參數(shù)進(jìn)行判別的過(guò)程。
(2)測(cè)井曲線的預(yù)處理。在測(cè)井的過(guò)程中,由于測(cè)量環(huán)境和測(cè)井儀器刻度會(huì)給測(cè)井?dāng)?shù)據(jù)帶來(lái)誤差。為了消除或減少這些誤差,須對(duì)測(cè)井?dāng)?shù)據(jù)進(jìn)行歸一化處理,其實(shí)質(zhì)是消除量綱的影響。數(shù)學(xué)表達(dá)式為
式中,X為測(cè)井響應(yīng)值;Xmin為測(cè)井響應(yīng)最小值;Xmax為測(cè)井響應(yīng)最大值;X′為歸一化處理后的響應(yīng)值。
(3)建立低電阻率油層識(shí)別系統(tǒng)。以儲(chǔ)層采樣點(diǎn)作為研究對(duì)象的數(shù)據(jù)集合U,以測(cè)井曲線為識(shí)別特征集(對(duì)象屬性),以儲(chǔ)層含油性為識(shí)別結(jié)果集(結(jié)果屬性),以處理過(guò)的測(cè)井響應(yīng)值為屬性值集,建立低電阻率油層識(shí)別系統(tǒng)。
(4)屬性重要性判斷、屬性約簡(jiǎn)。應(yīng)用粗糙集理論對(duì)各評(píng)價(jià)屬性的重要性進(jìn)行判斷,得出重要屬性的最少組合,同時(shí)得到各個(gè)屬性的相對(duì)重要性。
(5)構(gòu)造評(píng)價(jià)矩陣,進(jìn)行含油性灰色評(píng)價(jià)。通過(guò)上述方法得到的最優(yōu)屬性組合作為灰色評(píng)價(jià)的評(píng)價(jià)參數(shù)列,構(gòu)造評(píng)價(jià)矩陣R。應(yīng)用灰色系統(tǒng)理論對(duì)屬性選擇后的儲(chǔ)層進(jìn)行含油性評(píng)價(jià)。
選取了某油田18口有測(cè)試資料的井共計(jì)30個(gè)小層進(jìn)行實(shí)證研究。
通過(guò)對(duì)研究區(qū)低電阻率油層及水層的測(cè)井參數(shù)統(tǒng)計(jì),選擇了5個(gè)影響該地區(qū)低電阻率油層識(shí)別的初始評(píng)價(jià)參數(shù)(見表1)[8],分別為地層電阻率(Rt)、可動(dòng)水飽和度(Swm)、泥質(zhì)含量(Vsh)、孔隙度(φ)和電阻增大率I(電阻率指數(shù))。把這30個(gè)樣本集合以U={1,2,…,30}表示,將這5個(gè)初始評(píng)價(jià)參數(shù)作為樣本集合U 上的特征屬性P,P={Rt、Swm、Vsh、φ、I},記為 P={a,b,c,d,e}。
表1 初始評(píng)價(jià)的原始數(shù)據(jù)
針對(duì)該研究區(qū)的特點(diǎn),將這18口井的所有樣本數(shù)據(jù)進(jìn)行預(yù)處理,以減少因各屬性量綱不一致對(duì)結(jié)果的影響。
根據(jù)測(cè)試資料的分析,歸納出該地區(qū)儲(chǔ)層的含油性評(píng)價(jià)標(biāo)準(zhǔn)(見表2)。儲(chǔ)層含油性類型主要有油層、油水層、水層3種,即決策屬性Q有3個(gè),Q={qi},i=1,2,3。
表2 含油性評(píng)價(jià)標(biāo)準(zhǔn)
以儲(chǔ)層采樣點(diǎn)作為研究對(duì)象的數(shù)據(jù)集合U,以所選擇的特征參數(shù):地層電阻率、可動(dòng)水飽和度、泥質(zhì)含量、孔隙度、電阻增大率作為識(shí)別特征集(對(duì)象屬性),即P={a,b,c,d,e}為條件屬性集;以儲(chǔ)層含油性為識(shí)別結(jié)果集(決策屬性),Q={f}為決策屬性集,該集合中只有一個(gè)決策屬性。條件屬性集中均為定量數(shù)據(jù),故可根據(jù)該地區(qū)含油性評(píng)價(jià)標(biāo)準(zhǔn)將它們劃分為相應(yīng)的水平,建立低電阻率油層識(shí)別系統(tǒng)。
運(yùn)用粗糙集重要性方法進(jìn)行屬性約簡(jiǎn)。表3為條件重要性方法處理的結(jié)果。表3中σP(Q′)表示各條件屬性子集Q′的重要性。由表3的屬性重要性可以看出,就單個(gè)條件屬性而言,可動(dòng)水飽和度b對(duì)低電阻率層的油水層類型f的影響最大,電阻增大率e的影響次之,地層電阻率a第3,泥質(zhì)含量c第4,孔隙度d影響最??;同時(shí)考慮2個(gè)條件屬性,則{b,e}對(duì)油水層類型f 的影響最大,{c,d}的影響最??;就3個(gè)條件屬性來(lái)講,{a,b,e}對(duì)油水層類型f的影響最大,{a,c,d}的影響最?。粚?duì)4個(gè)屬性而言,{a,b,c,e}對(duì)油水層類型f的影響最大,{a,c,d,e}的影響最小。經(jīng)粗糙集約簡(jiǎn)后測(cè)井屬性參數(shù)由原來(lái)的5個(gè)約簡(jiǎn)為3個(gè):地層電阻率(Rt)、可動(dòng)水飽和度(Swm)和電阻增大率(I)。
表3 條件屬性子集的重要性
選取了研究區(qū)的18口井,其中試油結(jié)果為純油層的9口井共17個(gè)小層,試油結(jié)果為油水同層的5口井共7個(gè)小層,4口井6個(gè)小層的測(cè)試結(jié)果為水層。利用上述方法處理這些井,并通過(guò)與測(cè)試結(jié)果比較表明(見表4),用該方法識(shí)別低電阻率油層具有較高的識(shí)別率。該方法不僅消除了多個(gè)評(píng)價(jià)信息間的信息重疊,通過(guò)降維大大提高了運(yùn)算速度;同時(shí)將粗糙集和灰色關(guān)聯(lián)法結(jié)合,利用其互補(bǔ)性在低電阻率油層的識(shí)別中取得了較好的評(píng)價(jià)結(jié)果。
表4 低電阻率油層評(píng)價(jià)效果對(duì)比
(1)通過(guò)對(duì)粗糙集和灰色關(guān)聯(lián)方法的分析,提出了基于粗糙集的低電阻率油層灰色識(shí)別方法。
(2)利用粗糙集的屬性約簡(jiǎn)降低了灰色關(guān)聯(lián)輸入評(píng)價(jià)參數(shù)矩陣的維數(shù),減小了識(shí)別過(guò)程的計(jì)算復(fù)雜性,利用灰色關(guān)聯(lián)方法識(shí)別低電阻率油層得到了較高的效果。
(3)實(shí)驗(yàn)結(jié)果表明,基于粗糙集和灰色系統(tǒng)方法在油水層識(shí)別中具有更好的分類能力。
[1]中國(guó)石油勘探與生產(chǎn)公司.低電阻率油氣藏測(cè)井識(shí)別評(píng)價(jià)方法與技術(shù)[M].北京:石油工業(yè)出版社,2006.
[2]黃廣龍.基于粗糙集理論的多因素?cái)?shù)據(jù)分析[J].浙江大學(xué)學(xué)報(bào):自然科學(xué)版,2000,35(5):23-26.
[3]張文修,吳偉志,梁吉業(yè),等.粗糙集理論與方法[M].北京:科學(xué)出版社,2004.
[4]汪杭軍,張廣群.粗糙集屬性約簡(jiǎn)算法的實(shí)現(xiàn)與應(yīng)用[J].計(jì)算機(jī)工程與設(shè)計(jì),2007,28(4):777-779.
[5]Richard Jensen,Qiang Shen.Semantics-preserving Dimensionality Reduction:Rough and Fuzzy-rough-based Approaches[J].IEEE Transactions on Knowledge and Data Engineering,2005,17(1):1457-1471.
[6]宋子齊,譚成仟.灰色理論油氣儲(chǔ)層評(píng)價(jià)[M].北京:石油工業(yè)出版社,1995:3-26.
[7]施冬.油氣層灰色綜合地理信息系統(tǒng)GlS評(píng)價(jià)方法研究[J].測(cè)井技術(shù),2005,29(1):30-32.
[8]施冬,張春生,郭甲世.灰色綜合評(píng)判法在低電阻率油氣層中的應(yīng)用[J].地球物理學(xué)進(jìn)展,1998,13(1):73-78.