亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        利用聚類分析方法進(jìn)行模型優(yōu)選

        2015-05-14 03:00:04戴危艷李少華王軍宋道萬史敬華陳蘇
        斷塊油氣田 2015年4期
        關(guān)鍵詞:儲量滲透率聚類

        戴危艷,李少華,王軍,宋道萬,史敬華,陳蘇

        (1.長江大學(xué)地球科學(xué)學(xué)院,湖北 武漢430100;2.中國石化勝利油田分公司地質(zhì)研究院,山東 東營 257015)

        0 引言

        儲層隨機(jī)建模技術(shù)產(chǎn)生于20世紀(jì)80年代初期,目前在油氣田勘探開發(fā)實踐中的應(yīng)用越來越廣泛。隨機(jī)建模能夠提供多個等概率的模型實現(xiàn),利用這些實現(xiàn)可以對儲層進(jìn)行不確定性評價[1-2]。而在油藏數(shù)值模擬中,考慮到計算成本,通常只能夠?qū)τ邢薜膸讉€實現(xiàn)進(jìn)行模擬計算,故必須從多個模型中優(yōu)選出1個或幾個進(jìn)行數(shù)值模擬研究。常用的隨機(jī)模型篩選方法有算術(shù)平均法、地質(zhì)模式篩選法、數(shù)值模擬法、概率儲量法、實驗設(shè)計、拉丁超立方抽樣和排序法[3-6]。算術(shù)平均法的原理是將多個實現(xiàn)進(jìn)行算術(shù)平均,將得到的平均模型作為優(yōu)選模型,其優(yōu)點(diǎn)是簡單快捷,缺點(diǎn)是具有平滑效應(yīng),改變了儲層非均質(zhì)性和模型的統(tǒng)計分布特征。地質(zhì)模式篩選法是通過對比每個模型與地質(zhì)模式之間的差異,從中選出吻合程度較大的模型,它可以較好地滿足地質(zhì)概念模式,但非常耗時,且受主觀因素影響較大。數(shù)值模擬法通過流線模擬、歷史擬合等方法優(yōu)選模型,其缺點(diǎn)也是比較耗時。概率儲量法、實驗設(shè)計、拉丁超立方抽樣和排序法,都是以地質(zhì)儲量為指標(biāo)進(jìn)行模型優(yōu)選,這些方法不適用于滲透率模型優(yōu)選。聚類分析方法利用歐氏距離函數(shù)所計算的模型之間的差異對模型進(jìn)行分類,然后從每一類中選出1個或幾個模型進(jìn)行油藏數(shù)值模擬。該方法操作簡單,容易實現(xiàn),不僅適用于各類屬性(滲透率、孔隙度、含水飽和度等)模型的優(yōu)選,也適用于相模型的優(yōu)選。本文以50個滲透率模型為實例進(jìn)行計算,對比所選模型計算的儲量與用蒙特卡洛模擬法得到的P10,P50和P90儲量 (即樂觀、可能和悲觀儲量),驗證了方法的可行性。

        1 聚類分析方法的基本原理

        聚類分析方法是通過度量研究對象的某種屬性的相似程度,使同一類中樣本的相似程度最大,而不同類中樣本的相似程度最小,即聚類分析的過程主要依賴于樣本之間的特征差異[7-8]。常用的聚類分析方法主要有5大類,即基于劃分、基于層次、基于密度、基于網(wǎng)格和基于模型的聚類分析方法[9-10]。

        K-means聚類分析方法是目前應(yīng)用最為廣泛的一種基于劃分的聚類分析方法。該方法采用誤差平方和作為準(zhǔn)則函數(shù),處理大數(shù)據(jù)集的效率較高[11-13]。它需要預(yù)先指定聚類個數(shù),通過反復(fù)運(yùn)算,得到最終聚類結(jié)果。其核心思想是找出k個聚類中心,使得每一個數(shù)據(jù)點(diǎn)和與其最近的聚類中心的平方距離和最小。該方法所獲得的k個聚類,具有類內(nèi)的差異較小、而類間的差異較大的特點(diǎn)。

        K-means聚類分析方法的一般步驟[14-15]:1)隨機(jī)指定k個聚類中心。2)計算各模型與k個聚類中心之間的距離。3)將模型分配到離其最近的聚類中心所標(biāo)明的類。4)重新計算新的k個樣本的聚類中心,以每個類的均值作為新的聚類中心點(diǎn)。5)與前一次計算得到的k個聚類中心比較,如果聚類中心發(fā)生變化,返回步驟2);否則,輸出聚類的結(jié)果。在實際應(yīng)用中,由于無法事先確定k取何值時能達(dá)到最佳的聚類效果,故本文根據(jù)普遍使用的經(jīng)驗規(guī)則,將k值的范圍限定在2與之間[16](N為數(shù)據(jù)空間中的所有數(shù)據(jù)點(diǎn)的個數(shù)),然后利用聚類有效性評價指標(biāo)確定k的具體數(shù)值。

        2 聚類分析方法優(yōu)選模型基本步驟

        典型的利用聚類分析方法優(yōu)選模型的過程,主要包括數(shù)據(jù)準(zhǔn)備、計算相似度、特征選擇、聚類及對聚類結(jié)果進(jìn)行評估等步驟[17-18]。1)數(shù)據(jù)準(zhǔn)備。隨機(jī)模擬建立多個三維定量地質(zhì)模型,統(tǒng)計各個模型中每一網(wǎng)格節(jié)點(diǎn)的屬性值,并對這些值進(jìn)行標(biāo)準(zhǔn)化處理。2)模型差異計算。計算每兩個模型之間的歐氏距離,得到一個表征各模型之間差異的相異性矩陣。3)降維。對所得到的相異性矩陣進(jìn)行降維,實現(xiàn)在二維空間中用向量來可視化模型的相似性,從而簡化聚類過程。4)模型聚類及優(yōu)選。確定聚類個數(shù),編寫相關(guān)代碼對模型進(jìn)行聚類,然后從每一類中選出1個或幾個模型,一般選取離聚類中心近的模型。5)結(jié)果評估。對比井點(diǎn)屬性值直方圖與所選模型直方圖,看所選模型是否滿足地質(zhì)要求。6)可靠性驗證。對比所選模型計算的儲量與用P10,P50,P90模型計算的儲量,判斷所選模型是否具有代表性。

        3 實例研究

        以WZ油田西區(qū)為例。該區(qū)縱向上有2套油層,由上至下分屬上第三系角尾組二段砂巖和下第三系潿洲組三段砂巖,分別稱之為“角二段油層”和“潿三段油層”。其中,角二段油層是主力油層,目前有5口開發(fā)水平井,1口裸眼井和1口探井,平均井距為400 m左右。目的層角二段屬于濱海相沉積,巖性以長石石英砂巖為主,砂巖粒級多為細(xì)砂,在油田范圍內(nèi)厚度為110~130 m。

        3.1 模型差異刻畫

        利用順序高斯模擬方法隨機(jī)模擬生成50個滲透率模型,統(tǒng)計各個模型中每一網(wǎng)格節(jié)點(diǎn)的滲透率數(shù)值據(jù),將整理后的數(shù)據(jù)導(dǎo)入SPSS軟件中。對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,然后計算各個模型之間的距離(差異)。常用的計算距離的函數(shù)有歐氏距離、馬氏距離、明考斯基距離、豪斯多夫距離、基于連通性的距離、基于流線的距離、曼哈頓距離函數(shù)等[19-21]。用這些距離函數(shù)計算模型之間的差異各有其優(yōu)缺點(diǎn)。如:馬氏距離函數(shù)不受量綱的影響,還可以排除變量之間的相關(guān)性的干擾,其缺點(diǎn)是夸大了變化微小變量的作用[22];豪斯多夫距離函數(shù)比較大的缺陷是對于噪聲、孤立點(diǎn)、斷點(diǎn)等特殊點(diǎn)敏感,在處理的過程中無法避免這些異常點(diǎn)的發(fā)生[23-24]。本文應(yīng)用歐式距離函數(shù)進(jìn)行計算,其公式為

        式中:def為 e,f兩模型之間的差異;xen和 xfn分別為兩模型第n個網(wǎng)格的屬性值大小(如滲透率、孔隙度的大小或其他一些特征值的大?。籲為網(wǎng)格個數(shù)。

        應(yīng)用式(1)計算每兩個模型間相對應(yīng)的每一網(wǎng)格節(jié)點(diǎn)滲透率值差的平方和,然后取平方根,得到一個相異性矩陣(見表1)。該矩陣中的數(shù)據(jù)所表示的是每一點(diǎn)處滲透率模擬結(jié)果的差異累加。而在實際的地質(zhì)研究中,每處滲透率的大小都會直接影響流體的流動方向,所以,用該方法刻畫滲透率模型之間的差異更加準(zhǔn)確,而根據(jù)此差異所選擇的模型也更具代表性。

        表1 相異性矩陣(部分)

        3.2 多維尺度分析

        由于高維會使數(shù)據(jù)之間的區(qū)分界限變得模糊,給聚類帶來困難,所以,在進(jìn)行聚類分析前都會對數(shù)據(jù)進(jìn)行降維處理,進(jìn)而實現(xiàn)在二維空間中用向量來可視化物體的相似性[25]。多維尺度分析是一種把高維降為低維,在低維空間展示距離數(shù)據(jù)結(jié)構(gòu)的多元數(shù)據(jù)分析技術(shù),簡稱MDS[26-28]。利用MDS技術(shù)提取出各模型在一維度和二維度上的坐標(biāo)值(見表2)。一維度指滲透率高值偏少—偏多的維度,二維度指滲透率高值偏多—偏少的維度。進(jìn)行聚類分析時,可直接采用這2列數(shù)據(jù)。

        表2 模型在一維度和二維度上的坐標(biāo)值

        3.3 模型聚類

        利用各模型在一維度和二維度上的坐標(biāo)值,運(yùn)用R語言編寫相關(guān)代碼進(jìn)行模型聚類研究[29-30]。應(yīng)用K-means聚類算法對模型進(jìn)行聚類時,首先要確定聚類的個數(shù)k。由于k值的大小應(yīng)在2與之間,其中N為數(shù)據(jù)空間中的所有數(shù)據(jù)點(diǎn)的個數(shù),所以這里的k值大小在2~7。在此區(qū)間逐個選取k值進(jìn)行聚類,得到的結(jié)果如圖1所示。圖中:數(shù)據(jù)表示各個滲透率模型之間差異的量化值;顏色表示模型類別,不同類別用不同的顏色區(qū)分;“△”表示聚類中心;“○”表示滲透率模型。

        圖1 聚類分析結(jié)果

        一個有效聚類分析的分類結(jié)果應(yīng)達(dá)到類內(nèi)緊密、類間遠(yuǎn)離。評價聚類分析有效性的指標(biāo)有Sil指標(biāo)、DB指標(biāo)、CH 指標(biāo)、HS 指標(biāo)、SB 指標(biāo)、Dunn 指標(biāo)等[31]。 本文采用Dunn指標(biāo)來評價聚類結(jié)果的有效性。

        Dunn指標(biāo)使用同類數(shù)據(jù)類與類之間的最大距離來表示類內(nèi)相似度,使用不同類數(shù)據(jù)類與類之間的最小距離來表示類間差異,D指標(biāo)的取值為二者的商[32]。D越大,表示類與類之間間隔越遠(yuǎn),聚類效果越好。其計算公式為

        式中:ci為第i類數(shù)據(jù);cj為第j類數(shù)據(jù);ck為第k類數(shù)據(jù);d(x,y)為 2 個數(shù)據(jù)點(diǎn)之間的距離。

        表3是k取不同值時的D值。通過該表分析得出,聚類數(shù)為5時的聚類效果最佳。

        表3 k取不同值時的D值

        3.4 結(jié)果分析

        利用K-means聚類分析方法,將原始的50個模型分成5大類:第1類模型中,離聚類中心最近的模型是模型15;第2類模型中,離聚類中心最近的模型是模型49;第4類模型中,離聚類中心最近的模型是模型11;第3類和第5類都只有1個模型,分別為模型2和模型34。如圖2所示,對比模型15滲透率分布直方圖與井點(diǎn)滲透率直方圖發(fā)現(xiàn),結(jié)果比較相似,說明模擬的結(jié)果與地質(zhì)概念一致。從這5類模型中分別選出1個或幾個進(jìn)行油藏數(shù)值模擬,可以在一定程度上避免主觀選擇模型造成的不確定性,并提高研究的速度。

        圖2 井點(diǎn)滲透率直方圖與模型直方圖對比

        4 方法可靠性驗證

        用上述方法可以分別優(yōu)選出相應(yīng)的孔隙度、含水飽和度以及NTG模型,從而利用這些模型計算儲量。圖3是用50組模型計算得到的儲量累積概率分布。

        圖3 儲量累計概率分布

        通過對比圖3中用蒙特卡洛模擬法得到的P10,P50和P90儲量與采用所選5類模型所計算的儲量可以看出,用聚類分析的方法所選的模型具有較好的代表性,即原本需要50次模擬才能得到的結(jié)果,現(xiàn)在只需5次模擬就能得到,大大減少了模擬的次數(shù)。

        5 結(jié)論

        1)K-means聚類分析方法,以模型之間的差異為依據(jù),結(jié)合距離函數(shù)對模型進(jìn)行分類,適用于沉積相、孔隙度、滲透率、含水飽和度等各類模型的優(yōu)選。

        2)基于該方法選擇的模型具有一定的代表性,避免了主觀選擇模型造成的不確定性,有效解決了模型數(shù)量大時優(yōu)選具有代表性的模型進(jìn)行油藏數(shù)值模擬的難題。該方法可以大大減少數(shù)值模擬的次數(shù),簡單且快速有效,實例研究也驗證了該方法的可行性。

        3)在實際應(yīng)用中,可選用不同的聚類方法對模型進(jìn)行聚類,從而選出最佳的模型分類方案。

        [1]李少華,張昌民,彭裕林,等.儲層不確定性評價[J].西安石油大學(xué)學(xué)報:自然科學(xué)版,2004,19(5):16-24.

        [2]Singh V,Hegazy M,F(xiàn)ontanelli L.Assessment of reservoir uncertainties for development evaluation and risk analysis[J].The Leading Edge,2009,28(3):272-282.

        [3]White C D,Royer S A.Experimental design as a framework for reservoir studies[J].SPE 79676,2003.

        [4]于興河.油氣儲層表征與隨機(jī)建模的發(fā)展歷程及展望[J].地學(xué)前緣,2008,15(1):1-7.

        [5]Maschio C,de Carvalho C P V,Schiozer D J.A new methodology to reduce uncertainties in reservoir simulation models using observed data and sampling techniques[J].Journal of Petroleum Science and Engineering,2010,72(1):110-119.

        [6]McLennan J A,Deutsch C V.Ranking geostatistical realizations by measures of connectivity[R].SPE 98168,2005.

        [7]吳革洪,高才松,劉玉民.聚類分析在油藏分類中的應(yīng)用[J].斷塊油氣田,2001,8(1):36-37.

        [8]霍凱中,趙永軍,孫立冬.灰色聚類分析在煤層氣選區(qū)評價中的應(yīng)用[J].斷塊油氣田,2007,14(2):14-17.

        [9]Bandyopadhyay S ,Coyle E J.An energy efficient hierarchical clustering algorithm for wireless sensor networks[C]//Twenty-Second Annual Joint Conference of the IEEE Computer and Communications.IEEE INFOCOM,2003:1713-1723.

        [10]Kriegel H P,Pfeifle M.Density-based clustering of uncertain data[C]//Proceedings of the Eleventh ACM SIGKDD International Conference on Knowledge Discovery in Data Mining.ACM,2005:672-677.

        [11]Kanungo T,Mount D M,Netanyahu N S,et al.An efficient k-means clustering algorithm:Analysis and implementation[J].Pattern Analysis and Machine Intelligence,IEEE Transactions,2002,24(7):881-892.

        [12]Hartigan J A,Wong M A.Algorithm AS 136:A K-means clustering algorithm[J].Applied statistics,1979:100-108.

        [13]Jain A K,Murty M N,F(xiàn)lynn P J.Data clustering:A review[J].ACM Computing Surveys,1999,51(5):264-525.

        [14]Sambasivam S,Theodosopoulos N.Advanced data clustering methods ofmining Web documents[J].Issues in Informing Science and Information Technology,2006(5):565-579.

        [15]Caers J.Modeling Uncertainty in the Earth Sciences[J].Bulletin of the American Meteorological Society,2012,93(10):1583.

        [16]周世兵,徐振源,唐旭清.K-means算法最佳聚類數(shù)確定方法[J].計算機(jī)應(yīng)用,2010,30(8):1995-1998.

        [17]孫吉貴,劉杰,趙連宇.聚類算法研究[J].軟件學(xué)報,2008,19(1):48-61.

        [18]Jain A K,Duin R P W.Statistical pattern recognition:A review[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2000,22(1):4-57.

        [19]Scheidt C,Caers J.Representing spatial uncertainty using distances and kernels[J].Mathematical Geosciences,2009,41(4):597-419.

        [20]Groenen P J F,Jajuga K.Fuzzy clustering with squared Minkowski distances[J].Fuzzy Sets and Systems,2001,120(2):227-237.

        [21]Sherwood T,Perelman E,Hamerly G,et al.Automatically characterizing largescaleprogrambehavior[J].ACMSIGARCHComputerArchitecture News,2002,30(5):45-57.

        [22]De Maesschalck R,Jouan Rimbaud D,Massart D L.The mahalanobi s distance [J].Chemometrics and intelligent laboratory systems,2000, 50(1):1-18.

        [23]Huttenlocher D P,Rucklidge W J.A multi-resolution technique for comparing images using the Hausdorff distance[R].Cornell University,1992.

        [24]曹京京.Hansdorff距離的計算原理及其在二維匹配中的應(yīng)用[D].大連:大連理工大學(xué),2013.

        [25]Ding C,He X,Zha H,et al.Adaptive dimension reduction for clustering high dimensional data[C]//Proceedings of International Conference on Data Mining,2002.

        [26]Christophe Bécavin,Nicolas Tchitchek,Colette Mintsa-Eya,et al.Improving the efficiency of multidimensional scaling in the analysis of high-dimensional data using singular value decomposition [J].Advance Access publication,2011,27(10):1413-1421.

        [27]Kruskal J B.Multidimensional scaling by optimizing goodness of fit to a nonmetric hypothesis[J].Psychometrika,1964,29(1):1-27.

        [28]Mardia K V.Some properties of clasical multi-dimesional scaling[J].Communications in Statistics-Theory and Methods,1978,7 (13):1233-1241.

        [29]Ihaka R,Gentleman R.R:a language for data analysis and graphics[J].Journal of Computational and Graphical Statistics,1996,5 (3):299-314.

        [30]方匡南.基于數(shù)據(jù)挖掘的分類和聚類算法研究及R語言實現(xiàn)[D].廣州:暨南大學(xué),2007.

        [31]Mark Chiang Ming-Tso,Mirkin Boris.Intelligent Choice of the Number of Clusters in K-means Clustering:An Experimental Study with Different Cluster Spreads[J].Journal of Classification,2010,27(1):3-40.

        [32]Halkidi M,Batistakis Y,Vazirgiannis M.Clustering validity checking methods:PartⅡ[J].ACM Sigmod Record,2002,31(3):19-27.?

        猜你喜歡
        儲量滲透率聚類
        《礦產(chǎn)資源儲量技術(shù)標(biāo)準(zhǔn)》修訂對資源儲量報告編寫的影響
        基于三維軟件資源儲量估算對比研究
        中煤階煤層氣井排采階段劃分及滲透率變化
        不同滲透率巖芯孔徑分布與可動流體研究
        SAGD井微壓裂儲層滲透率變化規(guī)律研究
        基于DBSACN聚類算法的XML文檔聚類
        電子測試(2017年15期)2017-12-18 07:19:27
        高滲透率風(fēng)電并網(wǎng)對電力系統(tǒng)失步振蕩的影響
        基于改進(jìn)的遺傳算法的模糊聚類算法
        一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
        概率統(tǒng)計法在儲量估算中的應(yīng)用
        斷塊油氣田(2014年5期)2014-03-11 15:33:45
        性色av成人精品久久| 蜜桃久久综合一区二区| 成人做爰黄片视频蘑菇视频| 午夜视频在线观看一区二区小| 亚洲av成人精品一区二区三区| 在线观看视频播放| 国自产偷精品不卡在线| 免费黄网站久久成人精品 | 中文字幕精品永久在线| 国产精品高清国产三级国产av| 一区二区三区中文字幕p站| 免费国产线观看免费观看| 亚洲精品色午夜无码专区日韩| 国产精品视频免费播放| 国产精品成人一区二区三区| 少妇高潮惨叫久久久久久| 9久久精品视香蕉蕉| 亚洲日本视频一区二区三区| 人妻精品久久一区二区三区| 男女18禁啪啪无遮挡激烈网站| a级毛片免费观看网站| 亚洲成a人片在线观看天堂无码| 91精品国产色综合久久不卡蜜| 日韩最新av一区二区| 91成人国产九色在线观看 | 国内女人喷潮完整视频| 亚洲精品一区二区三区大桥未久| 91青青草久久| 国产少妇露脸精品自拍网站| 日本饥渴人妻欲求不满| 十八18禁国产精品www| 免费一区啪啪视频| 国产亚洲精品hd网站| 久久夜色精品国产三级| 精品亚洲麻豆1区2区3区| 色综合视频一区中文字幕| 国内揄拍国内精品| av最新版天堂在资源在线| 日本一二三区免费在线| 国产大屁股喷水视频在线观看| 国产免费av片在线观看|