邊 莉, 張欣欣, 李婷婷, 車向前
(1.黑龍江科技大學(xué) 電子與信息工程學(xué)院, 哈爾濱 150022; 2.黑龍江科技大學(xué) 電氣與控制工程學(xué)院,
?
煤層氣儲層滲透率的預(yù)測方法
邊 莉1, 張欣欣2, 李婷婷2, 車向前3
(1.黑龍江科技大學(xué) 電子與信息工程學(xué)院, 哈爾濱 150022; 2.黑龍江科技大學(xué) 電氣與控制工程學(xué)院,
哈爾濱 150022; 3.黑龍江科技大學(xué) 計算機與信息工程學(xué)院,哈爾濱 150022)
煤層氣儲層滲透率參數(shù)的強非線性,使得常規(guī)參數(shù)難以預(yù)測,由此提出一種交叉熵優(yōu)化支持向量機的煤層氣滲透率預(yù)測新方法。利用UCI數(shù)據(jù)庫中的數(shù)據(jù),將該算法預(yù)測結(jié)果與粒子群算法、遺傳算法的預(yù)測結(jié)果進行對比。結(jié)合某礦區(qū)實際地質(zhì)特性,用該算法對該礦區(qū)煤層氣儲層滲透率參數(shù)進行預(yù)測,得出大部分被測試數(shù)據(jù)的相對誤差率達到 1%左右,除了個別數(shù)據(jù)超過20%,總體分布較穩(wěn)定。該礦區(qū)滲透率參數(shù)的預(yù)測值和真實值分布圖大體一致。該算法可行,且優(yōu)于其他算法,可以為煤層氣儲層參數(shù)的預(yù)測提供算法保障。
煤層氣; 滲透率預(yù)測; 交叉熵算法; 支持向量機
煤層氣的儲層參數(shù)能夠描述地下巖性特征,它與煤層氣儲量和產(chǎn)能密切相關(guān),因此,在開發(fā)前,對儲層參數(shù)進行準確預(yù)測,能夠指導(dǎo)資源的勘探與開發(fā),可以有效提升開發(fā)效率。當前,主要煤儲層的滲透率預(yù)測方法包括描述技術(shù)、數(shù)理分析等。描述技術(shù)是根據(jù)煤樣找到與滲透率有關(guān)的特征參數(shù)例如充填程度、割理密度、割理壁距等。數(shù)理分析是指通過一些數(shù)學(xué)方法建立對應(yīng)的數(shù)學(xué)模型,從而預(yù)測滲透率[1-2],這種方法在實際應(yīng)用中并沒有進行可行性分析。目前,越來越多的數(shù)學(xué)方法被應(yīng)用到地質(zhì)研究中,例如統(tǒng)計學(xué)、模式識別和人工神經(jīng)網(wǎng)絡(luò)。但是,利用人工神經(jīng)網(wǎng)絡(luò)建立的模型具有結(jié)構(gòu)不易確定、易出現(xiàn)局部最優(yōu)等缺陷[3]。鑒于此,筆者通過將交叉熵與支持向量機相結(jié)合的方法來對煤層氣儲層滲透率進行預(yù)測,并利用UCI數(shù)據(jù)庫中的樣本對該方法進行可行性分析,結(jié)合某實際礦區(qū)的地質(zhì)特性,對實際煤層氣儲層滲透率進行預(yù)測。
支持向量機(Support vector machine,SVM)形式簡單,尤其在小數(shù)據(jù)問題上具有較強的優(yōu)越性[4],越來越受到研究者的青睞。SVM基本思想如式(1)所示,將非線性問題φ(·)中輸入數(shù)據(jù)T(T∈n)映射到Hilbert空間中,即將非線性問題線性化。在Hilber中,構(gòu)造最佳分類超平面F(φ(T))的基礎(chǔ)上,建立分類決策函數(shù)。其中,最佳分類超平面的參數(shù)是依據(jù)結(jié)構(gòu)風(fēng)險最小化原則,利用拉格朗日乘子,構(gòu)造與原始分類問題對偶的非線性規(guī)劃問題并求解,得到[5]
(1)
當非線性映射滿足Mercer條件時,可采用核函數(shù)來代替輸入向量與支持向量的內(nèi)積運算。核函數(shù)的選取決定最終SVM的分類效果,同時考慮后續(xù)算法的復(fù)雜度,采用徑向基核函數(shù),為
(2)
式中:‖T-Y‖2——向量間距;
g——徑向基寬度。
如何恰當?shù)倪x擇參數(shù)是算法的關(guān)鍵,這將影響構(gòu)建模型的精確度,為了協(xié)調(diào)SVM的參數(shù),選取交叉熵支持向量機(Cross entropy SVM, CE-SVM)的方法來優(yōu)化SVM中的兩個重要參數(shù),即懲罰因子c與徑向基寬度g[6]。由于,非線性優(yōu)化問題的復(fù)雜度由g決定,所以g的取值不當,會直接影響SVM的適應(yīng)性;c的取值不當,會引起過學(xué)習(xí)或欠學(xué)習(xí)。
交叉熵(Cross entropy,CE)算法尋優(yōu)迭代的過程主要為[7]:(1) 根據(jù)具體的概率密度函數(shù)產(chǎn)生隨機樣本;(2) 為產(chǎn)生更優(yōu)的樣本,對概率密度函數(shù)進行更新??紤]式(3)所示典型的無約束連續(xù)型優(yōu)化問題。
G(x*)=γ*=minG(x),
(3)
式中:x——有限集;
G——實值函數(shù),其中γ*是所求問題的最小值,x*是其最優(yōu)解。
設(shè)在χ上的一個概率密度函數(shù)族為{f(·;v),v∈V}。 對于給定的概率密度f(·;u),u∈V,優(yōu)化問題又可轉(zhuǎn)化為
(4)
式中:{I{G(X)≤γ}}——指示函數(shù)的集合;
X——由f(·;u)產(chǎn)生的隨機樣本;
Eu——相應(yīng)的期望值。
當γ逐漸接近γ*時,G(X)≤γ為小概率事件;所以,選取合適的u確保Pu(G(X)≤γ)的值不會太小[8],顯然γ和u應(yīng)恰當?shù)倪x擇。當所求問題的概率很小時,可以通過采用多級別算法,構(gòu)造參數(shù)序列{vt,t≥0}和級別序列{γt,t≥1},然后對vt和γt更新迭代。文中利用CE算法對c和g迭代尋優(yōu),概率密度函數(shù)選取高斯分布N(μ,σ2),SVM交叉驗證概率作為適應(yīng)度函數(shù)[9]。
采用連續(xù)型交叉熵算法,以SVM(c,g)為優(yōu)化目標,SVM的交叉驗證概率為適應(yīng)度函數(shù),具體優(yōu)化步驟如下[10]。
(5)
(6)
(7)
步驟5 平滑:對于m=1,2,…,M計算
μL(t)=βμL(t)+(1-β)μL(t-1),
(8)
(9)
利用UCI中的混凝土抗壓強度數(shù)據(jù)進行驗證,數(shù)據(jù)包含1 030個對象,9個連續(xù)屬性,同煤層氣儲層參數(shù)預(yù)測中,測井數(shù)據(jù)和地震屬性數(shù)據(jù)構(gòu)建的樣本集較類似。在訓(xùn)練過程中,輸出量為抗壓強度,輸入向量為各個屬性。經(jīng)過歸一化處理之后,在數(shù)據(jù)集中隨機選取300個樣本構(gòu)成訓(xùn)練樣本集,測試集為包含歸一化處理后的全部數(shù)據(jù),對混凝土抗壓強度進行回歸分析,評價預(yù)測性能。
選取軟件Matlab對此問題編程,實現(xiàn)對SVM核函數(shù)的參數(shù)g與c的迭代尋優(yōu),得出懲罰因子c=13.512 4,徑向基寬度g=0.061 760 3,CV=0.888 889,其c與g的變化曲線如圖1a所示。圖1b為c=13.512 4,g=0.061 760 3時的適應(yīng)度變化曲線即交叉驗證概率曲線。從圖1中可以看出c、g收斂曲線和交叉驗證概率曲線均在進化代數(shù)為40次左右趨于穩(wěn)定,該算法具有較快的收斂速度和穩(wěn)定性。圖2a是混凝土抗壓強度的真實值與交叉熵優(yōu)化支持向量機預(yù)測的情況,只有在樣本值為400左右的位置出現(xiàn)了差異,其余樣本預(yù)測效果較好,圖2b是采用粒子群算法PS和遺傳算法GA對混凝土的抗壓強度進行預(yù)測的結(jié)果,和真實結(jié)果對比可以看出,這兩種智能算法與真實值的結(jié)果在400個樣本后,預(yù)測結(jié)果有很大差別。
a SVM(c,g)
b 交叉熵算法
Fig. 1 Convergence curve of SVM and cross entropy algorithm
a 真實結(jié)果與CE-SVM預(yù)測結(jié)果
b PS與GA優(yōu)化SVM結(jié)果的對比
Fig. 2 Comparison of simulation results of cross entropy algorithm and other intelligent algorithms
表1對訓(xùn)練樣本為300從均方誤差、相關(guān)系數(shù)和訓(xùn)練時間三個方面對三種算法進行了對比。由表1可看出,交叉熵算法的均方誤差要小于粒子群算法和遺傳算法兩種智能算法,相關(guān)系數(shù)要大于粒子群算法和遺傳算法的兩種智能算法,訓(xùn)練時間要比其他兩種智能算法短。
綜上所述交叉熵算法優(yōu)化的支持向量機確實有良好的預(yù)測能力,在某些性能上,要優(yōu)于其他智能算法。因此,以交叉熵算法作為核函數(shù)優(yōu)化算法,構(gòu)建支持向量機預(yù)測模型是有效可行的。
表1 訓(xùn)練集樣本為300的性能評價
Table 1 Performance evaluation of training set samples for 300
算法均方誤差相關(guān)系數(shù)訓(xùn)練時間/sCE0.015360.690648.406PS0.017580.646482.148GA0.019900.6020114.016
5.1 數(shù)據(jù)的選取及處理
測井數(shù)據(jù)主要來源于我國山西沁水盆地南部山西組3號煤層,這些數(shù)據(jù)由兩組構(gòu)成:一組是訓(xùn)練樣本集,用來構(gòu)建測試模型;另一組是測試樣本集,用來對模型進行檢測。在模型構(gòu)建前,需要對樣本數(shù)據(jù)進行歸一化處理,主要有以下兩個原因:一是由于采集到的煤儲層滲透率受數(shù)據(jù)的性質(zhì)、采集技術(shù)等眾多因素影響,這些會對支持向量機的建模和預(yù)測的結(jié)果有一定的影響[11]。二是樣本中的數(shù)據(jù)不易變化太大,它不僅會影響模型的建立,而且對支持向量機的識別和收斂會產(chǎn)生一定的影響。為了盡量減少預(yù)測模型的訓(xùn)練時間、防止數(shù)值變化并且使參數(shù)在計算過程中更容易,所以一般在預(yù)測模型構(gòu)建之前,對樣本集統(tǒng)一進行歸一化處理。滲透率部分樣本的數(shù)據(jù),共有100組,表2選取其中的10組數(shù)據(jù),并對其歸一化處理[12]。
表2 歸一化后的部分樣本
5.2 煤層氣滲透率預(yù)測結(jié)果
圖3為適應(yīng)度曲線,從圖3中可以看出當進化代數(shù)為4的時曲線變得很穩(wěn)定,說明了該算法的收斂速度快的優(yōu)點,圖4是原始滲透率和預(yù)測后的對比,從圖中可以看出大體預(yù)測趨勢較好,圖5是相對誤差圖,盡管有幾個點的誤差比較大,但大部分相對誤差都趨近于0,這更說明了交叉熵支持向量機預(yù)測煤層氣滲透率的可靠性。
由圖5可知,新算法預(yù)測的結(jié)果和滲透率的真實結(jié)果幾乎一致,并且預(yù)測值與實際值的總體趨勢吻合,個別預(yù)測異常點可以忽略。從中得到的均方根誤差為0.032 692 1%,相關(guān)系數(shù)為50.777 71%。
由圖6可以看到,其相關(guān)系數(shù)相對來說較大,但是均方根誤差較小,由此可以說明支持向量機的預(yù)測效果較好,尤其對于小樣本的訓(xùn)練數(shù)據(jù)模型更為適用。當相對誤差率的分布范圍在 0~45%時,大部分被測試數(shù)據(jù)的相對誤差率相差不大,通常只有 1%左右的波動,除了個別數(shù)據(jù)超過20%,總體分布穩(wěn)定。
圖3 適應(yīng)度曲線
圖4 原始數(shù)據(jù)與回歸預(yù)測數(shù)據(jù)的對比
圖5 相對誤差
交叉熵支持向量機的煤層氣滲透率預(yù)測是一種新方法。將交叉熵支持向量機結(jié)合起來應(yīng)用到滲透
率預(yù)測中,通過對該算法的驗證、建模和仿真,并與其他智能算法比較分析,得出該算法對滲透率預(yù)測具有更準確的精度,可以證明該算法具有穩(wěn)定性高、收斂速度快、運行時間短等優(yōu)勢。
將這兩種算法結(jié)合起來應(yīng)用到煤儲層滲透率中可行。今后可以將這種方法應(yīng)用到煤層氣儲層其他參數(shù)的預(yù)測中,可以為煤層氣的勘探與開發(fā)提供很好的幫助。該算法具有較為廣闊的應(yīng)用前景。
[1] 蘇現(xiàn)波, 馮艷麗, 陳江峰. 煤中裂隙的分類[J]. 煤田地質(zhì)與勘探, 2002(4): 21-24.
[2] LEVINE J R. Model study of the influence of matrix shrinkage on absolute Permeability of coal bed reservoir[J]. Geological Society Publication, 1996, 109(1):197-212.
[3] 李志明, 張金珠. 地應(yīng)力與油氣勘探開發(fā)[J]. 北京:石油工業(yè)出版社, 2007(1): 16-27.
[4] 李艷芳, 程建遠, 王 成. 基于支持向量機的地震屬性優(yōu)選及煤層氣預(yù)測[J]. 煤田地質(zhì)與勘探, 2012, 40(6): 75-78.
[5] 邊 莉, 邊晨源. 采用交叉熵支持向量機和模糊積分的電網(wǎng)故障診斷[J]. 電機與控制學(xué)報, 2016, 20(2): 112-120.
[6] 于文彬. 基于偏最小二乘及最小二乘支持向量機算法在儲層參數(shù)預(yù)測上的應(yīng)用[D]. 長春: 吉林大學(xué), 2013.
[7] PIETER TJERK DE BOER, REUVEN Y RUBINSTEIN. A tutorial on the cross-entropy method[J]. Annals of Operations Research. 2005, 134(2): 19-67.
[8] 邊 莉, 邊晨源. 基于組合型交叉熵算法的多電源配電網(wǎng)故障定位[J]. 電力科學(xué)與技術(shù)學(xué)報, 2014, 30(03): 86-91.
[9] 孟召平, 田永東, 李國富. 沁水盆地南部煤儲層滲透性與地應(yīng)力之間關(guān)系和控制機理[J]. 自然科學(xué)進展, 2009, 10(9): 1142-1148.
[10] 傅雪海, 秦 勇, 姜 波, 等. 煤割理壓縮實驗及滲透率數(shù)值模擬[J]. 煤炭學(xué)報, 2001(6): 967-972.
[11] 束詩雨. 基于集成學(xué)習(xí)的支持向量機預(yù)測優(yōu)化算法及其應(yīng)用[D]. 東華大學(xué), 2015.
[12] 王 雷. 支持向量機預(yù)測煤儲層滲透性[D]. 北京: 中國石油大學(xué), 2014.
(編輯 晁曉筠 校對 李德根)
Prediction method of reservoir permeability of coal bed methane
BianLi1,ZhangXinxin2,LiTingting2,CheXiangqian3
(1.School of Electronics & Information Engineering, Heilongjiang University of Science & Technology,Harbin 150022, China; 2.School of Electrical & Control Engineering, Heilongjiang University of Science & Technology, Harbin 150022, China; 3.School of Computer & Information Engineering,Heilongjiang University of Science & Technology, Harbin 150022, China)
This paper presents a novel method tailored for coal bed gas permeability, based on cross entropy optimization support vector machine to address the notorious prediction of conventional parameters due to the stronger nonlinearity associated with the permeability parameters behind coalbed gas reservoir. The algorithm is validated by using the data in UCI database, and then comparing the prediction results with the those of particle swarm algorithm and genetic one, suggesting its feasibility and consequently distinct advantages over other ones. The prediction of the coalbed gas reservoir permeability in a mining area with the actual geological characteristics, using the proposed algorithm, indicates that the algorithm operates within the relative error of about 1% in the data measurement except more than 20% in some individual cases, with a relatively stable distribution. The general consistency between the predicted value of permeability parameter and the distribution map of true value of the mining area points to the conclusion that the algorithm can provide a safe prediction of the parameters behind coal bed gas reservoir.
coal bed methane; permeability prediction; cross entropy algorithm; support vector machine
2016-08-23
國家自然科學(xué)基金項目(51504085);哈爾濱市科技局項目(2015RQQXJ009)
邊 莉(1978-),女,河北省涿州人,副教授,博士,研究方向:陣列信號處理、人工智能技術(shù),E-mail:branran@163.com。
10.3969/j.issn.2095-7262.2016.05.003
TD713.2
2095-7262(2016)05-0480-05
A