喬 磊,陳立海,王 平,季新杰,崔 友,袁孟偉
(1.承德石油高等專科學(xué)校 a.儀器儀表工程技術(shù)研究中心;b.熱能工程系,河北 承德 067000;2.承德醫(yī)學(xué)院附屬醫(yī)院南院,河北 承德 067000)
煤層氣是一種自生自儲的,以甲烷為主要成分,主要吸附在煤巖基質(zhì)的微孔隙內(nèi)表面,少部分游離于裂縫孔隙或溶解于煤層水中的非常規(guī)天然氣。開發(fā)利用煤層氣,對于緩解我國當(dāng)前油氣資源短缺的現(xiàn)狀,保證國民經(jīng)濟(jì)持續(xù)快速健康發(fā)展具有重大意義[1-2]。產(chǎn)能是表征儲層動態(tài)特征的一個綜合指標(biāo),是儲層的生產(chǎn)潛力和各種影響因素之間通過相互制約而達(dá)到的一種動態(tài)平衡。利用測井方法評價儲層產(chǎn)能,就是力圖利用這種通過測井方法獲取的靜態(tài)的儲層參數(shù)來預(yù)測儲層的產(chǎn)能[3-7]。開展煤層氣儲層產(chǎn)能預(yù)測研究,建立基于測井技術(shù)的煤層氣儲層產(chǎn)能級別預(yù)測模型,形成煤層氣儲層產(chǎn)能評價體系,可以拓展測井技術(shù)在煤層儲層評價上的應(yīng)用,優(yōu)選開發(fā)區(qū)域和層位、降低煤層氣開發(fā)風(fēng)險、提高開發(fā)效率和經(jīng)濟(jì)效益。
支持向量機(jī)(Support Vector Machine,簡稱SVM)是Vapnik等人在1995年創(chuàng)立的一種基于VC維理論和結(jié)構(gòu)最小化原則的通用機(jī)器學(xué)習(xí)方法,其特點(diǎn)是在解決學(xué)習(xí)性的問題時利用核函數(shù)技術(shù),在解決推廣性的問題利用正則化解法,據(jù)此建立的模型使得預(yù)測的準(zhǔn)確性大幅度提高[8-9]。
設(shè)非線性訓(xùn)練集為{(x1,y1),…,(xi,yi)},xi∈Rn,yi∈R,i=1,2,…,l,其中訓(xùn)練集x通過非線性變換φ被映射到高維空間,在高維空間將訓(xùn)練集的非線性關(guān)系變換成線性關(guān)系后建立回歸預(yù)測函數(shù)?;貧w預(yù)測函數(shù)f(x)的具體形式為:
f(x)=ω·φ(x)+b
(1)
公式(1)中,ω·φ(x)為向量ω與φ(x)的內(nèi)積;ω的維數(shù)是高維空間為維數(shù);b∈R,為閾值。
為求取ω和b,引入松弛變量ε,將公式(5-30)轉(zhuǎn)化成如下優(yōu)化問題:
(2)
約束條件為:
(3)
公式(2)中,C為懲罰系數(shù),C越大意味著對訓(xùn)練誤差大于ε的數(shù)據(jù)樣本的懲罰越大;ε規(guī)定了回歸函數(shù)與輸出之間的誤差要求;ε越小,回歸函數(shù)與輸出之間的誤差越小,估計(jì)的精度也就越高。
通過構(gòu)造拉格朗日函數(shù)以求其鞍點(diǎn);并利用Wolfe對偶定理,將其轉(zhuǎn)化為對偶形式求解:
(4)
然后,依照Karush-Kuhn-Tucker最優(yōu)化條件,并采用核函數(shù)K(x,xi),推導(dǎo)出非線性回歸函數(shù)的表達(dá)式如下:
(5)
公式(5)中b的計(jì)算方法如下:
(6)
本文采用徑向基RBF核函數(shù),其優(yōu)勢是能夠較好解決復(fù)雜的非線性問題:
(7)
最后得到非線性支持向量機(jī)的估計(jì)函數(shù),具體形式如下:
(8)
在求解非線性支持向量機(jī)模型過程中,懲罰因子C和核函數(shù)K(x,xi)中的參數(shù)σ的選擇對非線性支持向量回歸機(jī)的預(yù)測結(jié)果具有很大影響。選擇合適的C值和σ值,是使得支持向量機(jī)預(yù)測效果達(dá)到最優(yōu)的關(guān)鍵。目前,最直接的尋找懲罰因子C和核函數(shù)參數(shù)σ的方法是網(wǎng)格搜索法,該方法需要遍歷C和σ所有可能的取值范圍,計(jì)算量過大,效率也較低。粒子群優(yōu)化算法作為一種隨機(jī)搜索算法,能夠通過一代一代的進(jìn)化較為高效的搜索到最優(yōu)的懲罰因子C和核函數(shù)參數(shù)σ。
粒子群優(yōu)化算法(Particle Swarm Optimization,簡稱PSO)是Kennedy和Eberhart從生物種群的社會行為中得到啟發(fā),特別是一些動物如鳥類等能夠作為一個群體相互協(xié)作在特定區(qū)域中覓食而提出的一種基于群體智能的全局尋優(yōu)算法。PSO算法將在多維搜索空間的每個個體抽象為單個粒子,同時將每個粒子隨機(jī)初始化,并通過跟蹤每個粒子當(dāng)前最優(yōu)解(也稱個體極值,pbest)和群體當(dāng)前最優(yōu)解(也稱全局極值,gbest)而不斷迭代更新,最后尋找到最優(yōu)解[10-12]。
粒子群優(yōu)化算法采用下面方程來更新每個粒子個體和粒子群體的最佳位置。
(9)
pg(t)∈{p1,p2,…,ps}=
min{f(p1(t)),f(p2(t)),…,f(ps(t))}
(10)
s為群體的大小。
在粒子不斷迭代中,每個粒子通過下面方程更新本身的位置和速度,直到找到最優(yōu)解。
vid(t+1)=wvid(t)+c1r1(pid(t)-
xid(t)+c2r2(pgd(t)-xid(t)))
(11)
xid(t+1)=xid(t)+vid(t)
(12)
其中,w為慣性權(quán)重;c1和c2為學(xué)習(xí)因子;r1和r2是隨機(jī)數(shù),范圍在[0,1]之間。
綜上所述,粒子群優(yōu)化算法(PSO)的流程圖如圖1所示。
本文利用選取的20口井作為建模樣本,QSN-T1、QSN-T2和QSN-T3井的作為測試樣本,利用選取的20口井3#煤層利用測井技術(shù)計(jì)算的煤層厚度、埋深、碳分、灰分、含氣量、裂縫孔隙度和滲透率7個因素作為支持向量機(jī)的輸入?yún)?shù),相應(yīng)的每口井的平均日產(chǎn)氣量作為輸出參數(shù),建立粒子群優(yōu)化的支持向量機(jī)模型對煤層氣儲層的產(chǎn)能進(jìn)行預(yù)測[13]。預(yù)測的流程如圖2 所示。
在利用支持向量機(jī)模型處理實(shí)際井時,逐點(diǎn)計(jì)算該井3#煤層每個測井采樣點(diǎn)的產(chǎn)氣量,然后在該煤層段取平均,進(jìn)而獲取該井3#煤層的特征氣量。
QSN-T1井是一口低產(chǎn)井(低產(chǎn):<300 m3/d),實(shí)際壓裂后產(chǎn)氣量為181 m3/d。圖3為QSN-T1井3#煤層支持向量機(jī)模型產(chǎn)能預(yù)測成果圖,在3#煤層,按照支持向量機(jī)模型計(jì)算的特征產(chǎn)氣量值為159.77 m3/d,預(yù)測為低產(chǎn)能級別儲層,與實(shí)際產(chǎn)能級別吻合。
QSN-T2井為一口中產(chǎn)井(中產(chǎn):300~1 000 m3/d),實(shí)際壓裂后的產(chǎn)氣量為710 m3/d。圖4為QSN-T2井3#煤層支持向量機(jī)模型產(chǎn)能預(yù)測成果圖,在3#煤層,按照支持向量機(jī)模型計(jì)算的特征產(chǎn)氣量值為592.61 m3/d,預(yù)測為中產(chǎn)能級別儲層,與實(shí)際產(chǎn)能級別吻合。
QSN-T3井為一口高產(chǎn)井(高產(chǎn):>1 000 m3/d),實(shí)際壓裂后的產(chǎn)氣量為1 410 m3/d。圖5為QSN-T3井3#煤層支持向量機(jī)模型產(chǎn)能預(yù)測成果圖,在3#煤層,按照支持向量機(jī)模型計(jì)算的特征產(chǎn)氣量值為1 316.26 m3/d,預(yù)測為高產(chǎn)能級別儲層,與實(shí)際產(chǎn)能級別吻合。
本文介紹了基于粒子群優(yōu)化的支持向量機(jī)模型,并應(yīng)用到煤層氣儲層產(chǎn)能預(yù)測中。支持向量機(jī)作為一種非參數(shù)統(tǒng)計(jì)學(xué)習(xí)模型可以反映測井計(jì)算的煤層氣儲層參數(shù)和產(chǎn)能之間復(fù)雜的非線性關(guān)系。通過樣本訓(xùn)練建立支持向量機(jī)回歸模型可以直接預(yù)測煤層產(chǎn)氣量的大小。經(jīng)過實(shí)際試氣資料驗(yàn)證,該模型計(jì)算的煤層氣儲層產(chǎn)能級別與實(shí)際產(chǎn)能級別吻合較好,能夠達(dá)到對研究區(qū)塊煤層氣儲層產(chǎn)能進(jìn)行預(yù)測的要求,拓展了測井技術(shù)在煤層氣儲層評價上的應(yīng)用。