王佩珊,趙立強(qiáng),羅志鋒,李年銀 (西南石油大學(xué)石油工程學(xué)院,四川成都 610500)
曾祥宇 (中石油吐哈油田分公司開(kāi)發(fā)部,新疆 鄯善 838202)
柯建興 (中石油西部鉆探公司吐哈鉆井公司,新疆 鄯善 838202)
庫(kù)車坳陷西部作為塔里木盆地加快尋找大油氣田的主攻地區(qū)[1],是當(dāng)下熱門開(kāi)發(fā)目標(biāo)之一。區(qū)塊內(nèi)多數(shù)儲(chǔ)層屬于異常高壓裂縫性儲(chǔ)層,地質(zhì)條件較為復(fù)雜,產(chǎn)能有效評(píng)估難度較大。目前油氣田開(kāi)發(fā)中常用的產(chǎn)能評(píng)估手段主要有2種:一是井下測(cè)試[2],但在異常高壓儲(chǔ)層條件下直接下入井下測(cè)試工具風(fēng)險(xiǎn)大且耗時(shí);二是數(shù)值模擬[3],由于裂縫性儲(chǔ)層滲流方式復(fù)雜,建立和求解數(shù)學(xué)物理模型難度大。
鑒于上述2種方法的局限性,從統(tǒng)計(jì)學(xué)角度出發(fā),嘗試?yán)脭?shù)據(jù)挖掘技術(shù)直接分析現(xiàn)場(chǎng)數(shù)據(jù),以期達(dá)到有效評(píng)估產(chǎn)能的目標(biāo)。一種簡(jiǎn)單可行的方法是利用偏最小二乘法進(jìn)行多元回歸分析,建立產(chǎn)能與影響因素之間的經(jīng)驗(yàn)?zāi)P汀?/p>
偏最小二乘回歸 (partial least squares regression,PLSR)是一種多因變量對(duì)多自變量的回歸建模方法。它集多元線性回歸分析、典型相關(guān)分析和主成分分析于一體,能夠?qū)崿F(xiàn)對(duì)高維數(shù)據(jù)空間的降維處理[4],并能有效地解決自變量間多重相關(guān)情況下的回歸建模問(wèn)題。同時(shí),PLSR在處理小樣本多元數(shù)據(jù)問(wèn)題方面也具有明顯優(yōu)勢(shì)。隨著計(jì)算機(jī)科學(xué)技術(shù)的發(fā)展,PLSR在生物醫(yī)學(xué)、環(huán)境工程等許多方面得到了廣泛的應(yīng)用[5~8],但在石油勘探與開(kāi)發(fā)領(lǐng)域中的應(yīng)用報(bào)道較少[9,10]。
筆者以庫(kù)車坳陷西部某異常高壓裂縫性儲(chǔ)層酸壓井為例,提出了一種基于偏最小二乘回歸和變量投影重要性分析的快速酸壓產(chǎn)能評(píng)估方法。該方法可用于分析主控因素,預(yù)測(cè)增產(chǎn)潛力,指導(dǎo)選井選層以及優(yōu)化施工參數(shù)。計(jì)算結(jié)果表明該方法精度高,實(shí)用性強(qiáng)。
庫(kù)車西部A氣藏屬于低孔裂縫性砂巖干氣氣藏,埋深普遍在5000m以上,地層壓力因數(shù)普遍超過(guò)1.5,屬超深高壓氣藏;基質(zhì)滲透率為0.01~0.1mD,孔隙度為6%~8%,屬低孔低滲儲(chǔ)層[1]。該區(qū)塊正處于開(kāi)發(fā)初期,樣本資料不多,此處僅收集到了目標(biāo)區(qū)塊8口酸壓井的地質(zhì)及生產(chǎn)資料 (見(jiàn)表1),正好可以用來(lái)檢驗(yàn)該方法在處理小樣本問(wèn)題上的有效性。
表1 A氣藏部分酸壓井基礎(chǔ)數(shù)據(jù)
針對(duì)儲(chǔ)層具體情況,根據(jù)經(jīng)驗(yàn)選取了10個(gè)酸壓產(chǎn)能影響因素進(jìn)行分析與預(yù)測(cè),產(chǎn)能基本模型表述如下:
式中:為單井日產(chǎn)氣量,m3;xloss為漏失量,m3;xstor為儲(chǔ)能系數(shù) (hφSg),m;h為儲(chǔ)層厚度,m;φ為孔隙度,1;Sg為含氣飽和度,%;xρ為裂縫條密度,條/m;xratio為面縫率,%;xopen為張開(kāi)度,mm;xlen為裂縫視長(zhǎng)度,m;xdip為傾角,(°);xacid為用酸強(qiáng)度,m3/m;xdeliv為排量,m3/min;xΔp為生產(chǎn)壓差,MPa。
為了檢驗(yàn)各個(gè)產(chǎn)能影響因素之間是否存在相關(guān)性,引入皮氏積矩相關(guān)系數(shù)來(lái)衡量2個(gè)隨機(jī)變量之間線性相關(guān)程度的指標(biāo)。相關(guān)系數(shù)計(jì)算公式為:
針對(duì)例中情況,a和b分別代表不同的影響因子,如xloss和xopen;m取值為樣本數(shù)8。分別計(jì)算兩因素之間的相關(guān)系數(shù),r如表2所示。各變量間存在一定程度的線性相關(guān)性,相關(guān)系數(shù)絕對(duì)值最大為0.86,有8組相關(guān)系數(shù)在0.500以上,說(shuō)明影響因素之間存在多重共線性關(guān)系。因此,考慮到偏最小二乘回歸在消除線性相關(guān)影響方面的優(yōu)勢(shì),利用其對(duì)這些數(shù)據(jù)進(jìn)行分析具有針對(duì)性。
表2 各影響因素相關(guān)系數(shù)表
分別在產(chǎn)能影響因素集合X= {x1,x2,…,xp}n×p和產(chǎn)能集合Y= {y1,y2,…,yq}n×q中依次提取主成分ti和ui,并要求:①ti和ui盡可能多地?cái)y帶各自數(shù)據(jù)表中的變異信息,盡可能好地代表X和Y;②ti和ui的相關(guān)程度能夠達(dá)到最大,ti對(duì)ui有最強(qiáng)的解釋能力。最終提取出的h個(gè)主成分t1,t2,…,th對(duì)產(chǎn)能的解釋性最強(qiáng),且克服了各影響因素之間的多重相關(guān)性,剔除了噪聲信息的干擾。通過(guò)實(shí)施產(chǎn)能集合Y對(duì)t1,t2,…,th的回歸 (h<A,A為X的秩),最后表達(dá)成產(chǎn)能Y關(guān)于原始產(chǎn)能影響因素x1,x2,…,xp的回歸方程。
在PLSR中,回歸的產(chǎn)能影響因素?cái)?shù)目從p降為h,由于h遠(yuǎn)小于樣本數(shù)n,解決了小樣本問(wèn)題;且t1,t2,…,th之間相互獨(dú)立,解決了多重相關(guān)性的問(wèn)題。
利用偏最小二乘方法對(duì)表1中前6組數(shù)據(jù)進(jìn)行處理,通過(guò)Matlab 7.12.0編程實(shí)現(xiàn)[11,12]。最終提取2個(gè)成分t1、t2,建立了異常高壓低孔裂縫性砂巖氣藏縫網(wǎng)酸壓產(chǎn)能的多元線性回歸的經(jīng)驗(yàn)?zāi)P廷瘢?/p>
測(cè)定系數(shù)R2=0.862697,說(shuō)明擬合樣本數(shù)據(jù)程度較高。
在產(chǎn)能模型基礎(chǔ)上進(jìn)行變量投影重要性分析,既可以定性分析各因素的影響程度,為后期增產(chǎn)措施提供指導(dǎo);又可以在變量較多的情況下篩選自變量,簡(jiǎn)化模型,提高精度,方便現(xiàn)場(chǎng)使用。
變量投影重要性指標(biāo)Ivip(variable importance in projection)[12]用以測(cè)度自變量對(duì)因變量的解釋能力。其定義式為:
式中:Rd(Y;tk)和Rd(Y;t1,t2,…,th)分別是單個(gè)主成分tk對(duì)產(chǎn)能Y的解釋能力和所有主成分t1,t2,…,th對(duì)Y的累計(jì)解釋能力。對(duì)于p個(gè)自變量xj,如果它們?cè)诮忉寉時(shí)作用都相同,則所有Ivip,j均等于1;Ivip,j越大,則xj在解釋y時(shí)就越重要。據(jù)此,可對(duì)各產(chǎn)能影響因素的相對(duì)重要程度進(jìn)行比較,篩選出主控因素。表3為模型Ⅰ中10個(gè)影響因素的Ivip值。
由表3可看出,用酸強(qiáng)度對(duì)產(chǎn)能的影響最大,其次是漏失量;裂縫參數(shù)的Ivip值同樣較高,說(shuō)明天然裂縫性儲(chǔ)層中裂縫參數(shù)對(duì)產(chǎn)能的影響不可忽視。排量、生產(chǎn)壓差、儲(chǔ)能系數(shù)、視長(zhǎng)度和面縫率的Ivip值較小,說(shuō)明它們對(duì)產(chǎn)能的解釋程度均較小。由此,篩選出目標(biāo)儲(chǔ)層酸壓井產(chǎn)能主控因素依次為用酸強(qiáng)度、鉆井液漏失量、張開(kāi)度、裂縫密度和傾角。
表3 模型Ⅰ中10個(gè)影響因素的Ivip值
由于模型Ⅰ中影響因素太多,計(jì)算煩瑣,不方便現(xiàn)場(chǎng)快速使用,可考慮僅使用篩選出的主控因素回歸得到簡(jiǎn)化模型。
依照產(chǎn)能建模方法,對(duì)于只考慮主控因素的數(shù)據(jù)組,通過(guò)提取2個(gè)成分t1、t2,建立了異常高壓低孔裂縫性砂巖氣藏酸壓產(chǎn)能的多元線性回歸的經(jīng)驗(yàn)?zāi)P廷颍?/p>
測(cè)定系數(shù)R2=0.848796091,說(shuō)明擬合樣本數(shù)據(jù)程度較高。再次通過(guò)變量投影重要性分析,得到了模型Ⅱ中5個(gè)影響因素的Ivip值:用酸強(qiáng)度Ivip=1.18,漏失量Ivip=1.12;張開(kāi)度Ivip=0.96;傾角Ivip=0.87;裂縫密度Ivip=0.82。各因素對(duì)產(chǎn)能的解釋能力差別不大,各自變量解釋性均較強(qiáng),該模型較為合理。
利用實(shí)測(cè)數(shù)據(jù)對(duì)模型可靠性進(jìn)行檢驗(yàn),即在給定儲(chǔ)層條件和施工參數(shù)情況下,分別利用2個(gè)模型對(duì)產(chǎn)能進(jìn)行預(yù)測(cè),并與實(shí)際產(chǎn)氣量進(jìn)行對(duì)比,結(jié)果如表4所示,2種模型預(yù)測(cè)精度較高,均在工程允許誤差范圍之內(nèi),可用于酸壓井產(chǎn)能評(píng)估。模型Ⅱ所用數(shù)據(jù)少且預(yù)測(cè)精度高,更適合目標(biāo)氣藏開(kāi)發(fā)現(xiàn)場(chǎng)應(yīng)用。
表4 實(shí)際產(chǎn)氣量與PLSR預(yù)測(cè)值對(duì)比
1)利用偏最小二乘法直接對(duì)已有數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,避免了復(fù)雜的數(shù)學(xué)建模及求解過(guò)程;所得經(jīng)驗(yàn)?zāi)P图瓤梢灶A(yù)測(cè)增產(chǎn)效果,指導(dǎo)選井選層,又可以在給定產(chǎn)量要求時(shí)確定施工參數(shù)。
2)主控因素分析結(jié)果表明,施工參數(shù)、漏失量和天然裂縫對(duì)儲(chǔ)層酸壓后的產(chǎn)能具有重要影響。
3)建模方法快速簡(jiǎn)單,可靠性檢驗(yàn)結(jié)果表明其精度高,且具有普適性,適合推廣應(yīng)用到產(chǎn)能評(píng)估以外的其他方面。
[1]田東江,牛新年,郜國(guó)喜,等 .庫(kù)車山前大北地區(qū)裂縫性氣藏儲(chǔ)層改造評(píng)價(jià)研究 [J].油氣井測(cè)試,2012,21(5):2~23.
[2]尹邦堂,李相方,孟悅新,等 .泵抽式電纜地層測(cè)試儲(chǔ)層產(chǎn)能預(yù)測(cè)方法研究 [J].斷塊油氣田,2011,18(5):611~615.
[3]張紹輝,尹洪軍,呂杭,等 .裂縫性低滲透氣藏垂直裂縫井產(chǎn)能分析 [J].科學(xué)技術(shù)與工程,2010,10(8):1848~1851.
[4]王惠文 .偏最小二乘回歸方法及其應(yīng)用 [M].北京:國(guó)防工業(yè)出版社,2000.150~170.
[5]錢筱丹,黎放,卞金露 .偏最小二乘回歸在艦船維修費(fèi)用預(yù)測(cè)中的應(yīng)用 [J].艦船科學(xué)技術(shù),2007,29(4):98~100.
[6]朱洵,榮起國(guó) .基于偏最小二乘回歸的基因網(wǎng)絡(luò)數(shù)學(xué)建模 [J].艦船科學(xué)技術(shù),2009,31(4):1148~1153.
[7]楊美燕,吳志紅,劉艷麗,等 .一種基于偏最小二乘法的室外光照估計(jì)算法 [J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2012,24(4):541~547.
[8]張國(guó)文,倪永年 .偏最小二乘-同步熒光光譜法同時(shí)測(cè)定鰻魚(yú)組織中三種喹諾酮藥物殘留量 [J].光譜學(xué)與光譜分析,2006,26(1):113~116.
[9]戈漢權(quán),施澤進(jìn),任在清 .基于偏最小二乘與神經(jīng)網(wǎng)絡(luò)耦合的儲(chǔ)層參數(shù)預(yù)測(cè) [J].光譜學(xué)與光譜分析,2007,27(6):618~116.
[10]于占清,薛海濤,王民,等 .偏最小二乘法在合采井單層產(chǎn)能貢獻(xiàn)率配分中的應(yīng)用 [J].科學(xué)技術(shù)與工程,2011,11(11):2468~2472.
[11]王惠文 .偏最小二乘回歸的線性與非線性方法 [M].北京:國(guó)防工業(yè)出版社,2006.128~141.
[12]張恒喜,郭基聯(lián),朱家元,等 .小樣本多元數(shù)據(jù)分析方法及應(yīng)用 [M].西安:西北工業(yè)大學(xué)出版社,2002.22~33.
[編輯] 黃鸝