孟慶民,劉恩新,孫輝(中石化勝利油田分公司采油工藝研究院,山東 東營 257000)
劉太昂(上海恒陽數(shù)據(jù)技術(shù)有限公司,上海 200444)
李敏杰(上海大學理學院化學系,上海 200444)
在油田的壓裂施工設(shè)計中,以往主要依靠建立裂縫延伸模型并求解驗證,這個過程需要許多的假設(shè)條件以簡化問題的復(fù)雜性。但是,由于影響探井壓裂效果的因素眾多,這種模擬模型有時達不到理想的效果。勝利油田在探井的壓裂過程中積累了大量的數(shù)據(jù),筆者嘗試利用數(shù)據(jù)挖掘技術(shù)從以往這些大量成功的壓裂施工中挖掘?qū)氋F的經(jīng)驗,建立定性、定量的數(shù)學模型,并用這些經(jīng)驗和模型直接指導新的壓裂。
數(shù)據(jù)挖掘(data mining),就是利用機器學習方法對生產(chǎn)中的數(shù)據(jù)樣本進行采集、整理、分析、建模等,試圖歸納和總結(jié)數(shù)據(jù)中蘊含的規(guī)律性,進而利用所建定性或定量的數(shù)學模型預(yù)測未知樣本的性質(zhì)。數(shù)據(jù)挖掘方法有很多種,如關(guān)聯(lián)分析、主成分分析、偏最小二乘法、人工神經(jīng)網(wǎng)絡(luò)、支持向量機等[1]。近年來,油田工作者嘗試將多種數(shù)據(jù)挖掘方法用在壓裂施工中,如陳姍姍等[2]運用灰色關(guān)聯(lián)分析方法建立了適合該區(qū)壓裂效果影響因素分析的數(shù)學模型,并確定各因素優(yōu)先順序和影響程度大小,為該類油藏的壓裂工作提供有效參考。趙艷[3]運用人工神經(jīng)網(wǎng)絡(luò)優(yōu)選壓裂酸化井層,克服了傳統(tǒng)數(shù)學方法在處理這類問題時的局限性和誤差大的缺點。應(yīng)用效果表明,該方法預(yù)測結(jié)果與現(xiàn)場實施壓裂酸化后的增產(chǎn)效果十分相符。田峰等[4]運用灰色關(guān)聯(lián)和回歸方法分析影響壓裂效果的因素,運用灰色關(guān)聯(lián)分析方法定性判斷影響效果的重要因素,并運用多元二次回歸分析確定效果與因素間的定量關(guān)系,平均擬合誤差分別為0.94%,預(yù)測平均誤差分別為1.85%。
支持向量機算法是近幾年數(shù)據(jù)挖掘算法研究的熱點,其不僅可以進行定性分析建模,還可以進行多定量回歸建模,特別是對于小樣本、非線性的復(fù)雜數(shù)據(jù)更具有其獨特的優(yōu)勢。對于壓裂后是否獲得工業(yè)油流做定性分析及壓裂后日產(chǎn)液做定量預(yù)測的研究未見報道,這兩項工作對壓裂效果的評價有著重要的意義。筆者嘗試用支持向量機算法對濁積巖儲層的壓裂效果進行探索性分析,以得到與現(xiàn)場結(jié)果非常相符的定性分析和定量預(yù)測模型,為壓裂施工提供參考依據(jù)。
壓裂效果分析影響因素如下:
1)地質(zhì)因素 地質(zhì)因素是決定壓裂效果的物質(zhì)基礎(chǔ),主要分為儲層類型、沉積相和層位。
2)錄井因素 錄井因素指的是在錄井過程中對儲層的評價,包括巖性分類、含油級別、錄井解釋結(jié)果。
3)測井因素 通過測井方法可以解釋出油層定量的物性參數(shù),包括孔隙度、滲透率、泥質(zhì)含量、含水飽和度、測井解釋結(jié)果。
4)裂縫參數(shù) 裂縫參數(shù)為設(shè)計過程中利用軟件模擬的壓裂后裂縫參數(shù),包括模擬縫寬、模擬縫長、模擬縫高。
5)施工參數(shù) 施工參數(shù)反映的是現(xiàn)場條件下的施工情況,包括試擠排量和壓力、排量、累計砂量、平均砂比、綜合砂比、加砂強度、自噴返排率。
建議我國在進行足球場地數(shù)量建設(shè)的同時,統(tǒng)籌考慮場地質(zhì)量提升的規(guī)劃。具體可以通過試點投入、多方融資等方式逐步引進3G人造草皮足球場地,同時加快本土人造草皮企業(yè)自主產(chǎn)品研發(fā)能力,降低投入成本。為青少年球員提供安全、優(yōu)越的訓練比賽環(huán)境,促進足球人才產(chǎn)生。
6)其他因素 除了以上提及的參數(shù),還有油密度、油黏度、水型、總礦化度等影響因素。
該次研究采用支持向量機(SVM)算法,包括支持向量機分類算法(support vector classification,SVC)和支持向量機回歸算法(support vector regression,SVR)。SVM算法以及內(nèi)部留一法驗證算法參見文獻 [5~10]。
3.2.1 濁積巖儲層壓裂后是否獲得工業(yè)油流的分類模型
1)影響因素選擇 影響因素的選擇對支持向量機分類結(jié)果有著重要影響。用后退法進行影響因素篩選,以支持向量機分類留一法準確率結(jié)果作為篩選依據(jù)。留一法準確率(P)可按下式計算:
式中:na為留一法判別正確的樣本數(shù);n為總的樣本數(shù)。
通過變量篩選,最終篩選的變量為:泥質(zhì)含量、含水飽和度、綜合砂比、加砂強度、前日產(chǎn)液,共5個變量。
2)SVC模型參數(shù)選擇 懲罰因子C在支持向量機建模過程中對建模的結(jié)果有著重要的影響,C取不同的值,準確率有著明顯的不同。
從圖1可以看出,當懲罰因子C取12時,支持向量機分類留一法結(jié)果的準確率P最高,為81.82%。
3)SVC模型構(gòu)建 當采用徑向基核函數(shù),懲罰因子C取12時,得到壓裂后是否獲得工業(yè)油流的分類訓練模型:
式中:αi為支持向量對應(yīng)的拉格朗日因子;xi為支持向量;x為未知向量。
當f(x)≥0時,判別為壓裂后可以獲得工業(yè)油流。根據(jù)式(2)得到訓練集44個樣本壓裂后是否獲得工業(yè)油流的準確率Q為93.18%。Q的計算公式為:
式中:ma為訓練集中預(yù)測正確的樣本數(shù);m為訓練集總的樣本數(shù)。SVC模型分類結(jié)果如圖2所示。
圖1 懲罰因子C的選擇
圖2 SVC的建模結(jié)果圖
4)SVC模型驗證 采用留一法來檢驗壓裂后是否獲得工業(yè)油流的SVC分類模型,其使用結(jié)果表明,采用留一法檢驗的準確率為81.82%。
基于支持向量機算法得到的濁積巖油井壓裂后是否獲得工業(yè)油流的分類模型,其建模準確率為93.18%,留一法正確率為81.82%,說明該模型有比較強的預(yù)測能力。
3.2.2 濁積巖儲層壓裂后日產(chǎn)液的定量預(yù)測模型
1)影響因素篩選 利用后退法進行變量篩選,篩選后的變量是:油層中深、孔隙度、滲透率、累計砂量、自噴返排率,共5個變量。
2)懲罰因子C和不敏感函數(shù)g(x)的選擇 支持向量機回歸模型預(yù)測能力與懲罰因子C及不敏感函數(shù)g(x)有著密切關(guān)系。以濁積巖油井壓裂后日產(chǎn)液留一法預(yù)測的平均相對誤差(εr,avg)作為SVR模型參數(shù)選擇標準。εr,avg可按下式計算:
式中:qai為第i個樣本壓裂后日產(chǎn)液的實際值;qpi為第i個樣本壓裂后日產(chǎn)液的預(yù)測值。
懲罰因子C和不敏感函數(shù)g(x)的選擇如下:
圖3 懲罰因子C的選擇圖
圖4 不敏感函數(shù)g(x)的選擇圖
由圖3可見,當C取5時,留一法的平均相對誤差最小,為21.6%。由圖4可見,當g(x)取0.03時,留一法平均相對誤差最小,為20.9%。
3)壓裂后日產(chǎn)液的SVR訓練模型和驗證 以油層中深、孔隙度、滲透率、累計砂量、自噴返排率為自變量,以壓裂后日產(chǎn)液為目標函數(shù),采用SVR方法建模,采用徑向基核函數(shù),懲罰因子C取5,不敏感函數(shù)g(x)取0.03,將濁積巖探井數(shù)據(jù)歸一化處理后得到壓裂后日產(chǎn)液的SVR訓練模型,標準化方程如下:
式中:βi為支持向量對應(yīng)的拉格朗日因子。
基于SVR訓練模型的訓練集樣本的壓裂后日產(chǎn)液擬合結(jié)果見圖5。
壓裂后日產(chǎn)液的實際值和預(yù)測值二者之間的相關(guān)系數(shù)及平均相對誤差是度量回歸方程擬合程度的重要統(tǒng)計量。對于濁積巖探井壓裂后日產(chǎn)液的SVR模型,相關(guān)系數(shù)為0.95,平均相對誤差為10.97%。以留一法結(jié)果的判決系數(shù)和平均相對誤差作為判別回歸模型泛化能力的標準。留一法結(jié)果如圖6所示。留一法結(jié)果的相關(guān)系數(shù)為0.82,平均相對誤差為20.89%。由留一法結(jié)果的相關(guān)系數(shù)和平均相對誤差可見:濁積巖儲層壓裂后日產(chǎn)液的SVR模型有很好的泛化能力。
圖5 SVR建模結(jié)果
圖6 SVR留一法結(jié)果
1)利用支持向量機算法對濁積巖儲層壓裂效果進行定性、定量建模研究。在壓裂后是否獲得工業(yè)油流的定性建模中,支持向量機分類模型建模結(jié)果的準確率為93.18%,留一法結(jié)果的準確率為81.82%;在壓裂后日產(chǎn)液的定量建模中,SVR模型的建模結(jié)果平均相對誤差為10.97%,留一法結(jié)果的平均相對誤差為20.89%。
2)通過對濁積巖儲層壓裂效果進行定性、定量建模分析,證明利用數(shù)據(jù)挖掘技術(shù)來分析油田開發(fā)生產(chǎn)過程中的復(fù)雜數(shù)據(jù)是可行的。數(shù)據(jù)挖掘技術(shù)應(yīng)用的關(guān)鍵是選擇合理的表征參數(shù),應(yīng)盡可能多地考慮表征參數(shù),增加分析的準確性和合理性。
[1]陸文聰,李國正 .化學數(shù)據(jù)挖掘方法與應(yīng)用 [M].北京:化學化工出版社,2012.
[2]陳珊珊,鄧虎成,吳巧英,等 .灰色關(guān)聯(lián)分析在壓裂效果影響因素研究中的應(yīng)用 [J].遼寧化工,2012,41(8):829~831.
[3]趙艷 .壓裂酸化井層優(yōu)選方法研究 [J].內(nèi)蒙古石油化工,2012,38(11):148~149.
[4]田峰,李昂,陳德春,等 .灰色關(guān)聯(lián)分析和多元二次非線性回歸分析模型研究及應(yīng)用 [J].內(nèi)蒙古石油化工,2012,38(9):118~120.
[5]Vapnik V N.Statistical Learning Theory [M].New York:Wiley,1998.
[6]陸文聰,陳念貽,葉晨洲,等 .支持向量機算法和軟件ChemSVM介紹 [J].計算機與應(yīng)用化學,2002,19(6):697~702.
[7]劉太昂,陸文聰,張良苗,等 .支持向量分類用于醚菊酯類似物構(gòu)效關(guān)系的研究 [J].計算機與應(yīng)用化學,2004,21(6):795~799.
[8]陳念貽,陸文聰,葉晨洲,等 .支持向量機及其核函數(shù)算法在化學計量學中的應(yīng)用 [J].計算機與應(yīng)用化學,2002,19(6):691~696.
[9]Vapnik V N.The nature of statistical learning theory [M].Berlin:Springer,1995.
[10]Niu B,Jin Y H,Lu W C.Predicting toxic action mechanisms of phenols using AdaBoost learner [J].Chemometr Intell Lab,2009,96:43~48 .