馬文禮,李治平,孫玉平,張靜平,鄧思哲
(1.中國地質(zhì)大學(北京),北京 100083;2.非常規(guī)天然氣能源地質(zhì)評價與開發(fā)工程北京市重點實驗室,北京 100083;3.中國石油勘探開發(fā)研究院,河北 廊坊 065007;4. 中國華騰工業(yè)有限公司,北京 100080)
頁巖氣的高效開發(fā)對優(yōu)化中國能源結構、保障中國能源安全意義重大[1-3]。頁巖氣井鉆前產(chǎn)能預測是頁巖氣開發(fā)方案制訂與優(yōu)化的重要環(huán)節(jié),可為頁巖氣開發(fā)投資風險的評估提供依據(jù)。由于頁巖氣開發(fā)受很多不確定性因素影響,使得目前在頁巖氣的實際生產(chǎn)中,確定性的產(chǎn)能預測方法可靠性差[4-10]??紤]頁巖氣開發(fā)的不確定性,開展頁巖氣產(chǎn)能非確定性預測方法研究,是解決上述問題的有效途徑。然而,現(xiàn)有的頁巖氣產(chǎn)能非確定性預測方法僅適用于投產(chǎn)后的頁巖氣井[11-15],缺少適用于頁巖氣井鉆前產(chǎn)能非確定性預測的方法。針對上述問題,建立了一種適用于頁巖氣井鉆前產(chǎn)能非確定性預測的方法,新方法可利用已投產(chǎn)井的地質(zhì)、工程及生產(chǎn)數(shù)據(jù),預測了擬鉆頁巖氣井投產(chǎn)后的產(chǎn)能概率區(qū)間,包括頁巖氣井的產(chǎn)能上限與下限,以及每種可能產(chǎn)能動態(tài)的概率。運用該方法,可在頁巖氣井鉆前快速獲得較為可靠的、基于概率的產(chǎn)能信息。
頁巖氣產(chǎn)能非確定性預測方法的實施流程如圖1所示。
圖1 基于機器學習的頁巖氣產(chǎn)能非確定性預測方法流程
技術要點①選用參考文獻[16]提出的最大信息系數(shù)相關性分析方法,定量分析影響頁巖氣產(chǎn)能指標的各種地質(zhì)因素與工程因素,所確定的主控因素將作為下一步建立產(chǎn)能指標確定性預測模型的輸入變量。利用最大信息系數(shù)分析變量之間相關性的核心思想是:制作2個變量的散點圖,將該散點圖網(wǎng)格化后,變量之間相關性越強,散點圖中的點應包含在越少的網(wǎng)格之內(nèi)?;谶@一原理,不僅可以識別變量之間的線性相關關系,也可以探測非線性相關關系,這是傳統(tǒng)Pearson相關系數(shù)不具備的優(yōu)點。
支持向量機(SVM)立足于嚴密的數(shù)學分析,當處理小樣本時,模型泛化能力更強,不易出現(xiàn)過擬合的問題[17-20],文中選用支持向量機技術建立頁巖氣產(chǎn)能指標確定性預測模型。通常支持向量機需要借助優(yōu)化算法選擇最優(yōu)的初始參數(shù),而遺傳算法(GA)和粒子群算法(PSO)往往是首選。然而,傳統(tǒng)的遺傳算法局部搜索能力較弱且收斂速度慢,傳統(tǒng)的粒子群算法由于缺少變異性容易陷入局部最小化[21-23]。考慮到經(jīng)典遺傳算法與粒子群算法的各自優(yōu)勢,提出一種混合優(yōu)化算法(HGAPSO),用以優(yōu)化支持向量機的參數(shù)。該算法的核心思想是將經(jīng)典遺傳算法的演化算子集成到經(jīng)典粒子群算法中,以彌補其劣勢。圖2為HGAPSO的計算流程,由圖2可知,每一次迭代過程,在更新了所有粒子的速度和位置后,將演化算子(選擇、交叉、變異)隨機應用到一部分粒子之中,產(chǎn)生了一些新粒子,新粒子增加到粒子群中,解決了經(jīng)典粒子群算法容易陷入局部最小的問題。
圖2 利用HGAPSO優(yōu)化SVM模型的流程圖
通過技術要點②預測擬鉆頁巖氣井的產(chǎn)能指標,計算得到該擬鉆井確定性的產(chǎn)量動態(tài)q。通過對已投產(chǎn)頁巖氣井產(chǎn)能指標的統(tǒng)計分析,估計擬鉆頁巖氣井產(chǎn)能指標的先驗分布?;谖墨I[12],開展“蒙特卡洛-馬爾科夫鏈”模擬,預測擬鉆頁巖氣井產(chǎn)能指標后驗分布,在此基礎上對該井產(chǎn)量動態(tài)進行非確定性預測。擬鉆頁巖氣井產(chǎn)能指標后驗分布的“蒙特卡洛-馬爾科夫鏈”模擬步驟如下。
(1) 在各產(chǎn)能指標先驗分布中抽取一組樣本Xproposal,運用常規(guī)氣藏工程方法,計算得到該產(chǎn)能指標樣本下的產(chǎn)量動態(tài)qproposal。
(2) 按下式計算判定系數(shù)α。
(1)
式中:α為判定系數(shù);σt-1為上一時間步由隨機抽取的產(chǎn)能指標Xt-1計算得到的動態(tài)產(chǎn)量qt-1與預測確定性的動態(tài)產(chǎn)量q之間的標準差;std為計算標準差函數(shù);σproposal為當前時間步由隨機抽取的產(chǎn)能指標Xproposal計算得到的動態(tài)產(chǎn)量qproposal與預測確定性的動態(tài)產(chǎn)量q之間的標準差;σ為所有已投產(chǎn)井計算產(chǎn)能指標時擬合誤差的均值;q為利用技術要點②預測的產(chǎn)能指標計算得到的日動態(tài)產(chǎn)量,m3·d-1;qproposal為利用當前時間步隨機抽取的產(chǎn)能指標Xproposal計算得到的日產(chǎn)量動態(tài),m3·d-1;qt-1為利用上一時間步隨機抽取的產(chǎn)能指標Xt-1計算得到的日產(chǎn)量動態(tài),m3·d-1。
(3) 從均勻分布U(0,1)抽取隨機數(shù)u。
(4) 如果α>u,則Xt=Xproposal,t=t+1,并返回步驟(1);否則,放棄Xproposal,返回步驟(1),重新抽取一組樣本Xproposal。
(5) 當獲得足夠數(shù)量的產(chǎn)能指標樣本后,結束迭代,并進行統(tǒng)計分析,獲得產(chǎn)能指標后驗分布。
為了驗證文中方法的可行性,選取中國24口頁巖氣井進行算例分析。首先收集各井的地質(zhì)參數(shù)、工程參數(shù)及產(chǎn)量數(shù)據(jù),選用Arps雙曲遞減模型計算各井產(chǎn)能指標,擬合得到各井的初期最大產(chǎn)氣量、初期遞減率及遞減指數(shù),得到由24口井組成的計算數(shù)據(jù)集。表1為數(shù)據(jù)集中各參數(shù)的主要統(tǒng)計指標。
隨機選取1口井(W井)作為擬鉆頁巖氣井,剩下的23口井作為已投產(chǎn)頁巖氣井,開展頁巖氣產(chǎn)能非確定性預測算例分析,即隨機用23口井數(shù)據(jù)對另外1口井產(chǎn)能進行非確定性預測。運用最大信息系數(shù)相關性分析方法,確定有機碳含量、含氣量、總液量、單段液量、總砂量、單段砂量、用液強度、加砂強度等8個參數(shù)為主控因素。以這8個因素為輸入變量,以初期最大產(chǎn)氣量、初期遞減率及遞減指數(shù)為輸出變量,運用混合支持向量機技術HGAPSO-SVM,訓練產(chǎn)能指標確定性預測模型,運用訓練好的模型確定性預測擬鉆井的產(chǎn)能指標。
表1 數(shù)據(jù)集中各參數(shù)的主要統(tǒng)計指標
本算例僅考慮初期遞減率與遞減指數(shù)的不確定性。通過前人研究成果,初期遞減率滿足對數(shù)正態(tài)分布,遞減指數(shù)滿足正態(tài)分布。統(tǒng)計分析23口已鉆頁巖氣井的產(chǎn)能指標可知,初期遞減率的樣本均值與方差為0.24與0.02,遞減指數(shù)的樣本均值與方差為1.02與0.41。由此可以確定擬鉆井的初期遞減率與遞減指數(shù)的先驗分布。根據(jù)已投產(chǎn)井計算產(chǎn)能指標時的擬合誤差,確定σ2為0.03。利用“蒙特卡洛-馬爾科夫鏈”模擬方法預測擬鉆井的初期遞減率與遞減指數(shù)的后驗分布,在此基礎上進行該擬鉆井產(chǎn)能的非確定性預測。
不同于確定性產(chǎn)能預測方法,文中方法對擬鉆頁巖氣井產(chǎn)能預測的結果不是一個確定的產(chǎn)能動態(tài),而是一個范圍,這個范圍包含了這口井的產(chǎn)能上限與產(chǎn)能下限,以及上、下限之間每個可能的產(chǎn)能動態(tài)發(fā)生的概率。
圖3為利用文中方法對W井產(chǎn)能進行非確定性預測的結果。圖中P90、P50與P10曲線分別代表在90%、50%、10%概率下W井所能達到的產(chǎn)能水平,P90曲線代表W井的產(chǎn)能下限,P10曲線代表W井的產(chǎn)能上限,W井投產(chǎn)后的產(chǎn)能曲線很可能會落在P90曲線與P50曲線之間的區(qū)域(概率超過50%)。對比W井實際產(chǎn)量,可見利用該方法對W井產(chǎn)能的非確定性預測結果是可靠的。
圖3 W井產(chǎn)氣量的非確定性預測結果
產(chǎn)能非確定預測模型可靠性的評價方法與傳統(tǒng)方法存在差異。文中結合頁巖氣現(xiàn)場生產(chǎn)實踐,制訂了適用于頁巖氣產(chǎn)能非確定性預測模型的可靠性評價方法。該評價方法實施步驟如下:①對若干口擬鉆頁巖氣井產(chǎn)能進行非確定性預測,將各井產(chǎn)能非確定性預測結果與該井實際產(chǎn)量進行對比;②如圖3所示,將P90的30%誤差限與P10之間的區(qū)域稱為“準確率評價區(qū)間”,將P90的15%誤差限與P50之間的區(qū)域稱為“大概率事件區(qū)間”;③若1口井有超過70%的實際產(chǎn)量數(shù)據(jù)落在“準確率評價區(qū)間”,則認為這口井的非確定性預測結果是“可靠”的,將這類井的占比稱為模型的“準確率”,若“準確率”超過70%,則認為該模型具有較高的預測精度;④若1口井有超過50%的實際產(chǎn)量數(shù)據(jù)落在“大概率事件區(qū)間”,則認為這口井的非確定性預測結果屬于“大概率事件”,若這類井的占比超過50%,即大概率事件發(fā)生的概率超過50%,則認為該模型預測結果滿足概率統(tǒng)計規(guī)律;⑤若模型具有較高的預測精度,同時預測結果滿足概率統(tǒng)計規(guī)律,則認為該模型是可靠的。
根據(jù)上述可靠性評價方法,將24口井逐一作為擬鉆井進行預測。預測結果表明:利用文中方法進行產(chǎn)能非確定性預測的準確率為70.8%,預測結果為“大概率事件”的井占54.2%,說明該方法具有較高的預測精度,且預測結果滿足概率統(tǒng)計規(guī)律。將該方法用于頁巖氣井產(chǎn)能非確定性預測是可靠的。
(1) 文中提出了一種基于機器學習的頁巖氣產(chǎn)能非確定性預測方法,該方法將最大信息系數(shù)相關性分析方法、混合支持向量機技術HGAPSO-SVM及“蒙特卡洛-馬爾科夫鏈”模擬有機結合,可利用已投產(chǎn)井的地質(zhì)及工程數(shù)據(jù)對1口擬鉆頁巖氣井未來的產(chǎn)能進行非確定性預測。
(2) 選取中國24口頁巖氣井算例,分析結果表明:利用文中方法進行產(chǎn)能非確定性預測的準確率為70.8%,預測結果為“大概率事件”的井占54.2%,說明該方法具有較高的預測精度且預測結果滿足概率統(tǒng)計規(guī)律。