SHAHKARAMI Alireza,MOHAGHEGH Shahab
(1.圣費(fèi)朗西斯大學(xué),俄克拉荷馬73104,美國(guó);2.西費(fèi)吉尼亞大學(xué),西費(fèi)吉尼亞州摩根敦 26506,美國(guó))
盡管計(jì)算機(jī)硬件技術(shù)近年來(lái)不斷進(jìn)步,但依然不能滿足工程和科學(xué)領(lǐng)域解決實(shí)際問(wèn)題的需要,模型模擬計(jì)算成本極高,在計(jì)算工程和科學(xué)問(wèn)題中,代理模型計(jì)算成本更加低廉,可代替高保真模型[1-2]。隨著現(xiàn)代硬件(如圖形處理器)的開(kāi)發(fā),復(fù)雜的深度學(xué)習(xí)技術(shù)逐漸進(jìn)入代理建模領(lǐng)域,代理建模在材料科學(xué)[3]、計(jì)算固體力學(xué)[4]、天氣模擬[5]、生命科學(xué)[6]、計(jì)算物理學(xué)[7]、計(jì)算化學(xué)[8]等領(lǐng)域都得到了廣泛的應(yīng)用。在大多數(shù)應(yīng)用中,代理模型是在監(jiān)督學(xué)習(xí)模式下開(kāi)發(fā)的,基于數(shù)據(jù)庫(kù)對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練,該數(shù)據(jù)庫(kù)的數(shù)據(jù)來(lái)源于基礎(chǔ)模型模擬過(guò)程中產(chǎn)生的有效數(shù)據(jù)信息[2,9-10]。
在地下空間建模和地球科學(xué)領(lǐng)域中,代理建模是輔助油藏?cái)?shù)值模擬的有效手段。在石油和天然氣行業(yè)中,油藏模型多用于模擬不同條件下流體在地下多孔介質(zhì)中的流動(dòng),廣泛應(yīng)用于油藏管理工作流,用于預(yù)測(cè)油井產(chǎn)量、優(yōu)化注水方案、部署加密井、認(rèn)識(shí)油井/油藏間連通情況等。為了使油藏模型更加精確可靠,工程和油藏研究人員通常要對(duì)其進(jìn)行校準(zhǔn)(即歷史擬合)[11]。采用校準(zhǔn)后的模型研究不同的作業(yè)方案,分析輸入和輸出數(shù)據(jù)的敏感性,并評(píng)估作業(yè)方案中的不確定性。以上工作需要通過(guò)基礎(chǔ)油藏模型的大量模擬來(lái)實(shí)現(xiàn),通常這些模型的運(yùn)算非常昂貴且耗時(shí),本文認(rèn)為開(kāi)發(fā)一套油藏模擬模型的智能代理模型有助于油藏模型的充分利用,同時(shí)可以大幅降低運(yùn)算成本。
人工神經(jīng)網(wǎng)絡(luò)(ANN)已廣泛應(yīng)用于代理模型,以實(shí)現(xiàn)油藏管理的目的。盡管ANN具有黑箱特性,但可以利用ANN學(xué)習(xí)復(fù)雜數(shù)據(jù)庫(kù)的非線性規(guī)律,解決地下領(lǐng)域的許多問(wèn)題。ANN在油藏管理工作流程中的應(yīng)用實(shí)例包括產(chǎn)量預(yù)測(cè)[12]、布井、異常探測(cè)、注蒸汽等。本文采用文獻(xiàn)[13-14]中的數(shù)據(jù)庫(kù)將 ANN應(yīng)用于兩個(gè)油藏建模的案例,第1個(gè)案例采用ANN建立的代理模型來(lái)預(yù)測(cè)井底壓力和產(chǎn)量,重點(diǎn)在于歷史擬合;第 2個(gè)案例采用 ANN快速預(yù)測(cè)特定地層的相飽和度和壓力分布等儲(chǔ)集層動(dòng)態(tài)特征。通過(guò)與盲數(shù)據(jù)庫(kù)結(jié)果對(duì)比,以證明ANN在油藏快速建模應(yīng)用中的優(yōu)勢(shì)。
代理模型是以數(shù)據(jù)為驅(qū)動(dòng)的,圖1描述了開(kāi)發(fā)代理模型的一般機(jī)器學(xué)習(xí)工作流程。在主題專家(Subject Matter Expert)的幫助下,數(shù)據(jù)專家/工程師需要分析具體問(wèn)題和已知數(shù)據(jù)。在機(jī)器學(xué)習(xí)和模式識(shí)別中,預(yù)處理步驟(包括分析數(shù)據(jù)及數(shù)據(jù)庫(kù)建立)要求從已知的原始數(shù)據(jù)中提取油藏特征。該步驟對(duì)數(shù)據(jù)進(jìn)行處理并獲取額外信息,同時(shí)在開(kāi)發(fā)模型前剔除數(shù)據(jù)庫(kù)中的冗余數(shù)據(jù)。處理過(guò)的數(shù)據(jù)庫(kù)將用于開(kāi)發(fā)機(jī)器學(xué)習(xí)模型,機(jī)器學(xué)習(xí)算法的選擇主要取決于已知數(shù)據(jù)的質(zhì)量和數(shù)量以及研究目標(biāo)。本文兩個(gè)案例采用前饋人工神經(jīng)網(wǎng)絡(luò)進(jìn)行研究,該算法具有能處理復(fù)雜非線性數(shù)據(jù)、對(duì)異常數(shù)據(jù)容忍度良好以及適用范圍廣的特點(diǎn)。ANN性能介紹以及在石油工程中的應(yīng)用見(jiàn)文獻(xiàn)[15]。
圖1 開(kāi)發(fā)數(shù)據(jù)驅(qū)動(dòng)代理模型的工作流程
開(kāi)發(fā)油藏地質(zhì)模型代理模型的一般流程包括設(shè)計(jì)基礎(chǔ)油藏?cái)?shù)值模擬、建立時(shí)空數(shù)據(jù)庫(kù)、特征選擇、建立機(jī)器學(xué)習(xí)模型、盲驗(yàn)證以及利用代理模型進(jìn)行分析。代理模型可近似作為三維油藏?cái)?shù)值模型。確定本文兩個(gè)案例研究目標(biāo)后,設(shè)計(jì)幾種基礎(chǔ)油藏?cái)?shù)值模擬條件并開(kāi)展模擬,采用拉丁超立方體實(shí)驗(yàn)抽樣技術(shù)來(lái)覆蓋解空間的不確定性?;A(chǔ)模型模擬的次數(shù)通常是人為確定的,如果模擬次數(shù)太多,則不適用代理模型;反之,如果模擬次數(shù)太少,提供的信息將不足以構(gòu)建穩(wěn)定的代理模型。根據(jù)作者使用經(jīng)驗(yàn),基礎(chǔ)模擬模型非均質(zhì)性較強(qiáng)時(shí),模擬次數(shù)設(shè)定為10~16次。如圖1所示,如果所建代理模型在驗(yàn)證步驟失敗,則對(duì)數(shù)據(jù)庫(kù)增加一組新的基礎(chǔ)模型模擬運(yùn)行。例如,在第 1個(gè)案例研究中進(jìn)行了10次模擬來(lái)訓(xùn)練代理模型,利用新的一次模擬來(lái)驗(yàn)證所訓(xùn)練的代理模型(即盲驗(yàn)證),結(jié)果表明10次模擬產(chǎn)生了精確的代理模型。對(duì)于第2個(gè)案例,前10次模擬對(duì)代理模型進(jìn)行訓(xùn)練,后3次模擬對(duì)代理模型進(jìn)行驗(yàn)證,然而代理模型預(yù)測(cè)含水飽和度的絕對(duì)誤差過(guò)大(大于 5%),因此在預(yù)測(cè)含水飽和度時(shí)增加了6次基礎(chǔ)模型模擬。
基礎(chǔ)模型模擬次數(shù)設(shè)定后,提取原始數(shù)據(jù)構(gòu)建時(shí)空數(shù)據(jù)庫(kù)。一般來(lái)說(shuō),研究目的影響特征選擇和數(shù)據(jù)參數(shù)化,后文將通過(guò)討論不同研究目的的案例,來(lái)說(shuō)明代理模型在油藏建模應(yīng)用中的靈活性。第 1個(gè)案例的研究目的是預(yù)測(cè)油井產(chǎn)量和井底壓力;第 2個(gè)案例的研究目的是預(yù)測(cè)地層壓力和相飽和度的平面分布。由于輸出的屬性不同,第 1個(gè)案例為基于油井的代理建模,第 2個(gè)案例為基于網(wǎng)格的代理建模,其特征選擇方法和參數(shù)表示方法均不同。
在機(jī)器學(xué)習(xí)模型和代理模型開(kāi)發(fā)過(guò)程中必須避免過(guò)度擬合,雖然過(guò)度擬合模型在數(shù)據(jù)庫(kù)訓(xùn)練中表現(xiàn)良好,但不具有普適性,在處理未知數(shù)據(jù)集時(shí)效果不一定好。通常通過(guò)以下 2種方法來(lái)避免過(guò)度擬合:①訓(xùn)練階段監(jiān)控訓(xùn)練集和測(cè)試集的誤差趨勢(shì),圖2描述了如何在訓(xùn)練中選擇合適的模型;②對(duì)模型進(jìn)行盲驗(yàn)證,盲驗(yàn)證可確保模型沒(méi)有過(guò)度擬合,并且保證模型在未知的數(shù)據(jù)上表現(xiàn)良好。
圖2 模型訓(xùn)練和測(cè)試誤差的比較
第 1個(gè)案例研究了代理模型在油藏模型歷史擬合中的應(yīng)用,其中使用的標(biāo)準(zhǔn)油藏模型為PUNQ-S3[16]。根據(jù)少量的 PUNQ-S3油藏模型模擬結(jié)果開(kāi)發(fā)代理模型,同時(shí)考慮了孔隙度、水平滲透率和垂直滲透率分布的不確定性。多個(gè)人工神經(jīng)網(wǎng)絡(luò)組成了代理模型的預(yù)測(cè)引擎;采用未知數(shù)據(jù)對(duì)訓(xùn)練后的代理模型進(jìn)行盲驗(yàn)證,然后將驗(yàn)證后的代理模型與差分進(jìn)化算法相結(jié)合[11,15],進(jìn)行自動(dòng)歷史擬合。
PUNQ-S3油藏模型包含5個(gè)地層,每層有19×28個(gè)網(wǎng)格(180 m×180 m)。油藏的東部和南部為斷層,下部為水層。油藏壓力低于泡點(diǎn)壓力,油藏頂部有氣頂,該油藏共鉆有6口生產(chǎn)井。圖3所示為該油藏頂部構(gòu)造。為了避免過(guò)多開(kāi)采氣頂氣,頂部?jī)蓪記](méi)有射孔,其他層射孔情況如下:PRO-1井、PRO-4井、PRO-12井在第4、第5層射孔,PRO-5井和PRO-11井分別在第3層和第4層射孔,PRO-15井僅在第4層射孔。圖4所示為各層垂直滲透率、水平滲透率和孔隙度的分布。基礎(chǔ)油藏模型源文件來(lái)自文獻(xiàn)[17],將該模型轉(zhuǎn)換為CMG格式[18],已知數(shù)據(jù)包括:井點(diǎn)孔隙度和滲透率;地層的地質(zhì)描述;前8年的生產(chǎn)數(shù)據(jù);16.5年后的累計(jì)產(chǎn)量;現(xiàn)場(chǎng) PVT(壓力、體積、溫度)數(shù)據(jù)、相對(duì)滲透率和Carter-Tracy水層特征數(shù)據(jù);無(wú)毛管作用;油水界面和油氣界面。
以基礎(chǔ)油藏模型 PUNQ-S3[18]為基準(zhǔn)進(jìn)行數(shù)值模擬,以提取數(shù)據(jù)信息。根據(jù)井點(diǎn)的屬性參數(shù)和地質(zhì)描述,采用拉丁超立方體實(shí)驗(yàn)設(shè)計(jì)方法設(shè)計(jì)11次不同的油藏模擬,關(guān)于這些模擬方案的詳細(xì)討論見(jiàn)文獻(xiàn)[15]。利用10次模擬對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,利用第11次模擬對(duì)訓(xùn)練后的代理模型進(jìn)行盲驗(yàn)證。
圖3 PUNQ-S3模型的頂部構(gòu)造[16]
圖4 PUNQ-S3油藏模型孔隙度和滲透率分布圖
從數(shù)值模擬結(jié)果中提取不同類型的數(shù)據(jù),形成時(shí)空數(shù)據(jù)庫(kù),這個(gè)數(shù)據(jù)庫(kù)包含用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的輸入輸出數(shù)據(jù),輸入數(shù)據(jù)包括井位經(jīng)度和緯度、頂深、孔隙度、水平滲透率、垂直滲透率、厚度、產(chǎn)油量、前一個(gè)時(shí)間步的輸出,輸出數(shù)據(jù)包括井底壓力、產(chǎn)氣量和產(chǎn)水量。為了降低問(wèn)題的復(fù)雜性并簡(jiǎn)化訓(xùn)練神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù),采用圖5所示的分割分層系統(tǒng)。圖5a為根據(jù)Voronoi圖表得到的基于油井的油藏分割[19-20],在這個(gè)系統(tǒng)中,每口井都被分配了一個(gè)使用修正 Voronoi理論生成的泄油區(qū)域;圖5b中每個(gè)泄油區(qū)又被分為4個(gè)網(wǎng)格層??紤]到近井地帶對(duì)油井生產(chǎn)的影響較大,第1層只包括井筒所在網(wǎng)格,第2層和第3層分別由井筒所在網(wǎng)格周圍的第 1圈和第2圈網(wǎng)格組成,第4層網(wǎng)格包含了泄油區(qū)剩余網(wǎng)格。計(jì)算每個(gè)網(wǎng)格層頂深、厚度、孔隙度和滲透率的平均值,并賦值給數(shù)據(jù)庫(kù)中相應(yīng)的井和網(wǎng)格層。
圖5 PUNQ-S3油藏模型的細(xì)分
根據(jù)輸出結(jié)果(井底壓力、產(chǎn)氣量、產(chǎn)水量)的數(shù)量,最終得到的代理模型包含 3個(gè)人工神經(jīng)網(wǎng)絡(luò)。本研究中每個(gè)人工神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)包括井筒所在網(wǎng)格的經(jīng)度和緯度,每層(5個(gè)地質(zhì)層和4個(gè)網(wǎng)格層)頂深、孔隙度、水平滲透率、垂直滲透率、厚度、產(chǎn)油量、前一個(gè)時(shí)間步的輸出、時(shí)間。輸出數(shù)據(jù)包括井底壓力、產(chǎn)氣量和產(chǎn)水量。每口井(及其泄油區(qū))有60個(gè)不確定參數(shù)(5個(gè)地質(zhì)層、4個(gè)網(wǎng)格層、3個(gè)不確定屬性,即 5×4×3=60)。因此,用于微調(diào)擬合模型的不確定參數(shù)總數(shù)為360個(gè)(5個(gè)地質(zhì)層、4個(gè)網(wǎng)格層、6口井、3個(gè)屬性,即 5×4×6×3=360)。除了這些不確定參數(shù)外,數(shù)據(jù)庫(kù)還包括其他信息,如元數(shù)據(jù)、地質(zhì)特征、井位和操作約束等。
在人工神經(jīng)網(wǎng)絡(luò)的訓(xùn)練中,將數(shù)據(jù)分為3組:80%的數(shù)據(jù)用于訓(xùn)練,10%用于校準(zhǔn),10%用于驗(yàn)證。每個(gè)人工神經(jīng)網(wǎng)絡(luò)都有一個(gè)隱藏層,隱藏層數(shù)、隱藏神經(jīng)元數(shù)和各神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)速度構(gòu)成超參數(shù),可以通過(guò)調(diào)整這些超參數(shù)來(lái)優(yōu)化學(xué)習(xí)過(guò)程,在本研究中這些超參數(shù)使用默認(rèn)值。
人工神經(jīng)網(wǎng)絡(luò)經(jīng)過(guò)訓(xùn)練和驗(yàn)證后,可得到用于進(jìn)行輔助歷史擬合的代理模型。一個(gè)好的代理模型能夠綜合考慮油藏特征和產(chǎn)量約束(每一時(shí)間步的產(chǎn)油量)并預(yù)測(cè)輸出值。得到每個(gè)時(shí)間步的輸出值后,與實(shí)際生產(chǎn)數(shù)據(jù)歷史值進(jìn)行比較,并預(yù)估其目標(biāo)函數(shù)(損失函數(shù))。在本文實(shí)際生產(chǎn)數(shù)據(jù)研究過(guò)程中,使用均方根誤差來(lái)評(píng)估預(yù)測(cè)值和實(shí)際值之間的誤差,即以(1)式作為單井目標(biāo)函數(shù),以評(píng)價(jià)在單井層面上的相對(duì)誤差,其中權(quán)重因子可根據(jù)數(shù)據(jù)的重要性設(shè)置。如果一口特定的井(或某一時(shí)間段)在生產(chǎn)過(guò)程中更重要,可以通過(guò)調(diào)整權(quán)重系數(shù)來(lái)表示該井的重要性。根據(jù)(2)式定義的全局目標(biāo)函數(shù)評(píng)估油田級(jí)別的計(jì)算誤差,該方程利用單井目標(biāo)函數(shù)計(jì)算全局目標(biāo)函數(shù)。本研究認(rèn)為所有井和實(shí)測(cè)數(shù)據(jù)點(diǎn)同等重要,取權(quán)重因子為1。
部分井的驗(yàn)證結(jié)果和歷史擬合結(jié)果如圖6—圖8所示。圖6為代理模型和油藏模擬模型計(jì)算的驗(yàn)證數(shù)據(jù)組,包括井底壓力、產(chǎn)氣量和產(chǎn)水量。結(jié)果證明人工神經(jīng)網(wǎng)絡(luò)可以對(duì)未知數(shù)據(jù)組進(jìn)行預(yù)測(cè),這些未知數(shù)據(jù)是訓(xùn)練階段未使用的。圖7所示為PRO-1井和PRO-4井井底壓力和產(chǎn)氣量的代理模型歷史擬合結(jié)果。由于歷史擬合過(guò)程的非唯一性,選取了10個(gè)最佳擬合結(jié)果,(代理模型與差分進(jìn)化優(yōu)化算法耦合的結(jié)果),可見(jiàn)井底壓力和產(chǎn)氣量的歷史擬合效果非常好。
圖8所示為PRO-11井(唯一產(chǎn)水的井)產(chǎn)水量和累計(jì)產(chǎn)水量的歷史擬合結(jié)果。未產(chǎn)水時(shí)歷史擬合效果很好,但是見(jiàn)水后歷史擬合的效果相對(duì)較差。需要指出的是,PRO-11井在生產(chǎn)的最后兩年才出現(xiàn)產(chǎn)水,筆者認(rèn)為由于產(chǎn)水階段數(shù)據(jù)點(diǎn)少,所以用于產(chǎn)水預(yù)測(cè)的神經(jīng)網(wǎng)絡(luò)未發(fā)現(xiàn)產(chǎn)水動(dòng)態(tài)規(guī)律。
圖6 代理模型與基礎(chǔ)油藏模型驗(yàn)證數(shù)據(jù)
圖7 2口井井底壓力和產(chǎn)氣量的歷史擬合結(jié)果
圖8 PRO-11井產(chǎn)水量和累計(jì)產(chǎn)水量的歷史擬合結(jié)果
第 2個(gè)案例研究了基于人工神經(jīng)網(wǎng)絡(luò)的代理模型在 CO2提高采收率油藏快速建模中的應(yīng)用,用代理模型近似油藏模型在網(wǎng)格級(jí)別的輸出,研究油藏特征不確定性(網(wǎng)格塊的滲透率)、操作約束敏感性(注入井井底壓力)對(duì)油藏壓力和相飽和度的影響,詳細(xì)的油藏模擬研究見(jiàn)文獻(xiàn)[21];另一個(gè)目標(biāo)是研究油田現(xiàn)場(chǎng)CO2注入50年的方案,監(jiān)測(cè)1 000年期間CO2的運(yùn)移情況。原始地質(zhì)模型網(wǎng)格數(shù)量超過(guò)9×106個(gè),為了模擬CO2封存機(jī)制,將原始模型粗化到13 600個(gè)網(wǎng)格,但計(jì)算成本仍然較高且耗時(shí)。本研究中油藏模擬使用的是 CMG(Computer Modeling Group)公司的 GEMGHGTM模擬器[22]。
模擬的油藏為美國(guó)德克薩斯州西部 Kelly-Snyder油田的 SACROC單元,為馬蹄形環(huán)礁構(gòu)造,自 1972年開(kāi)始持續(xù)注入 CO2,是美國(guó)采用 CO2提高采收率最久的區(qū)域。截至2005年,注入CO2總量為9.3×107t,產(chǎn)出CO2約3.8×107t,物質(zhì)平衡分析表明該地區(qū)已積累約5.5×107t的CO2[23-24]。本案例中的油藏模型基于Han[25]的研究建立,原始模型對(duì)提高采收率過(guò)程進(jìn)行了200年的模擬(1972—2172)。本文利用200年后的壓力、飽和度分布等油藏動(dòng)態(tài)特征,建立了油藏基礎(chǔ)模型,旨在模擬一個(gè)1 000年的周期(2172—3172),其中CO2在前50年間注入。模型包括25個(gè)模擬層,每層16×34個(gè)網(wǎng)格塊,假設(shè)從2172年起,45口注入井均以恒定速率(331 801.9 m3/d)注入CO2,每口井僅射開(kāi)一個(gè)層,射孔情況為:1口井在第19層射孔、40口井在第20層射孔、1口井在第21層射孔,3口井在第22層射孔。假設(shè)外部邊界條件為無(wú)流動(dòng)邊界。圖9為該單元的三維地質(zhì)模型。
圖9 SACROC單元油藏模型
基于CO2泄漏情況和滲透率非均質(zhì)性選擇9個(gè)模擬層(包括第1—第2層、第19—第25層)研究滲透率分布不確定性的影響,以及45口注入井井底流動(dòng)壓力的敏感性,選擇射孔層頂部的第18層進(jìn)行監(jiān)測(cè),利用油藏模型跟蹤第18層在注入CO2期間及之后的壓力分布和相飽和度分布。第18層的網(wǎng)格總數(shù)為544個(gè),其中 422個(gè)網(wǎng)格塊是活動(dòng)的;白色網(wǎng)格厚度極薄,表示“空”網(wǎng)格或非活動(dòng)網(wǎng)格。第18層的初始屬性分布如圖10所示,初始條件數(shù)據(jù)由原始模型獲取,是油藏采用CO2提高采收率開(kāi)發(fā) 200年(1972—2172)后的狀態(tài)。
為了建立用于訓(xùn)練和驗(yàn)證神經(jīng)網(wǎng)絡(luò)的時(shí)空數(shù)據(jù)庫(kù),本研究設(shè)計(jì)了幾個(gè)基礎(chǔ)油藏模型的模擬方案,每個(gè)方案都調(diào)整了9個(gè)模擬層的滲透率和45口注入井的井底流動(dòng)壓力,基于基礎(chǔ)模型中的滲透率范圍設(shè)定滲透率分布,采用60%~100%的巖石靜壓作為注入井井底流壓基準(zhǔn)。在屬性分布范圍內(nèi),利用拉丁超立方體實(shí)驗(yàn)設(shè)計(jì)方法來(lái)組合輸入?yún)?shù)值,目的是以最少的模擬次數(shù)獲取最多的數(shù)據(jù)信息。滲透率的分布范圍和平均值受基礎(chǔ)模型約束,滲透率的分布在模擬中變化。假設(shè)井點(diǎn)位置的滲透率是已知的(取自巖心數(shù)據(jù)),利用地質(zhì)統(tǒng)計(jì)方法(CMG-Builder中的反距離估計(jì))可以生成滲透率的分布。圖11為改變滲透率分布和注入井井底壓力的過(guò)程。
本案例研究中的輸入?yún)?shù)包括網(wǎng)格位置、頂部深度、孔隙度、滲透率、厚度、注入井到網(wǎng)格的距離、每個(gè)網(wǎng)格的初始?jí)毫?、每個(gè)網(wǎng)格的初始相飽和度、注入井井底壓力。輸出數(shù)據(jù)包括壓力分布、含水飽和度、CO2摩爾分?jǐn)?shù)。每個(gè)輸出屬性對(duì)應(yīng)一套人工神經(jīng)網(wǎng)絡(luò),綜合人工神經(jīng)網(wǎng)絡(luò)結(jié)果形成代理模型。利用10次油藏模擬訓(xùn)練壓力神經(jīng)網(wǎng)絡(luò),16次油藏模擬訓(xùn)練相飽和度神經(jīng)網(wǎng)絡(luò),另外3次模擬用于盲驗(yàn)證。圖12所示為第1層、第2層、第19層和第20層在13次模擬(10次訓(xùn)練,3次盲驗(yàn)證)中的滲透率分布。圖13所示為 45口注入井在 13次模擬中的井底流動(dòng)壓力分布。
人工神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和驗(yàn)證通過(guò)軟件 IDEATM[26]完成,IDEATM通常用于開(kāi)發(fā)油田使用的數(shù)據(jù)驅(qū)動(dòng)模型。本文的兩個(gè)研究案例都使用了一個(gè)隱藏層,隱藏神經(jīng)元的數(shù)量遵循2n-1的經(jīng)驗(yàn)法則,n表示輸入?yún)?shù)的個(gè)數(shù)。采用前饋神經(jīng)網(wǎng)絡(luò)和反向傳播算法進(jìn)行訓(xùn)練,Sigmoid激活函數(shù)是 IDEATM中默認(rèn)的激活算法,IDEATM能夠動(dòng)態(tài)地選擇學(xué)習(xí)速率。如上所述,時(shí)空數(shù)據(jù)庫(kù)是根據(jù)模擬運(yùn)行的信息建立的,將數(shù)據(jù)庫(kù)分為 3個(gè)部分:80%用于訓(xùn)練,10%用于校準(zhǔn),10%用于驗(yàn)證。3個(gè)神經(jīng)網(wǎng)絡(luò)完成訓(xùn)練后,利用盲測(cè)試來(lái)驗(yàn)證其魯棒性。
圖11 改變滲透率分布和注入井井底壓力流程
代理模型預(yù)測(cè)的目標(biāo)層(第18層)注CO2期間和注入后壓力分布如圖14和圖15所示。CO2注入開(kāi)始9年后基礎(chǔ)模型和代理模型得到的壓力分布結(jié)果對(duì)比如圖14a和圖14b所示,圖14c為基礎(chǔ)模型和代理模型結(jié)果的相對(duì)誤差分布。圖15為注入結(jié)束100年后的壓力分布盲驗(yàn)證結(jié)果。訓(xùn)練組和驗(yàn)證組模擬的完整結(jié)果見(jiàn)文獻(xiàn)[21],代理模型能夠準(zhǔn)確地預(yù)測(cè)驗(yàn)證組的壓力分布。
圖12 第1層、第2層、第19層和第20層在13次模擬中的滲透率分布
圖16和圖17為基礎(chǔ)模型和代理模型得到的第18層含水飽和度分布對(duì)比,分別為CO2開(kāi)始注入9年后以及停止注入100年后的結(jié)果。圖16c和圖17c為基礎(chǔ)模型和代理模型預(yù)測(cè)結(jié)果的絕對(duì)誤差分布,大部分絕對(duì)誤差值小于3%,絕對(duì)誤差最大值小于6%。
圖18和圖19所示為基礎(chǔ)模型和代理模型預(yù)測(cè)的CO2摩爾分?jǐn)?shù)分布對(duì)比,分別為 CO2開(kāi)始注入 9年后和結(jié)束注入100年后的結(jié)果,圖18c和圖19c為絕對(duì)誤差值分布圖。與含水飽和度結(jié)果相似,大部分誤差值小于3%,但最大絕對(duì)誤差更大,約為10%。
圖13 10次訓(xùn)練和3次盲驗(yàn)證模擬中45口注入井的井底流動(dòng)壓力
圖14 CO2開(kāi)始注入9年后基礎(chǔ)模型和代理模型預(yù)測(cè)的目標(biāo)層壓力分布對(duì)比
圖15 注入結(jié)束100年后基礎(chǔ)模型和代理模型預(yù)測(cè)的目標(biāo)層壓力分布對(duì)比
在整個(gè)油藏管理工作流程中,多尺度、多相態(tài)油藏模型模擬計(jì)算量大,給油藏模擬帶來(lái)很大困難[27]?;跈C(jī)器學(xué)習(xí)的代理模型經(jīng)過(guò)成功驗(yàn)證,能夠在短時(shí)間內(nèi)獲取油藏模型模擬的結(jié)果,且單次模擬的計(jì)算成本非常低。本文介紹了兩個(gè)案例研究中成功開(kāi)發(fā)代理模型的步驟及得出的結(jié)果,且兩個(gè)案例的目的不同,第1個(gè)案例(PUNQ-S3油藏)旨在預(yù)測(cè)井的產(chǎn)量和井底壓力,第2個(gè)案例(SACROC單元)旨在預(yù)測(cè)油藏壓力和相飽和度在注入期間和注入后的分布。
圖16 注入9年后基礎(chǔ)模型和代理模型預(yù)測(cè)的目標(biāo)層含水飽和度分布對(duì)比
這兩個(gè)案例測(cè)試了代理建模在油藏研究應(yīng)用中的魯棒性。研究過(guò)程中發(fā)現(xiàn),代理模型與原始模擬模型相比可大幅節(jié)約計(jì)算成本。PUNQ-S3油藏模型是一個(gè)黑油模型,在12個(gè)3.2 GHz處理器集群上的單次運(yùn)行時(shí)間不到5 min;利用11次基礎(chǔ)油藏模型的模擬建立代理模型,經(jīng)過(guò)驗(yàn)證的代理模型單次運(yùn)行時(shí)間不到1 s。通過(guò)建立誤差方程(1)式和(2)式,利用優(yōu)化算法對(duì)不確定參數(shù)進(jìn)行調(diào)整,創(chuàng)建自動(dòng)歷史擬合工作流,終止標(biāo)準(zhǔn)是1 000次代理模型調(diào)用和標(biāo)準(zhǔn)誤差。在12個(gè)3.2 GHz處理器集群上運(yùn)行時(shí),單次代理模型調(diào)用、誤差計(jì)算和優(yōu)化算法模擬實(shí)現(xiàn)大約需要1 s,前文得出的歷史擬合結(jié)果輸出可在1 000 s內(nèi)完成。此外,運(yùn)行11次基礎(chǔ)模型模擬需3 300 s(模擬11次,平均每次運(yùn)行5 min),因此,PUNQ-S3油藏模型歷史擬合中代理模型的開(kāi)發(fā)、驗(yàn)證和應(yīng)用的總時(shí)間為4 300 s。如果使用PUNQ-S3油藏基礎(chǔ)模型,在相同的歷史擬合工作流中,采用相同的終止標(biāo)準(zhǔn)需要 300 000 s的計(jì)算時(shí)間(1 000次模擬實(shí)現(xiàn),每次模擬的平均運(yùn)行時(shí)間為 5 min),代理模型可節(jié)省 98.9%的計(jì)算時(shí)間。SACROC單元油藏模型需要更長(zhǎng)的運(yùn)行時(shí)間,使用 12個(gè) 3.2 GHz處理器集群,單次油藏模型模擬平均需要 10~24 h,而使用代理模型得到前文研究結(jié)果的時(shí)間不超過(guò)幾秒。
圖17 注入結(jié)束100年后基礎(chǔ)模型和代理模型預(yù)測(cè)的目標(biāo)層含水飽和度分布對(duì)比
人工神經(jīng)網(wǎng)絡(luò)并不是代理建模中唯一可用的機(jī)器算法,之所以選擇人工神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行監(jiān)督學(xué)習(xí),是因?yàn)樗念A(yù)測(cè)精度高、對(duì)主信號(hào)以及非線性數(shù)據(jù)的學(xué)習(xí)能力強(qiáng)。但是人工神經(jīng)網(wǎng)絡(luò)也有一定的局限性:其黑箱特性限制了結(jié)果和算法的可解釋性,且人工神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度相對(duì)較慢;超參數(shù)(如隱藏層的數(shù)量、隱藏神經(jīng)元的數(shù)量和學(xué)習(xí)速度)的數(shù)量可能影響訓(xùn)練模型的準(zhǔn)確性。從單一性能上看,可能存在比神經(jīng)網(wǎng)絡(luò)表現(xiàn)更好的監(jiān)督學(xué)習(xí)算法:相對(duì)較新的機(jī)器學(xué)習(xí)技術(shù),如支持向量機(jī)和增強(qiáng)算法在預(yù)測(cè)準(zhǔn)確性方面都比神經(jīng)網(wǎng)絡(luò)好[28];在結(jié)果可解釋性方面,決策樹(shù)、隨機(jī)森林和回歸模型等算法表現(xiàn)更好;決策樹(shù)和回歸模型的訓(xùn)練速度快,但不適用于非線性問(wèn)題。對(duì)于超參數(shù)的選擇,可以通過(guò)執(zhí)行搜索改變這些參數(shù)并比較結(jié)果,以選擇最佳的超參數(shù)集,遺傳算法[29]和貝葉斯優(yōu)化[30]算法是最常用的超參數(shù)自動(dòng)調(diào)整優(yōu)化技術(shù)。值得注意的是,在本文兩個(gè)案例中選擇不調(diào)整神經(jīng)網(wǎng)絡(luò)超參數(shù),以防止神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時(shí)間大幅增加。
圖18 注入9年后基礎(chǔ)模型和代理模型預(yù)測(cè)的目標(biāo)層CO2摩爾分?jǐn)?shù)分布對(duì)比
另一點(diǎn)需要考慮的是,目前還沒(méi)有確定構(gòu)建完美代理模型所需的模擬次數(shù)的標(biāo)準(zhǔn),為了確定最優(yōu)運(yùn)行次數(shù),可以對(duì)代理模型的準(zhǔn)確性與模擬運(yùn)行次數(shù)進(jìn)行敏感性分析。但是油藏模型的復(fù)雜性和非均質(zhì)性可能會(huì)對(duì)運(yùn)行次數(shù)產(chǎn)生影響,根據(jù)作者的經(jīng)驗(yàn),由于非均質(zhì)油藏提供的信息比均質(zhì)油藏層次高,所以均質(zhì)油藏比復(fù)雜非均質(zhì)油藏需要更多的運(yùn)行次數(shù)。此外,數(shù)據(jù)參數(shù)化是降低問(wèn)題維度的關(guān)鍵,在第 1個(gè)案例研究中使用 Voronoi理論[19-20]和分層系統(tǒng)對(duì)油藏進(jìn)行參數(shù)化并減少參數(shù)數(shù)量。
圖19 注入結(jié)束100年后基礎(chǔ)模型和代理模型預(yù)測(cè)的目標(biāo)層CO2摩爾分?jǐn)?shù)分布對(duì)比
開(kāi)發(fā)代理模型的步驟并不是一成不變的,數(shù)據(jù)工程師應(yīng)該根據(jù)地下空間建模問(wèn)題的特性,有針對(duì)性地進(jìn)行預(yù)處理、特征選擇和模型選擇。本研究的結(jié)果證明了基于機(jī)器學(xué)習(xí)的代理模型可以快速、準(zhǔn)確地進(jìn)行油藏模擬,研究結(jié)果對(duì)油藏管理工作流程中其他耗時(shí)的工作也有所幫助,如敏感性分析、產(chǎn)量?jī)?yōu)化和不確定性評(píng)估等。
致謝:感謝Intelligent Solutions公司提供用于開(kāi)發(fā)代理模型的軟件包。感謝CMG公司許可使用油藏?cái)?shù)值模擬軟件。
符號(hào)注釋:
Fglobal——全局目標(biāo)函數(shù);Fi——井i的目標(biāo)函數(shù);N(i)——需要擬合的屬性總數(shù)(如產(chǎn)油量、產(chǎn)氣量、產(chǎn)水量);Nt(i,j)——總時(shí)間步數(shù);Nw——總井?dāng)?shù);Ys,i,j,t——代理模型預(yù)測(cè)的產(chǎn)量,m3/d;Ym,i,j,t——實(shí)測(cè)產(chǎn)量,m3/d;wt——權(quán)重因子,無(wú)因次;ΔYm,i,j——i井實(shí)測(cè)生產(chǎn)數(shù)據(jù)的最大值和最小值之差,m3/d。下標(biāo):i——井編號(hào);j——屬性編號(hào);t——時(shí)間步。