中國石油西南油氣田公司通信與信息技術中心 姚渝琪 杜 強
中國石油集團安全環(huán)保技術研究院有限公司HSE信息中心 王志達
中國石油西南油氣田公司通信與信息技術中心 孫 韻 劉 新 胡顯成
隨著智能油氣田建設潮流和大數(shù)據(jù)時代的到來,某油氣田在勘探開發(fā)和日常生產(chǎn)運行管控領域也開始迎來重要的發(fā)展契機與挑戰(zhàn)。大數(shù)據(jù)技術促進了我國各個行業(yè)的發(fā)展,天然氣生產(chǎn)行業(yè)也面臨來自生產(chǎn)模式、數(shù)據(jù)分析及經(jīng)營決策等各方面的挑戰(zhàn)。本文結(jié)合天然氣生產(chǎn)信息化在某油氣田的應用實例,展望大數(shù)據(jù)技術在油氣生產(chǎn)行業(yè)的應用前景。
隨著大數(shù)據(jù)技術的不斷發(fā)展,傳統(tǒng)油氣生產(chǎn)單井產(chǎn)量管理模式已逐漸落伍,為滿足油氣田高質(zhì)量生產(chǎn)和高質(zhì)量發(fā)展的目標,利用大數(shù)據(jù)技術促進智能油氣田的建設。
某油氣田基于DCS數(shù)據(jù)和時間標簽,成功實現(xiàn)了天然氣凈化廠脫硫溶液異常發(fā)泡工況的預警,并形成了一套不同于以往傳統(tǒng)思維的新解決方案,可為類似研究或項目的開展提供借鑒。
Baker Hughes公司利用油氣生產(chǎn)大數(shù)據(jù)技術,結(jié)合英偉達公司高性能GPU技術,實現(xiàn)對油氣行業(yè)海量數(shù)據(jù)的實時、快速提取,大大減少石油勘探、開發(fā)、運輸、加工和銷售的成本。
常規(guī)方法:從現(xiàn)有理論方法中尋找解決問題的途徑,依賴于理論水平的認識,通過不斷完善理論假設來提高實際應用效果,其暴露出來的缺點是對方程運算只能取用有限次項,會湮滅數(shù)據(jù)中蘊含的信息。如圖1所示。
圖1 常規(guī)方法解決問題思路圖
大數(shù)據(jù)方法:建立數(shù)據(jù)閉環(huán),隨著數(shù)據(jù)量與維度的增加,模型的水平與認識會隨之提升。又因為模型的建立是依靠數(shù)據(jù)中蘊含的各種信息,所以模型可以不斷根據(jù)實際情況充分升級迭代。如圖2所示。
圖2 大數(shù)據(jù)方法解決問題思路圖
精確、合理地預測油氣田產(chǎn)量是油氣田開發(fā)規(guī)劃最主要工作,目的是保障氣藏在較為科學的生產(chǎn)運行狀態(tài)下進行生產(chǎn),減緩氣藏生產(chǎn)遞減趨勢,提升最終采收率。目前現(xiàn)場技術人員主要使用遞減曲線分析法、水驅(qū)曲線法和數(shù)值模擬法等產(chǎn)量預測方法來完成單井的配產(chǎn)工作,主要是利用物理實體特性以及相關理論研究?;诖髷?shù)據(jù)的遞減趨勢預測則是借助業(yè)務理論本身,更多的從數(shù)學統(tǒng)計學原理出發(fā),發(fā)現(xiàn)一個具體業(yè)務場景的客觀規(guī)律。
ARPS遞減模型:將生產(chǎn)井的產(chǎn)量遞減通過雙曲遞減、調(diào)和遞減及指數(shù)遞減等三種模式,估算出地質(zhì)可采儲量和產(chǎn)能預測結(jié)果。
FETKOVICH遞減模型:模型利用圖版擬合,分析產(chǎn)量遞減趨勢。
HSIEH遞減模型:該模型通過對各相滲透率的變化分析,通過利用時間—達西方程來計算儲層屬性的變化得出遞減率。
目前某油氣田公司在用的開發(fā)生產(chǎn)管理平臺以內(nèi)置ARPS算法模型的方式,作產(chǎn)量遞減分析,如圖3所示。
圖3 在用平臺產(chǎn)量遞減曲線擬合
目前主流的大數(shù)據(jù)分析算法主要有如下幾種:
(1)基于多層感知器(MLP):多層感知器是一種由多個的節(jié)點層所組成,前向結(jié)構的人工神經(jīng)網(wǎng)絡。
(2)卷積神經(jīng)網(wǎng)絡(CNN):卷積神經(jīng)網(wǎng)絡因為其能夠按其階層結(jié)構對輸入信息進行平移不變分類的能力,是用在圖像分類處理的主要算法之一。
(3)基于LSTM的序列分類:長短期記憶(Long short-term memory,LSTM)是一種為了解決長序列訓練過程中的梯度消失和梯度爆炸問題而衍生出來的特殊RNN算法,適合從歷史數(shù)據(jù)中尋找數(shù)據(jù)規(guī)律。
因為氣藏生產(chǎn)過程有大量的時序歷史數(shù)據(jù),所以本次研究選擇LSTM算法作為預測算法。
2.3.1 數(shù)據(jù)準備和清洗(1)數(shù)據(jù)收集:根據(jù)某油氣公司是有的油氣水井生產(chǎn)數(shù)據(jù)管理系統(tǒng),收集某生產(chǎn)區(qū)塊160口同生產(chǎn)層位的產(chǎn)出井歷史日數(shù)據(jù)。
(2)數(shù)據(jù)整理:篩選出每口井自噴生產(chǎn)時間段內(nèi)的連續(xù)數(shù)據(jù),并充分考慮在自噴生產(chǎn)過程中認為調(diào)產(chǎn)的影響,共歸納出生產(chǎn)時長、最高油壓、平均油壓、最低油壓、最高套壓、平均套壓、最低套壓、日產(chǎn)氣量、日產(chǎn)水量以及針閥開度等10個維度的數(shù)據(jù)。
表1 維度分布表
(3)數(shù)據(jù)正規(guī)化:現(xiàn)實中的數(shù)據(jù)總是存在或多或少的缺失值現(xiàn)象,將數(shù)據(jù)集中的0或null等異常數(shù)據(jù)直接移除。
(4)數(shù)據(jù)歸一化:把數(shù)據(jù)統(tǒng)一變?yōu)?至1之間的小數(shù),消除數(shù)據(jù)量綱,使在梯度下降時,模型可以更快收斂,同時防止數(shù)據(jù)梯度爆炸。
表2 部分數(shù)據(jù)歸一化結(jié)果
2.3.2 基于滑動窗口的LSTM分析
為解決LSTM對長時間序列預測誤差較大的問題,在測試集的數(shù)據(jù)輸入階段加入滑窗算法。
在經(jīng)過處理的數(shù)據(jù)基礎上,利用深度學習框架,如圖4所示,可見模型的準確率和損失率隨迭代次數(shù)的增加有明顯的收斂過程,算法適應性較好,如圖5和圖6所示。
圖4 基于滑動窗口的LSTM分析模式
圖5 隨訓練次數(shù)增加準確率升高
圖6 隨訓練次數(shù)增加損失率下降
利用訓練好的模型,以三天為時間步長對某單井后十天的數(shù)據(jù)進行了趨勢預測,得出預測值與真實值曲線對比如圖7所示,可看出紅色預測曲線基本與實際曲線的變化趨勢基本一致,都呈先增后減的形態(tài)。
圖7 預測值與真實值變化趨勢對比
利用大數(shù)據(jù)算法預測特定條件下的天然氣產(chǎn)量自然遞減趨勢相較于傳統(tǒng)方案的優(yōu)勢在用可以通過選取的數(shù)據(jù)范圍、數(shù)據(jù)維度等,有針對性的用歷史數(shù)據(jù)來描述預測對象,比用傳統(tǒng)工程經(jīng)驗公式具有更好的適應性。本次研究主要是針對特定區(qū)塊的特定生產(chǎn)層位,其儲層情況、產(chǎn)水特征等關鍵指標都當做靜態(tài)常量,無法在其他生產(chǎn)單元直接應用。且基礎數(shù)據(jù)以日數(shù)據(jù)為主,模型描述精度還有較大可提升空間。