亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        機(jī)器學(xué)習(xí)預(yù)測油氣產(chǎn)量現(xiàn)狀

        2021-08-23 03:12:20黃家宸張金川
        油氣藏評價(jià)與開發(fā) 2021年4期
        關(guān)鍵詞:機(jī)器油氣神經(jīng)網(wǎng)絡(luò)

        黃家宸,張金川

        (1.中國石化石油勘探開發(fā)研究院,北京100083;2.中國地質(zhì)大學(xué)(北京)能源學(xué)院,北京100083;3.自然資源部頁巖氣資源戰(zhàn)略評價(jià)重點(diǎn)實(shí)驗(yàn)室,北京100083;4.非常規(guī)天然氣能源地質(zhì)評價(jià)與開發(fā)工程北京市重點(diǎn)實(shí)驗(yàn)室,北京100083)

        機(jī)器學(xué)習(xí)是一種泛化能力較強(qiáng)的數(shù)據(jù)驅(qū)動(dòng)預(yù)測方法。李航[1]、周志華[2]在專著中全面、系統(tǒng)、詳細(xì)地介紹了各類常見機(jī)器學(xué)習(xí)算法的原理,GOODFELLOW等[3]在專著中詳細(xì)地介紹了機(jī)器學(xué)習(xí)的數(shù)學(xué)基礎(chǔ)、使用經(jīng)驗(yàn)以及現(xiàn)階段的理論及發(fā)展。機(jī)器學(xué)習(xí)任務(wù)目標(biāo)可以分為多類,包括分類和回歸(有監(jiān)督學(xué)習(xí))、聚類(無監(jiān)督學(xué)習(xí))、時(shí)序分析、概率圖模型、強(qiáng)化學(xué)習(xí)等,已在一些典型場景中大量應(yīng)用。

        機(jī)器學(xué)習(xí)在非互聯(lián)網(wǎng)領(lǐng)域的應(yīng)用通常被稱為“AI+”,它可以代替研究人員完成重復(fù)的、經(jīng)驗(yàn)性的工作,也可以用來提取人工難以處理的復(fù)雜信息,從而對數(shù)據(jù)進(jìn)行更深入地挖掘。由于機(jī)器學(xué)習(xí)技術(shù)的應(yīng)用產(chǎn)生了巨大的效益,目前,科研工作者正致力于改良機(jī)器學(xué)習(xí)算法以適應(yīng)實(shí)際應(yīng)用場景。

        要使用機(jī)器學(xué)習(xí)解決實(shí)際問題,首先要對問題進(jìn)行描述。機(jī)器學(xué)習(xí)問題可以描述為:通過已知數(shù)據(jù)來預(yù)測未知數(shù)據(jù)的屬性,其中每個(gè)樣本可以包含多個(gè)屬性。在有監(jiān)督學(xué)習(xí)的分類問題中,監(jiān)督學(xué)習(xí)的訓(xùn)練樣本包含對應(yīng)的“標(biāo)簽”,樣本標(biāo)簽屬于兩類或者多類,是離散型變量;在回歸問題中,樣本標(biāo)簽包括一個(gè)或者多個(gè)連續(xù)變量。在無監(jiān)督學(xué)習(xí)中,訓(xùn)練樣本的屬性不包含標(biāo)簽,如聚類問題。

        筆者介紹了目前常用于油氣田大數(shù)據(jù)分析的機(jī)器學(xué)習(xí)方法的原理、分類及歷史演變,充分調(diào)研后,總結(jié)了油氣大數(shù)據(jù)分析利用的特點(diǎn)與方法,舉例說明了具備一定的數(shù)據(jù)條件且適用機(jī)器學(xué)習(xí)的應(yīng)用場景。以動(dòng)態(tài)及靜態(tài)產(chǎn)量預(yù)測為例,將目前存在的問題歸納為:①研究的普適性及一般性不足;②研究應(yīng)用場景與價(jià)值不明確;③模型拓展應(yīng)用不足。針對以上問題提出了對策,旨在把握相關(guān)問題未來的研究重點(diǎn)。

        1 機(jī)器學(xué)習(xí)原理及分類

        機(jī)器學(xué)習(xí)的流程如圖1所示。首先,選擇具有相同屬性的、標(biāo)簽分布較為均衡的若干樣本,并隨機(jī)劃分一部分為訓(xùn)練集、一部分為測試集。再進(jìn)行數(shù)據(jù)的預(yù)處理,如歸一化、標(biāo)準(zhǔn)化,然后對部分屬性進(jìn)行特征提取,將計(jì)算機(jī)不能直接識別的屬性(稱作“非結(jié)構(gòu)化特征”)轉(zhuǎn)換為機(jī)器學(xué)習(xí)模型可以利用的屬性(稱作“結(jié)構(gòu)化特征”),這一操作叫做“特征工程”。接下來建模的過程就是通過最優(yōu)化過程尋找一個(gè)描述屬性與標(biāo)簽之間關(guān)系的函數(shù)。有參模型中逼近函數(shù)的過程叫做優(yōu)化過程,典型的方法有梯度下降法、牛頓法等;評價(jià)訓(xùn)練過程中函數(shù)是否接近最優(yōu)化的指標(biāo)叫做評估指標(biāo),如方差、交叉熵。隨著模型訓(xùn)練迭代次數(shù)的增加,模型在訓(xùn)練集上的誤差一定是越來越小的,但模型在測試集上的誤差則可能會(huì)增大,這種情況叫做“過擬合”。過擬合的模型不能正確描述特征與標(biāo)簽之間關(guān)系,不具備實(shí)際價(jià)值。因此,模型完成訓(xùn)練后還需評價(jià)模型在測試集上的預(yù)測效果來評估模型是否可靠。若使用了多種不同的模型進(jìn)行預(yù)測,最后還可以分析不同模型預(yù)測效果產(chǎn)生差異的原因,結(jié)合對數(shù)據(jù)及算法的認(rèn)識,對模型中人為的設(shè)定(如:k-近鄰算法的k值、神經(jīng)網(wǎng)絡(luò)的層數(shù)、循環(huán)神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)等)進(jìn)行調(diào)整,這些設(shè)定被稱作“超參數(shù)”。

        圖1 機(jī)器學(xué)習(xí)流程Fig.1 Workflow of machine learning

        按照樣本是否有標(biāo)簽,機(jī)器學(xué)習(xí)可以分為有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。如果樣本的屬性包含時(shí)間序列,也可以認(rèn)為是時(shí)間序列分析問題,它既可以是有監(jiān)督學(xué)習(xí)也可以是無監(jiān)督學(xué)習(xí),最常用的分析及預(yù)測方法為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)。本研究主要討論目前常用于油氣田大數(shù)據(jù)分析利用的機(jī)器學(xué)習(xí)方法,分述如下:

        1)有監(jiān)督學(xué)習(xí)

        有監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)中最重要的分支,它在已知樣本標(biāo)簽情況下對學(xué)習(xí)器(機(jī)器學(xué)習(xí)中的基本模型)進(jìn)行訓(xùn)練。

        有監(jiān)督學(xué)習(xí)最早可以追溯到線性判別分析(LDA)[3]。這是一種有監(jiān)督的數(shù)據(jù)降維算法,可以解決二分類問題。之后,隨著貝葉斯決策理論的發(fā)展,貝葉斯分類器——一種條件概率計(jì)算方法,開始被應(yīng)用于文本分析等場景。邏輯回歸同樣具有悠久的歷史,最初被應(yīng)用于二元序列的分析[4]。邏輯回歸使用激活函數(shù)將樣本從低維空間映射到高維空間的思想是神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)原理。此外,有的機(jī)器學(xué)習(xí)模型不需要進(jìn)行模型訓(xùn)練,稱作無參模型,如基于模板匹配思想的算法k-近鄰(kNN)。

        機(jī)器學(xué)習(xí)模型由于難以分析內(nèi)在機(jī)理,通常被稱作“黑箱模型”,但也有一些概率圖方法相比其它模型更容易進(jìn)行可視化分析,如基于條件判斷和信息論的方法決策樹(DT)。樹形模型原理簡單但可解釋性強(qiáng),在機(jī)理分析上被廣泛使用。還有一些改進(jìn)的概率圖模型,如使用了自助采樣法(Bootstrap)重新獲取樣本集的隨機(jī)森林[5],比簡單的決策樹能夠獲得更好的預(yù)測效果。再后來,誕生了一些具有很高效率和準(zhǔn)確度的非概率圖模型,既可以解決分類問題和也可以解決回歸問題,如經(jīng)典算法支持向量機(jī)(SVM)[6]。這是一種通過核函數(shù)將輸入向量映射到高維空間,使得非線性的回歸和分類問題變?yōu)榫€性的思維。

        目前最受歡迎的機(jī)器學(xué)習(xí)算法要屬深度學(xué)習(xí),它寬泛地涵蓋了各類具有多層神經(jīng)元的機(jī)器學(xué)習(xí)模型。人工神經(jīng)網(wǎng)絡(luò)(ANN)是一種近年興起的深度學(xué)習(xí)模型,它最早被稱作感知機(jī)模型[7]。感知機(jī)模型被定義為一種組織自學(xué)習(xí)的神經(jīng)系統(tǒng),最初被劃分為機(jī)器而非程序,但本質(zhì)上是一種線性分類器。RUMELHART等[8]定義了第一個(gè)多層神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)了反向傳播(BP)算法,奠定了神經(jīng)網(wǎng)絡(luò)走向完善的基礎(chǔ)。

        神經(jīng)網(wǎng)絡(luò)經(jīng)過一些改良可以更好地提取不同尺度下的數(shù)據(jù)集特征,達(dá)到更好的預(yù)測效果。LECUN[9]設(shè)計(jì)出了第一個(gè)卷積神經(jīng)網(wǎng)絡(luò),使用卷積等操作模仿人對圖像的感知,最初被用于手寫數(shù)字識別,是當(dāng)今被廣泛使用的深度卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)。ELMAN[10]提出了循環(huán)神經(jīng)網(wǎng)絡(luò),用于處理序列數(shù)據(jù)。循環(huán)神經(jīng)網(wǎng)絡(luò)的層數(shù)可以動(dòng)態(tài)調(diào)整,能夠處理可變長度的時(shí)間序列。GOODFELLOW[11]提出了生成對抗網(wǎng)絡(luò)的思想,用于生成看似真實(shí)的數(shù)據(jù),最初被用于圖片的創(chuàng)作、人聲和樂器聲的重現(xiàn)等。

        此外,將一些好而不同的異質(zhì)模型組合起來還可以組成新的機(jī)器學(xué)習(xí)模型,從而提升預(yù)測效果,這些異質(zhì)模型被稱作組件學(xué)習(xí)器,通過算法組合起來的模型被稱作集成模型。例如AdaBoost是一種將組件學(xué)習(xí)器線性集成起來組成一個(gè)新模型的方法,可以整合不同學(xué)習(xí)器的優(yōu)點(diǎn)從而實(shí)現(xiàn)更精確的預(yù)測[12]。

        2)無監(jiān)督學(xué)習(xí)

        相對于有監(jiān)督學(xué)習(xí),無監(jiān)督學(xué)習(xí)應(yīng)用范圍較窄,因此,發(fā)展較為緩慢,現(xiàn)存算法較少。無監(jiān)督學(xué)習(xí)主要可以分為聚類和數(shù)據(jù)降維兩類問題。

        聚類算法起源于Ward 提出的層次聚類模型[13]。這是一種符合人的直觀思維的算法,包含若干不同的實(shí)現(xiàn)方式。聚類算法中最著名的是k均值算法,可以將樣本分為k類,它也是所有聚類算法中變化種類最多的[14]。此外,還有可以解決帶有缺失數(shù)據(jù)的極大似然估計(jì)問題的最大期望算法(EM)[15],基于密度的聚類算法Mean Shift[16]以及將聚類問題轉(zhuǎn)化成圖切割問題的譜聚類算法[17]等。

        3)時(shí)間序列分析的機(jī)器學(xué)習(xí)方法——循環(huán)神經(jīng)網(wǎng)絡(luò)

        循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)通常被用于有監(jiān)督學(xué)習(xí),具有普通神經(jīng)網(wǎng)絡(luò)沒有的“記憶”功能,專用于實(shí)現(xiàn)時(shí)間序列的訓(xùn)練和預(yù)測。雖然一些常規(guī)的機(jī)器學(xué)習(xí)方法可以用來分析預(yù)測時(shí)間序列,但這些模型往往會(huì)忽略數(shù)據(jù)在歷史觀測中的自相關(guān)性。因此,我們需要使用研究序列的機(jī)器學(xué)習(xí)方法來進(jìn)行時(shí)間序列的預(yù)測,將數(shù)據(jù)在時(shí)間上的自相關(guān)性納入考慮。循環(huán)神經(jīng)網(wǎng)絡(luò)中每一時(shí)間步的輸出都會(huì)影響下一時(shí)間步的輸出,能夠很好地使用數(shù)據(jù)的歷史觀測信息。

        循環(huán)神經(jīng)網(wǎng)絡(luò)目前主要應(yīng)用于自然語言處理中。語言文本中單詞具有先后順序,是時(shí)間序列。MIKOLOV 等[18]建立了基于循環(huán)神經(jīng)網(wǎng)絡(luò)的語言模型,實(shí)現(xiàn)了循環(huán)神經(jīng)網(wǎng)絡(luò)的應(yīng)用。GREGOR 等[19]實(shí)現(xiàn)了深度循環(huán)神經(jīng)網(wǎng)絡(luò)的注意力機(jī)制,模仿了人在語言閱讀中的特點(diǎn)。

        循環(huán)神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)的使用有別于其它神經(jīng)網(wǎng)絡(luò),例如為了充分地使用數(shù)據(jù)樣本,模型在訓(xùn)練和預(yù)測時(shí)使用不同的權(quán)重傳遞方法。Teacher Forcing 方法通常用于循環(huán)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練階段,該方法不使用上一個(gè)狀態(tài)的輸出作為下一個(gè)狀態(tài)的輸入,而是直接使用訓(xùn)練數(shù)據(jù)的真實(shí)值對應(yīng)的上一項(xiàng)作為下一個(gè)狀態(tài)的輸入[20]。該方法在訓(xùn)練中會(huì)更正模型訓(xùn)練過程中的統(tǒng)計(jì)屬性,使模型訓(xùn)練變得穩(wěn)定。與之對應(yīng)的使用上一時(shí)刻預(yù)測值預(yù)測當(dāng)前時(shí)刻預(yù)測值的方法叫做Free Running 方法,它不依賴于真實(shí)數(shù)據(jù),更多地被用于預(yù)測階段標(biāo)簽或值的輸出。

        循環(huán)神經(jīng)網(wǎng)絡(luò)所有結(jié)構(gòu)的集合叫做網(wǎng)絡(luò)的主體結(jié)構(gòu),也稱作網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),對主體結(jié)構(gòu)進(jìn)行改進(jìn)可以使循環(huán)神經(jīng)網(wǎng)絡(luò)更好地應(yīng)用于不同的場景。例如:在機(jī)器翻譯中,循環(huán)神經(jīng)網(wǎng)絡(luò)的輸出依賴于前面所有時(shí)間步的輸出,同時(shí)也可能依賴于未來的輸出。因此,雙向循環(huán)神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)能夠?qū)栴}更好地描述[21]。拓?fù)浣Y(jié)構(gòu)的改進(jìn)設(shè)計(jì)有很多,如:多維循環(huán)神經(jīng)網(wǎng)絡(luò)[22],網(wǎng)格長短期記憶網(wǎng)絡(luò)[23]等。這些結(jié)構(gòu)在不同的場景中均有良好的表現(xiàn)。

        除了主體結(jié)構(gòu),循環(huán)神經(jīng)網(wǎng)絡(luò)的另一個(gè)重要特征是單元(Cell),它是每個(gè)時(shí)間步節(jié)點(diǎn)對應(yīng)的非循環(huán)神經(jīng)網(wǎng)絡(luò)。通常,沒有對單元進(jìn)行優(yōu)化的簡單循環(huán)神經(jīng)網(wǎng)絡(luò)(Simple RNN)在較長的時(shí)間序列預(yù)測問題中存在諸多不足,如梯度在傳播中會(huì)消失的梯度彌散現(xiàn)象。這種現(xiàn)象導(dǎo)致的問題被稱作梯度下降中的“長期依賴”問題[24]。為了解決此問題,HOCHREITER等[25]提出了著名的長短期記憶(Long short-memory,LSTM)網(wǎng)絡(luò)。LSTM網(wǎng)絡(luò)是RNN的一個(gè)變體,它能夠?qū)W習(xí)長期依賴特征,在網(wǎng)絡(luò)較深時(shí)表現(xiàn)優(yōu)于Simple RNN。LSTM網(wǎng)絡(luò)的單元具有特殊的“門”的結(jié)構(gòu),可分為控制門單元和輸出門單元,而控制門單元是由可以用來去除網(wǎng)絡(luò)傳播中不需要的信息的“遺忘門”[26]和保留有效信息的“記憶門”組成的。

        循環(huán)神經(jīng)網(wǎng)絡(luò)建模時(shí),不僅可以在網(wǎng)絡(luò)結(jié)構(gòu)上進(jìn)行優(yōu)化,還可以在梯度傳播、優(yōu)化器和激活函數(shù)的選擇等方面進(jìn)行改進(jìn)。如:使用Relu 激活函數(shù)代替Sigmoid 激活函數(shù)來防止梯度彌散[27];使用梯度裁剪來避免“梯度爆炸”[28];使用Dropout 方法來減少過擬合[29]。根據(jù)實(shí)際問題,同時(shí)采用這些不同的優(yōu)化方案可以大幅提升循環(huán)神經(jīng)網(wǎng)絡(luò)的預(yù)測效果。

        2 油氣田大數(shù)據(jù)分析利用的特點(diǎn)與方法

        數(shù)據(jù)是機(jī)器學(xué)習(xí)的基礎(chǔ),只有在數(shù)據(jù)基礎(chǔ)強(qiáng)大的前提下,才能使用機(jī)器學(xué)習(xí)方法對數(shù)據(jù)進(jìn)行挖掘。因此,要將機(jī)器學(xué)習(xí)應(yīng)用于某行業(yè)領(lǐng)域,必須保證該行業(yè)領(lǐng)域有充分的數(shù)據(jù)積累,而油氣行業(yè)滿足這一條件。全世界上百年對油氣的勘探開發(fā)積累了寶貴的油氣田大數(shù)據(jù),而使用現(xiàn)今機(jī)器學(xué)習(xí)技術(shù)對其分析利用可以進(jìn)一步提煉數(shù)據(jù)的價(jià)值,甚至可以用純粹的統(tǒng)計(jì)學(xué)原理對油氣生產(chǎn)進(jìn)行分析(數(shù)據(jù)驅(qū)動(dòng)方法),來實(shí)現(xiàn)油氣生產(chǎn)的降本增效。油氣大數(shù)據(jù)的分析利用具有濃烈的專業(yè)色彩,因此,不能完全照搬互聯(lián)網(wǎng)領(lǐng)域的數(shù)據(jù)挖掘模型,需要先明確其內(nèi)容、目標(biāo)及優(yōu)缺點(diǎn),再定制最佳的分析方法。

        2.1 油氣田大數(shù)據(jù)的特點(diǎn)及其分析利用的內(nèi)容與目標(biāo)

        油氣田大數(shù)據(jù)分析利用的意義在于通過數(shù)據(jù)驅(qū)動(dòng)的方法,預(yù)測開發(fā)效益、減少人工成本、監(jiān)控油藏動(dòng)態(tài)、優(yōu)化生產(chǎn)參數(shù),從而達(dá)到指導(dǎo)投資和工程決策、降本增效的目的。油氣的大數(shù)據(jù)分析是一種自上而下的分析方法,先通過數(shù)據(jù)驅(qū)動(dòng)方法得到分析對象之間的定性或定量關(guān)系,再根據(jù)數(shù)據(jù)統(tǒng)計(jì)特點(diǎn)分析其內(nèi)在機(jī)理,與傳統(tǒng)數(shù)值模型分析法過程相反。其優(yōu)勢在于,可以在對研究區(qū)專業(yè)認(rèn)知不足或者已有數(shù)據(jù)質(zhì)量較差的情況下使用。

        傳統(tǒng)大數(shù)據(jù)技術(shù)已在互聯(lián)網(wǎng)行業(yè)廣泛成功使用,但在油氣勘探開發(fā)領(lǐng)域,大數(shù)據(jù)技術(shù)還沒有非常成功的應(yīng)用實(shí)例,這是因?yàn)閮烧叩臄?shù)據(jù)特點(diǎn)和任務(wù)目標(biāo)都不相同。雖然油氣田大數(shù)據(jù)研究方法是建立在互聯(lián)網(wǎng)大數(shù)據(jù)技術(shù)基礎(chǔ)上的專業(yè)化應(yīng)用,但是油氣田大數(shù)據(jù)分析不僅僅是一個(gè)統(tǒng)計(jì)學(xué)問題,它的最終目標(biāo)不是挖掘數(shù)據(jù)之間的關(guān)系,而是通過分析數(shù)據(jù)之間的關(guān)系進(jìn)行決策。因此,油氣田大數(shù)據(jù)分析利用不能照搬互聯(lián)網(wǎng)大數(shù)據(jù)技術(shù),不能終止于得到表面的因果關(guān)系,而是要深刻挖掘現(xiàn)象的內(nèi)在機(jī)理。筆者通過研究總結(jié)了油氣田大數(shù)據(jù)與傳統(tǒng)互聯(lián)網(wǎng)大數(shù)據(jù)的不同以及油氣田大數(shù)據(jù)分析利用的核心內(nèi)容(表1)。

        表1 油氣田大數(shù)據(jù)的特點(diǎn)及其分析利用的核心內(nèi)容Table 1 Characteristics of big data in oil and gas field and key points of data analysis and utilization

        2.2 數(shù)據(jù)驅(qū)動(dòng)模型在油氣田大數(shù)據(jù)分析中的優(yōu)勢

        在油氣田勘探開發(fā)領(lǐng)域,傳統(tǒng)分析油氣生產(chǎn)的過程通常建立在物理解析模型之上,而油氣田大數(shù)據(jù)分析則是基于統(tǒng)計(jì)學(xué)方法,通過實(shí)際勘探開發(fā)和生產(chǎn)數(shù)據(jù)來得到數(shù)據(jù)驅(qū)動(dòng)模型。二者各有優(yōu)缺點(diǎn)和不同的適用場景,主要研究內(nèi)容與目標(biāo)也不同(表2),在實(shí)際應(yīng)用時(shí)應(yīng)當(dāng)根據(jù)對目標(biāo)區(qū)的了解程度和數(shù)據(jù)條件選擇最適用的方法。

        表2 數(shù)據(jù)驅(qū)動(dòng)模型與傳統(tǒng)解析模型對比及數(shù)據(jù)驅(qū)動(dòng)建模工作要點(diǎn)Table 2 Comparison between data-driven model and traditional analytical model and key points of data-driven modeling

        3 機(jī)器學(xué)習(xí)在油氣領(lǐng)域的主要應(yīng)用場景

        只要有大數(shù)據(jù)存在的地方,就有應(yīng)用機(jī)器學(xué)習(xí)方法的可能性。一個(gè)新的機(jī)器學(xué)習(xí)算法被提出后,將很快被應(yīng)用于具有一定數(shù)據(jù)量基礎(chǔ)的各行各業(yè)。機(jī)器學(xué)習(xí)在油氣領(lǐng)域的應(yīng)用也依賴于機(jī)器學(xué)習(xí)算法的發(fā)展,越來越多的應(yīng)用場景隨著算法的提出而產(chǎn)生??偨Y(jié)目前較為成熟的方法,機(jī)器學(xué)習(xí)可被應(yīng)用于以下油氣勘探開發(fā)場景:

        1)地球物理分析

        地球物理學(xué)家通常需要大量的時(shí)間進(jìn)行地震和測井解釋,在龐大的地球物理資料中評估構(gòu)造和地層的不確定性。基于機(jī)器學(xué)習(xí)的地球物理分析方法對地震、測井資料進(jìn)行自動(dòng)的整理和演算,例如從多維地震數(shù)據(jù)集中得到不斷演化的地震屬性結(jié)合,可大大減少地球物理學(xué)家的工作量。

        2)地質(zhì)分析

        地質(zhì)學(xué)家的工作與機(jī)器學(xué)習(xí)非常相似,主要任務(wù)是綜合現(xiàn)有的資料,結(jié)合豐富的地質(zhì)知識和經(jīng)驗(yàn),重新還原油氣藏的形成過程。使用機(jī)器學(xué)習(xí)方法可以在短時(shí)間內(nèi)處理大量的信息,一個(gè)好的機(jī)器學(xué)習(xí)模型對一些精細(xì)地質(zhì)特征的觀察甚至超過地質(zhì)學(xué)家,結(jié)合機(jī)器學(xué)習(xí)方法可以提升地質(zhì)分析的效果。

        3)儲(chǔ)層評價(jià)

        儲(chǔ)層包含著大量與油氣生產(chǎn)相關(guān)的信息,使用機(jī)器學(xué)習(xí)方法可以快速進(jìn)行礦物的顯微識別、提取巖石物理特征、確定烴類的體積、分析流體在儲(chǔ)層巖石中的狀態(tài)等。

        4)油藏工程分析

        機(jī)器學(xué)習(xí)可以為油藏提供快速、準(zhǔn)確的動(dòng)態(tài)預(yù)測,及時(shí)監(jiān)測產(chǎn)量以及與產(chǎn)量相關(guān)的屬性,對油藏進(jìn)行動(dòng)態(tài)調(diào)整,最終實(shí)現(xiàn)“智能油田”。由于油藏的部署及開發(fā)策略具有復(fù)雜性,數(shù)據(jù)驅(qū)動(dòng)方法有時(shí)比傳統(tǒng)的油藏模擬方法更高效、準(zhǔn)確。

        5)生產(chǎn)監(jiān)測

        油井在生產(chǎn)中,各類監(jiān)測傳感器會(huì)源源不斷地制造生產(chǎn)數(shù)據(jù)。這些數(shù)據(jù)可以幫助我們診斷生產(chǎn)故障,建立油井生產(chǎn)快速預(yù)警系統(tǒng)。由于不同研究區(qū)油井的故障響應(yīng)可能不同,根據(jù)研究區(qū)樣本建立的機(jī)器學(xué)習(xí)模型可以更加貼合實(shí)際地描述油井的生產(chǎn)狀態(tài)。

        6)經(jīng)濟(jì)預(yù)測

        油氣田開發(fā)的核心目標(biāo)就是在開發(fā)周期內(nèi)獲得最大的經(jīng)濟(jì)價(jià)值,因此在不同生產(chǎn)階段對油氣產(chǎn)量及成本的預(yù)測是必不可少的??梢愿鶕?jù)已有的生產(chǎn)資料及多屬性預(yù)測的結(jié)果,來評估下一步擬定的開發(fā)方案是否能產(chǎn)生較大的經(jīng)濟(jì)效益。

        4 基于機(jī)器學(xué)習(xí)的油氣產(chǎn)量預(yù)測的現(xiàn)狀、問題及對策

        產(chǎn)量預(yù)測是機(jī)器學(xué)習(xí)在油氣田大數(shù)據(jù)分析利用中一個(gè)重要的、典型的應(yīng)用,基于機(jī)器學(xué)習(xí)的產(chǎn)量預(yù)測包含了油氣數(shù)據(jù)挖掘的主要元素。在已有的研究中,通常是通過老井的數(shù)據(jù)來訓(xùn)練機(jī)器學(xué)習(xí)模型,并預(yù)測新井的產(chǎn)量。若預(yù)測目標(biāo)(標(biāo)簽)是井在固定一段時(shí)間內(nèi)的總產(chǎn)量或穩(wěn)產(chǎn)產(chǎn)量,則稱為靜態(tài)產(chǎn)量預(yù)測;若預(yù)測目標(biāo)是井的生產(chǎn)曲線,則稱為動(dòng)態(tài)產(chǎn)量預(yù)測。

        4.1 研究現(xiàn)狀

        1)靜態(tài)產(chǎn)量預(yù)測

        井的產(chǎn)量變化往往基于井所處區(qū)塊的層位特征、地質(zhì)和工程參數(shù)等靜態(tài)屬性的變化,靜態(tài)產(chǎn)量預(yù)測就是對井的靜態(tài)屬性的挖掘。LOLON 等[30]使用3 個(gè)多變量統(tǒng)計(jì)模型評估Bakken和Three Forks地層的井參數(shù)與產(chǎn)量之間的關(guān)系。評估得出,主要影響致密儲(chǔ)層產(chǎn)量的工程變量是水力壓裂過程中的總壓裂液量和支撐劑量。CLAR 等[31]使用人工神經(jīng)網(wǎng)絡(luò)預(yù)測Eagle Ford 頁巖工區(qū)水平井的產(chǎn)量,發(fā)現(xiàn)總產(chǎn)量與側(cè)向長度、垂直深度、孔隙度和壓裂液量均有顯著關(guān)系。

        然而,使用機(jī)器學(xué)習(xí)進(jìn)行產(chǎn)量預(yù)測的研究還處于起步階段。目前,頁巖、致密油氣藏等非常規(guī)油氣藏的靜態(tài)產(chǎn)量預(yù)測模型并沒有取得很好的效果[32],其中一個(gè)主要原因是油氣產(chǎn)量不僅受量化屬性的影響,而且還受儲(chǔ)層巖性、構(gòu)造、鉆井壓裂等非量化增產(chǎn)措施的影響,而這些屬性往往是非結(jié)構(gòu)化的數(shù)據(jù),導(dǎo)致機(jī)器學(xué)習(xí)建模時(shí)此類信息難以被使用。例如:在地質(zhì)因素的考慮上,以往的產(chǎn)量預(yù)測研究要么忽略了區(qū)塊特征[30],要么在樣本井較少時(shí)假設(shè)儲(chǔ)層具有均質(zhì)性[33],但實(shí)際上即使在很小的范圍內(nèi),致密地層或頁巖地層的地質(zhì)特征變化也會(huì)很大,不使用區(qū)塊特征信息或非均質(zhì)性信息會(huì)導(dǎo)致預(yù)測不準(zhǔn)確[34]。雖然很難直接將這些屬性進(jìn)行充分的特征工程,但可以找到替代的方法,一種折中的方法就是使用井位(井距、井位坐標(biāo)信息)來表示井之間的地質(zhì)差異[35]。因此,當(dāng)一些非結(jié)構(gòu)化數(shù)據(jù)信息難以納入模型時(shí),我們應(yīng)當(dāng)采用一些替代手段或增加適用條件限制,并適當(dāng)結(jié)合物理機(jī)理來加強(qiáng)對數(shù)據(jù)的提取和模式識別,從而減少這些因素的影響,如:根據(jù)數(shù)據(jù)的產(chǎn)生過程設(shè)計(jì)特殊架構(gòu)的端到端模型,在不進(jìn)行特征工程的情況下進(jìn)行機(jī)器學(xué)習(xí),減少在特征編碼時(shí)對油氣專業(yè)知識的依賴[36]。

        2)動(dòng)態(tài)產(chǎn)量預(yù)測

        油氣的生產(chǎn)曲線預(yù)測是一個(gè)典型的時(shí)間序列分析問題,使用動(dòng)態(tài)生產(chǎn)數(shù)據(jù)預(yù)測井的生產(chǎn)曲線就是動(dòng)態(tài)產(chǎn)量預(yù)測。生產(chǎn)曲線的預(yù)測研究包括對其自相關(guān)性、趨勢或周期性變化的分析,這些性質(zhì)可以幫助我們預(yù)測未來產(chǎn)量。因此,基于數(shù)據(jù)驅(qū)動(dòng)的生產(chǎn)曲線數(shù)據(jù)挖掘分析方法將對油氣井產(chǎn)量評估及預(yù)測至關(guān)重要。

        在已有的研究中被用來預(yù)測油氣生產(chǎn)曲線的時(shí)間序列學(xué)習(xí)器主要為簡單循環(huán)神經(jīng)網(wǎng)絡(luò)(Simple RNN)和長短時(shí)記憶網(wǎng)絡(luò)(LSTM)。SAGHEER等[37]比較了Simple RNN 和LSTM 兩種循環(huán)神經(jīng)網(wǎng)絡(luò)在油氣生產(chǎn)預(yù)測中的應(yīng)用效果,認(rèn)為LSTM 的性能優(yōu)于Simple RNN。因此,在進(jìn)行生產(chǎn)曲線預(yù)測分析時(shí)應(yīng)當(dāng)嘗試不同的循環(huán)神經(jīng)網(wǎng)絡(luò),選擇對數(shù)據(jù)集最適用的模型。

        目前油氣產(chǎn)量時(shí)間序列預(yù)測的研究大多是同步時(shí)間序列預(yù)測,問題描述為:已知屬性(Source)和預(yù)測目標(biāo)(Target)在每一步相對應(yīng),且已知屬性時(shí)間序列長度和預(yù)測目標(biāo)時(shí)間序列長度相等時(shí)計(jì)算產(chǎn)油量,例如基于循環(huán)神經(jīng)網(wǎng)絡(luò)適用油藏的產(chǎn)量曲線預(yù)測同期的月產(chǎn)油、產(chǎn)水、產(chǎn)氣量研究[38-39]。同步時(shí)間序列預(yù)測實(shí)際上是對未測量數(shù)據(jù)的計(jì)算,因此,能夠應(yīng)用的場景有限,例如:不能實(shí)現(xiàn)使用井的靜態(tài)參數(shù)及已知生產(chǎn)曲線預(yù)測未來生產(chǎn)曲線,也不能結(jié)合訓(xùn)練好的模型來優(yōu)化生產(chǎn)設(shè)計(jì)。一種解決方案是更改循環(huán)神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),建立滯后時(shí)間序列的循環(huán)神經(jīng)網(wǎng)絡(luò)模型,從而實(shí)現(xiàn)在更重要的場景下的產(chǎn)量預(yù)測。滯后時(shí)間序列目前主要應(yīng)用在機(jī)器翻譯和文本生成問題中,在油氣產(chǎn)量預(yù)測場景中尚未得到應(yīng)用。

        4.2 存在問題

        目前,基于機(jī)器學(xué)習(xí)的水平井產(chǎn)量預(yù)測研究在建模及應(yīng)用層面還存在不足,主要可以歸納為以下3個(gè)方面。

        1)機(jī)器學(xué)習(xí)在產(chǎn)量預(yù)測中的一般性研究較少,多為針對某一數(shù)據(jù)集的模型優(yōu)化和比較研究,應(yīng)用價(jià)值有限。每個(gè)油田的產(chǎn)量主控因素可能有較大差別,且很多參數(shù)是無法量化的,無法加入到機(jī)器學(xué)習(xí)中,帶來了較大的不確定性。因此,通過某一油田數(shù)據(jù)集訓(xùn)練出的機(jī)器學(xué)習(xí)模型往往不能在其他油田使用。并且,過量的調(diào)參往往會(huì)導(dǎo)致嚴(yán)重的過擬合。因此,使用機(jī)器學(xué)習(xí)方法進(jìn)行產(chǎn)量研究的重點(diǎn)不在于調(diào)參,而在于總結(jié)具有普適性的產(chǎn)量預(yù)測過程。

        2)對產(chǎn)量預(yù)測問題在機(jī)器學(xué)習(xí)模型中的描述欠缺,實(shí)際應(yīng)用場景不明確。目前的動(dòng)態(tài)產(chǎn)量預(yù)測建模通常是根據(jù)當(dāng)前生產(chǎn)的產(chǎn)液量、井底流壓等實(shí)時(shí)參數(shù)進(jìn)行產(chǎn)量的推算,不能實(shí)現(xiàn)對未來長期的預(yù)測。換言之,沒有一個(gè)能夠使用的靜態(tài)參數(shù)或已知生產(chǎn)曲線能夠預(yù)測未來生產(chǎn)曲線問題的時(shí)間序列分析模型。

        3)基于機(jī)器學(xué)習(xí)產(chǎn)量預(yù)測的建模方法研究較多,但拓展應(yīng)用研究較少,難以深刻挖掘機(jī)器學(xué)習(xí)模型在產(chǎn)量影響因素分析及生產(chǎn)優(yōu)化設(shè)計(jì)中的價(jià)值。產(chǎn)量預(yù)測模型不僅可以用于預(yù)測,還可以用于產(chǎn)能主控因素分析、生產(chǎn)決策和優(yōu)化等,但目前相關(guān)研究不夠深入。

        4.3 解決對策

        針對以上問題,應(yīng)當(dāng)著重以下3個(gè)方面的研究。

        1)致力于總結(jié)基于機(jī)器學(xué)習(xí)的產(chǎn)量預(yù)測建模的一般性過程,并結(jié)合油氣領(lǐng)域知識尋找提取與產(chǎn)量有關(guān)的非結(jié)構(gòu)化屬性的模式,得到可泛化的特征工程方法。使用多種機(jī)器學(xué)習(xí)模型在不同特征選擇下進(jìn)行產(chǎn)量預(yù)測,對比不同數(shù)據(jù)條件下,選用不同模型時(shí)在測試集上的預(yù)測結(jié)果,并結(jié)合油氣田大數(shù)據(jù)的特點(diǎn),分析方法的適用性及產(chǎn)生誤差的原因。

        2)研究產(chǎn)量的動(dòng)態(tài)預(yù)測問題在神經(jīng)網(wǎng)絡(luò)預(yù)測模型中有哪些應(yīng)用場景,從而正確地將產(chǎn)量預(yù)測問題描述為機(jī)器學(xué)習(xí)問題。例如:在產(chǎn)量動(dòng)態(tài)預(yù)測時(shí),使用井的靜態(tài)參數(shù)或已知生產(chǎn)曲線預(yù)測未來生產(chǎn)曲線,實(shí)際上是一個(gè)滯后時(shí)間序列預(yù)測問題,已知量和預(yù)測目標(biāo)在時(shí)間上并非互相對應(yīng),應(yīng)當(dāng)參照機(jī)器翻譯模型來確定循環(huán)神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)。建立循環(huán)神經(jīng)網(wǎng)絡(luò)模型前需要明確已知屬性和預(yù)測目標(biāo),不能混淆其與訓(xùn)練集、測試集的概念。

        3)建模后充分挖掘模型價(jià)值,根據(jù)現(xiàn)有的產(chǎn)量預(yù)測結(jié)果分析產(chǎn)能主控因素,進(jìn)一步認(rèn)識了解研究區(qū)特點(diǎn);找到可優(yōu)化的工程參數(shù),結(jié)合網(wǎng)格搜索、貝葉斯優(yōu)化等優(yōu)化方法,實(shí)現(xiàn)在新增生產(chǎn)井前對工程參數(shù)進(jìn)行合理的調(diào)整,達(dá)到降本增效的目的。利用機(jī)器學(xué)習(xí)模型能夠剔除數(shù)據(jù)噪聲的特性,排除井在生產(chǎn)過程中的隨機(jī)性產(chǎn)量波動(dòng),描述確定的產(chǎn)量波動(dòng),從而用于分析老井生產(chǎn)措施對產(chǎn)量的短期影響,實(shí)現(xiàn)生產(chǎn)措施的定量優(yōu)化。

        猜你喜歡
        機(jī)器油氣神經(jīng)網(wǎng)絡(luò)
        機(jī)器狗
        機(jī)器狗
        平?jīng)?,油氣雙破2萬噸
        “峰中”提前 油氣轉(zhuǎn)舵
        《非常規(guī)油氣》第二屆青年編委征集通知
        神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
        電子制作(2019年19期)2019-11-23 08:42:00
        未來機(jī)器城
        電影(2018年8期)2018-09-21 08:00:06
        油氣體制改革迷局
        能源(2017年5期)2017-07-06 09:25:55
        基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
        復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
        s级爆乳玩具酱国产vip皮裤| 日本一区人妻蜜桃臀中文字幕| 亚洲黄色av一区二区三区| 国产欧美日韩va另类在线播放| 情侣黄网站免费看| 久久se精品一区精品二区国产| 免费毛片一区二区三区女同| 蜜桃av人妻精品一区二区三区| 狠狠人妻久久久久久综合蜜桃| 又污又黄又无遮挡的网站| 538亚洲欧美国产日韩在线精品| 视频在线亚洲视频在线| 亚洲国产果冻传媒av在线观看| 最新高清无码专区| 久久久国产精品免费无卡顿| 青青草视频在线观看9| 全免费a级毛片免费看无码| a人片在线观看苍苍影院| 人妻无码AⅤ不卡中文字幕| 亚洲一区二区岛国高清| 小说区激情另类春色| 少妇对白露脸打电话系列| 天天天天躁天天爱天天碰2018| 啪啪免费网站| 日韩人妻av不卡一区二区三区| 美女午夜福利视频网址| 亚洲日本一区二区一本一道| 国产精品爆乳在线播放| 国产av自拍在线观看| 国产69精品久久久久9999apgf| 2019最新国产不卡a| 日韩人妻无码中文字幕一区| 国产成人精品自在线无码| 伊人亚洲综合影院首页| 亚洲国产综合久久天堂| 久久精品免费观看国产| 97福利视频| 一本色道久久88加勒比—综合| 国产91久久麻豆黄片| 少妇被粗大的猛烈进出69影院一 | 久久只精品99品免费久23|