亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于灰狼算法優(yōu)化的支持向量機產(chǎn)能預測

        2020-04-04 05:47:04宋宣毅劉月田王俊強孔祥明任興南
        巖性油氣藏 2020年2期
        關鍵詞:優(yōu)化模型

        宋宣毅,劉月田,馬 晶,王俊強,孔祥明,任興南

        (中國石油大學(北京)油氣資源與探測國家重點實驗室,北京 102249)

        0 引言

        油井的初期產(chǎn)能預測是油田開發(fā)的重要環(huán)節(jié),可為油藏的開發(fā)動態(tài)分析和調整提供依據(jù),也常用于對新鉆井的經(jīng)濟效益進行評估。關于產(chǎn)能預測模型,①根據(jù)油藏流體的滲流機理建立數(shù)學模型[1-5],其滲流微分方程組建立過程較為復雜,求解時需要多種假設條件,適用條件嚴格。②利用地質資料,建立地質模型,使用已有的開發(fā)資料進行歷史擬合,然后用油藏數(shù)值模擬的方法預測目標井位的產(chǎn)能[6],但是地質模型和數(shù)值模型的建立需要較高的時間成本和計算成本[7]。另外現(xiàn)場上也常采用經(jīng)驗和類比的方法,其誤差較大。

        在油田開發(fā)過程中,積累了大量關于油藏的地質數(shù)據(jù)、生產(chǎn)數(shù)據(jù)和工程數(shù)據(jù)等,這些數(shù)據(jù)對于深度認識油藏具有極其重要的作用,機器學習算法可以幫助人們從這些已有的數(shù)據(jù)中挖掘出需要的信息。潘有軍等[8]使用多元線性回歸方法建立了火山巖壓裂水平井的產(chǎn)能模型,但多因素對產(chǎn)能的影響規(guī)律,線性模型的表征仍不夠完善。田冷等[9]使用改進的BP 神經(jīng)網(wǎng)絡建立了長慶氣田的產(chǎn)能預測模型,該模型只有較大的樣本容量才能建立一個高精度的神經(jīng)網(wǎng)絡模型,而且容易產(chǎn)生過擬合現(xiàn)象。支持向量機(SVM)是以統(tǒng)計學習理論為基礎的新的機器學習算法,其建模過程簡單,耗時較少,能夠很好地解決小樣本、高維數(shù)的問題,而且可以表征多個特征與目標之間的非線性關系,預測結果也更加準確。王威[10]使用支持向量機方法對致密油藏的產(chǎn)能進行了研究,趙傳峰等[11]使用支持向量機方法,采用不同的核函數(shù)對調剖后的增油量進行了預測,發(fā)現(xiàn)其精度比BP 神經(jīng)網(wǎng)絡預測精度高出很多。張志英等[12]在油藏數(shù)值模擬的基礎上,基于支持向量機形成了水平井的產(chǎn)能預測方法。

        支持向量機的關鍵參數(shù),懲罰因子、松弛因子等對模型的精確度、穩(wěn)定性及泛化性能有較大的影響,這些參數(shù)的優(yōu)化對能否形成一個高性能的模型型至關重要。目前用于支持向量回歸機參數(shù)選擇的方法主要有3 種:①利用經(jīng)驗對參數(shù)進行選擇,這對使用者和樣本有較大的依賴性;②網(wǎng)格搜索尋優(yōu),它的不足之處在于步長的選擇,步長小,計算量大、時間長,步長大,容易錯失全局最優(yōu)解;③利用優(yōu)化算法對參數(shù)進行優(yōu)選?;依撬惴ň哂辛己玫淖越M織學習性,而且參數(shù)簡單、全局搜索能力強、收斂速度快、易于實現(xiàn)。因此,采用灰狼算法對支持向量機進行優(yōu)化[13],以特低滲油藏為例,建立油井的產(chǎn)能預測模型,以期提高產(chǎn)能預測的效率和精度。

        1 特征因素選取

        影響油藏初期產(chǎn)能的因素首先是地質因素,包括孔隙度、滲透率、含油飽和度、油層有效厚度和射孔段有效厚度等。其次是工程因素。對于特低滲透油藏來說,必須通過壓裂產(chǎn)生高滲條帶,形成基質孔隙與井筒的流動通道,從而建立產(chǎn)能,這里選用壓裂加砂量、加砂強度和泵效來分析工程因素對初產(chǎn)的影響。最后是開發(fā)因素,包括能量保持狀況以及井網(wǎng)井距等因素,能量的保持狀況用動液面的高度來表征,動液面越高,地層能量保持越好,動液面越低,地層能量保持程度越低;井網(wǎng)井距用油井的初始飽和度來表示,初始含水飽和度越高,表示注采井網(wǎng)的井距越小,初始含水飽和度越低,表示注采井網(wǎng)的井距越大?;谀程氐蜐B油田34 口生產(chǎn)井,選取上面提到的10 個特征參數(shù)作為分析產(chǎn)能的影響因素,建立產(chǎn)能預測模型的基礎數(shù)據(jù),如表1 所列。

        首先利用皮爾遜相關性分析各個因素之間的相關關系。皮爾遜相關關系是用來量度2 個變量之間的線性相關性。相關系數(shù)從-1(負相關)到1(正相關)之間變化,相關系數(shù)為0 時意味著這2 個變量之間沒有相關關系。計算方法[15]為

        式中:ρX,Y為參數(shù)X和參數(shù)Y之間的相關系數(shù);cov為協(xié)方差;σ是標準差。

        利用皮爾遜相關關系,計算了各參數(shù)之間,以及各參數(shù)與初產(chǎn)之間的相關系數(shù),結果如圖1 所示。可以看出,在特低滲油藏中,滲透率和孔隙度有較強的線性相關關系,孔隙度越大,滲透率越大。油層有效厚度、射孔段厚度以及壓裂加砂量有一定相關性,油層厚度越大,射孔段厚度越大,相應的壓裂加砂量也越大。另外,根據(jù)各個因素與初產(chǎn)的相關系數(shù)可以看出,射孔段厚度、壓裂加砂量以及油層的有效厚度與初產(chǎn)的相關性較強。

        表1 某特低滲油藏單井產(chǎn)能影響因素及對應初產(chǎn)[14]Table 1 Initial productivity and influencing factors of an ultra-low permeability reservoir

        圖1 初期產(chǎn)能影響因素相關關系矩陣Fig.1 Correlation matrix of influencing factors of initial productivity

        2 主控因素分析

        皮爾遜相關系數(shù)只能簡單分析單因素對產(chǎn)能的線性影響關系,在油藏開發(fā)過程中,產(chǎn)能是在多個因素共同作用下的非線性結果。為了明確各個地質參數(shù)、工程參數(shù)和開發(fā)參數(shù)對初期產(chǎn)能的非線性影響程度,使用隨機森林方法確定初期產(chǎn)能的主控因素。隨機森林是一種集成機器學習方法,利用隨機采樣技術和節(jié)點隨機分裂技術構造多棵決策樹,通過投票得到最終結果,其用于特征排序時主要有2 種方法,一種是對每個特征按照Gini 不純度進行排序,另一種是測量每種特征對模型準確率的影響,這里使用后一種方法[16]。

        隨機森林建模時隨機采樣未被抽到的數(shù)據(jù)稱為袋外數(shù)據(jù)集,這些數(shù)據(jù)沒有參與訓練集模型的擬合,可以用來檢驗模型的泛化能力。在對模型進行重要性排序時,使用相應的袋外數(shù)據(jù)計算它的袋外誤差r1,然后袋外數(shù)據(jù)中的某個特征的順序被隨機變換,再次計算袋外誤差r2,假設隨機森林有N棵樹,那么某個特征的重要性I為

        根據(jù)上述原理,計算得到該特低滲油藏每個特征對初產(chǎn)的重要性如表2 所列。

        表2 產(chǎn)能影響因素重要性排序Table 2 Importance order of influencing factors of productivity by Random Forest

        利用隨機森林方法對產(chǎn)能影響因素重要性的排序結果表明,特低滲透油藏初期產(chǎn)能的5 個主控因素為壓裂加砂量、射孔段厚度、初始含水飽和度、油層有效厚度以及加砂強度,其重要性指標I均大于0.20。因此,在開發(fā)特低滲透油藏時,新井井位應選在油層有效厚度大的區(qū)域,完井時增大射孔段厚度,壓裂施工時增大加砂量,提高加砂強度,從而提高初期產(chǎn)能。另外,開發(fā)因素中油井初始含水飽和度對初產(chǎn)的影響因素較大,其表征的是井網(wǎng)井距的影響。因此,在特低滲透油藏開發(fā)中,合理的井網(wǎng)井距對產(chǎn)能的提高和保持也有著重要的作用。

        3 模型的建立

        3.1 支持向量機(SVM)原理

        根據(jù)文獻[7]報道,支持向量機算法最初是Vladimie 等提出的,它是一種用來分析數(shù)據(jù)和模式識別的有監(jiān)督學習方法,可以對數(shù)據(jù)進行分類和回歸分析。這里所用到的是支持向量回歸機,其原理如圖2 所示,旨在尋找一個最優(yōu)的超平面,使得所有樣本離該最優(yōu)超平面的距離最小。

        圖2 支持向量機原理示意圖Fig.2 Schematic diagram of support vector machine

        超平面可用式(3)表示,最優(yōu)的回歸超平面為所對應的凸二次規(guī)劃問題,如(式4)所示[18]:

        式中:c為懲罰參數(shù),其取值反映了對式中2 個部分重要性的權衡;ξi和為松弛變量,以降低對超平面的要求;ε為不敏感參數(shù),定義了不敏感帶的寬度;Φ(xi)為映射函數(shù)。

        為了使式(4)容易求解,使用拉格朗日函數(shù)將目標函數(shù)轉化為其對偶形式:

        式中:αi和為拉格朗日乘子向量;K(xi,xj)為核函數(shù),可以將高維空間的內積運算轉換為低維空間的核函數(shù)運算。利用分塊算法、Osuna、序列最小優(yōu)化算法、或者增量學習法求得αi后,最優(yōu)超平面回歸函數(shù)可由式(6)確定

        3.2 灰狼優(yōu)化(GWO)算法原理

        3.2.1 算法概述

        灰狼優(yōu)化算法是通過模擬狼群的等級制度和捕食策略,以迭代的方式不斷尋找最優(yōu)值的一種群優(yōu)化算法[19]。狼的生活習性以群居為主,每個群體中有7~12 只狼,具有較為嚴格的等級制度,如圖3 所示。

        α是狼群中管理能力最強的,被奉為頭狼,因此所有狼都聽從它的指揮,其主要負責決策狼群的捕獵、駐地和休息時間等。β是α的顧問,幫助α制定決策及安排其他活動,也是狼群中秩序的維持者。當α去世或者年齡增大,β也是最好的α候選人。排在第3 層的是δ狼,聽從α和β的指示,并指揮ω,它們主要負責偵查、放哨、捕獵、看護等事務。年老的α和β也都會降級為δ。ω等級最低,必須服從其他等級狼的指揮和調度,也負責照顧幼狼,其數(shù)量可以平衡種群的內部關系。捕食活動由α帶領,首先狼群以團隊形式對獵物進行跟蹤、追趕、靠近,然后從各個方向包圍并恐嚇獵物直到獵物停止運動,最后攻擊獵物。

        圖3 狼群等級層次機制Fig.3 Hierarchy mechanism of grey wolf

        3.2.2 數(shù)學模型

        捕食過程中,狼群與獵物的距離D可用式(7)表示,狼群根據(jù)獵物位置和與獵物的距離更新其位置,用式(8)表示[20]:

        式中:X為狼的位置向量;Xp為獵物的位置向量;t為當前迭代步;A和C均為系數(shù)向量,通過調整這2個向量,狼可以到達獵物周圍的不同位置,其計算方法可用式(9)—(10)表示:

        式中:a在迭代過程中,從2 到0 線性減??;r1和r2為[0,1]之間的隨機向量。

        假定α,β和δ對獵物的潛在逃竄位置有較好的洞察能力,整個捕食過程由α,β和δ主導,而且α狼的位置是最優(yōu)的,其次是β,最后是δ。首先根據(jù)式(11)確定α,β和δ到獵物的距離,再根據(jù)式(12)移動到下一步的位置,ω則根據(jù)這3 頭位置最好的狼來更新自己的位置。根據(jù)上述方法,不斷迭代,直到滿足終止條件,便可得到優(yōu)化目標的最優(yōu)解、次優(yōu)解等。

        初期產(chǎn)能預測模型建立流程如圖4 所示,首先將收集到的數(shù)據(jù)進行歸一化處理,將其中80%作為訓練集,20%作為測試集,然后使用訓練集建立基于支持向量機的產(chǎn)能預測模型。整個過程使用MATLAB2016 b 編程實現(xiàn),支持向量機調用LIBSVM工具箱進行設計,選取徑向基函數(shù)作為核函數(shù),決定支持向量機性能的2 個關鍵參數(shù),懲罰參數(shù)c和核函數(shù)參數(shù)g使用上述灰狼算進行優(yōu)化,直至滿足迭代終止條件。最后使用測試集對模型的準確性進行評估。

        圖4 GWO-SVM 產(chǎn)能預測模型建模流程Fig.4 Workflow of GWO-SVM prediction model

        4 實驗與分析

        利用統(tǒng)計的某特低滲油藏34 口生產(chǎn)井的初期產(chǎn)量以及影響初期產(chǎn)量的10 種因素作為樣本庫,其中27 口井數(shù)據(jù)作為訓練集,7 口井作為測試集,使用網(wǎng)格搜索尋優(yōu)的支持向量機(GRID-SVM)和灰狼算法優(yōu)化的支持向量機(GWO-SVM)建立初期產(chǎn)能的預測模型,其中灰狼算法優(yōu)化得到的支持向量機參數(shù)分別為c=52.40,g=0.01。

        多元線性回歸模型[14],網(wǎng)格尋優(yōu)的支持向量機模型(GRID-SVM)和灰狼算法優(yōu)化的支持向量機模型(GWO-SVM)的預測結果如表3 所列,從表中可以看出,灰狼算法優(yōu)化的支持向量機建立的產(chǎn)能預測模型比多元線性回歸預測結果和網(wǎng)格尋優(yōu)的支持向量機預測結果誤差小得多,且均在12%以下。多元線性回歸和網(wǎng)格尋優(yōu)的支持向量機對油井初期產(chǎn)能預測結果的誤差較大,對P43-841 井預測結果的相對誤差甚至超過了40%。3 種方法的產(chǎn)能預測結果對比如圖5 所示,可以清楚地看到,灰狼算法優(yōu)化的支持向量機產(chǎn)能模型預測結果更準確。

        表3 不同方法單井初期產(chǎn)能預測結果Table 3 Prediction results of different forecast models

        圖5 不同方法單井初期產(chǎn)能預測結果Fig.5 Prediction results of initial productivity by different forecast model

        另外,在編程計算過程中發(fā)現(xiàn),GWO-SVM 比GRID-SVM 更加高效。當GRID-SVM 擴大網(wǎng)格搜索范圍或減小搜索步長時,計算所需要的時間會超過幾個小時。相反,GWO-SVM 往往在幾十秒之內便能得到結果,而且精度較高。

        5 結論

        (1)油藏初期產(chǎn)能的影響因素包括地質、工程、開發(fā)方面的10 種因素。皮爾遜相關性分析表明:射孔段厚度、壓裂加砂量和油層有效厚度均與初期產(chǎn)能有較強的線性相關性。

        (2)用隨機森林方法表征特低滲油藏初期產(chǎn)能影響因素與初產(chǎn)之間的非線性關系,確定的初產(chǎn)主控因素為壓裂加砂量、射孔段厚度、初始含水飽和度、油層有效厚度和加砂強度。

        (3)基于灰狼算法優(yōu)化的支持向量機產(chǎn)能預測模型,對測試集7 口井的預測結果誤差均小于12%,平均預測結果誤差為5%,比多元線性回歸和網(wǎng)格搜索優(yōu)化的支持向量機預測結果準確度提高10%以上。該模型也可以推廣到其他類型的油氣藏初期產(chǎn)能預測。

        猜你喜歡
        優(yōu)化模型
        一半模型
        超限高層建筑結構設計與優(yōu)化思考
        民用建筑防煙排煙設計優(yōu)化探討
        關于優(yōu)化消防安全告知承諾的一些思考
        一道優(yōu)化題的幾何解法
        由“形”啟“數(shù)”優(yōu)化運算——以2021年解析幾何高考題為例
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權M-估計的漸近分布
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉換方法初步研究
        av天堂亚洲另类色图在线播放| 少妇太爽了在线观看| 无遮挡十八禁在线视频国产制服网站 | 亚洲AⅤ无码国精品中文字慕| 日本无吗一区二区视频| 亚洲一区二区三区日本久久九| 337p日本欧洲亚洲大胆精品| 国产成人av一区二区三区无码| 麻豆AV无码久久精品蜜桃久久| 中文字幕色资源在线视频| 韩国三级在线观看久| 吃奶摸下的激烈视频| 亚洲综合网站精品一区二区 | 亚洲嫩草影院久久精品| 人妻少妇偷人精品一区二区三区| 国产av无码专区亚洲版综合| 国产精品无码a∨精品影院| 欧美成人免费看片一区| 午夜亚洲www湿好爽| 欧美日韩中文字幕久久伊人| 国产精品午夜福利亚洲综合网 | 女人脱了内裤趴开腿让男躁| 国产丰满老熟女重口对白| 国产三级黄色片子看曰逼大片| 国产国语按摩对白av在线观看 | 国产农村妇女精品一区| 男女爱爱好爽视频免费看| 亚洲电影一区二区三区| 白白色日韩免费在线观看 | 人妖啪啪综合av一区| 猫咪av成人永久网站在线观看| 日本高清一区二区三区水蜜桃| 日本肥老熟妇在线观看| 国产精品美女久久久网站三级 | 人成综合视频在线播放| 一个人看的视频www免费| 中文字幕亚洲无线码高清| 国产精品自拍视频在线| 正在播放强揉爆乳女教师| 亚洲人成7777影视在线观看| av免费一区在线播放|