徐小虎,方惠軍,王創(chuàng)業(yè),高 潔,王海深
(1. 中國石油煤層氣有限責(zé)任公司,北京 100013;2. 中聯(lián)煤層氣國家工程研究中心有限責(zé)任公司,北京 100013;3. 中國石油物資有限公司,北京 100029)
在深水油氣田開發(fā)過程中,高壓低溫的環(huán)境極易使天然氣生成水合物。油氣混合物中充足的水分子與天然氣分子接觸,水分子顆粒形成的晶格狀氫鍵將氣體分子困在其內(nèi),宏觀表現(xiàn)為形成冰晶狀結(jié)構(gòu),即籠形天然氣水合物。形成的天然氣水合物在不斷生長、聚集、著床及沉積,水合物生成量達(dá)到一定程度會嚴(yán)重影響油氣田的生產(chǎn)安全[1-3]。在實際生產(chǎn)中,天然氣水合物帶來的問題需要的解決時間較長,期間無法進(jìn)行正常的生產(chǎn)活動,從而帶來較大的間接經(jīng)濟(jì)損失。研究天然氣水合物的形成解離模型可及時預(yù)測管道內(nèi)天然氣的存在狀態(tài),對保障安全高效生產(chǎn)具有重要意義,同時可為天然氣水合物的生長和沉積模型提供理論依據(jù)[4,5]。
1941年至1945年,Katz等[6,7]采用圖表技術(shù)建立了基于氣體重力法的低硫天然氣水合物預(yù)測模型。Ghiasi[8]、Bahadori等[9]、Towler等[10]分別對Katz所建立的模型進(jìn)行了修正。1949至1954年,Katz與其他學(xué)者合作[11-13]建立了基于氣固平衡系數(shù)的水合物解離預(yù)測模型。其中,平衡系數(shù)依據(jù)經(jīng)驗選取,降低了模型的精確性。建立該模型的基礎(chǔ)假設(shè)為N2不參與水合物的形成,n-C4和乙烷具有相同的氣固平衡系數(shù)(KVS)。這些假設(shè)顯然不成立,因此,該模型的精度較低,適用范圍受限。1959年,Waals[14]建立了統(tǒng)計熱力學(xué)方法,成為天然氣水合物預(yù)測模型的理論基礎(chǔ)。在1966年至1980年,Dharmawardhana等[15]和Ng等[16]分別對Waals的統(tǒng)計熱力學(xué)方法進(jìn)行了改進(jìn)以建立天然氣水合物形成的預(yù)測模型,但這些模型僅適用于介質(zhì)為純水的情況。對于單一組分的純氣體,1981年,Makogon[17]建立了純氣體的水合物經(jīng)驗?zāi)P汀?987年,Ballie等[18]借鑒Katz所建立的圖表模型,建立了適用于酸性氣體的另一種圖表方法。2000年至2004年,Nasrifar等[19]考慮van der Waals提出的固體在水中溶解的概念,對天然氣水合物模型進(jìn)行了改進(jìn),使其可應(yīng)用于水中存在熱力學(xué)抑制劑的情況,但需要的基礎(chǔ)參數(shù)較多,計算復(fù)雜程度較高。2009年至2015年,Zahedi等[20]和Zarenezhad等[21]建立了基于Back Propagation Neral Network(以下簡稱“BP神經(jīng)網(wǎng)絡(luò)”)模型的天然氣水合物預(yù)測模型,該模型具有較高的預(yù)測精度,說明智能方法在天然氣水合物預(yù)測方面具有較為出色的表現(xiàn)。但由于BP神經(jīng)網(wǎng)絡(luò)模型的理論基礎(chǔ)是環(huán)境資源管理(Environmental Resources Management,ERM)傳統(tǒng)統(tǒng)計方法,因此其穩(wěn)定性較低,網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)較難確定,易出現(xiàn)局部過優(yōu)的情況。如果基礎(chǔ)的樣本數(shù)據(jù)較少,學(xué)習(xí)機(jī)器泛化能力也會隨之降低。天然氣水合物形成預(yù)測研究多集中在基礎(chǔ)介質(zhì)為純天然氣體系,通常不適用于含熱力學(xué)抑制劑體系,且計算結(jié)果波動較大,穩(wěn)定性較低[22-28]。2016年至2021年,馬貴陽等[29]將遺傳算法與支持向量機(jī)相結(jié)合建立了水合物相平衡預(yù)測模型,但其研究僅限于單一天然氣和無添加劑的體系,適用范圍受限。閆梟[30]和鄭秋梅等[31]分別建立了天然氣水合物生成支持向量機(jī)(Support Vector Machine,SVM)預(yù)測模型,并將其與深度神經(jīng)網(wǎng)絡(luò)等其他模型進(jìn)行了對比分析,雖然預(yù)測精度有所提高,但SVM算法復(fù)雜程度仍然較高。郭平等[32]和王海秀[33]對天然氣水合物生成模型的研究進(jìn)展進(jìn)行了總結(jié)分析,提出基于智能算法的天然氣水合物形成預(yù)測模型近年發(fā)展較快,預(yù)測精度較高,取得了良好的應(yīng)用效果,其中含熱力學(xué)抑制劑等多元復(fù)雜體系為今后研究的重點。
天然氣水合物圖表技術(shù)預(yù)測模型精度較低,熱力學(xué)模型參數(shù)繁多,計算復(fù)雜,智能模型中BP神經(jīng)網(wǎng)絡(luò)智能算法穩(wěn)定性低?;诹W尤核惴ǖ淖钚《酥С窒蛄繖C(jī)(Particle Swarm Optimization-Least Square Support Vector Machine,PSO-LSSVM)模型相對于SVM模型而言,復(fù)雜程度有所降低,學(xué)習(xí)泛化能力較高。其理論基礎(chǔ)是ERM模型的近似實現(xiàn),在非線性、數(shù)據(jù)樣本有限和維度較高的問題上具有較好的性能,且PSO算法可較精確且相對簡單地確定LSSVM的超參數(shù)。PSO-LSSVM模型與BP神經(jīng)網(wǎng)絡(luò)智能算法的理論基礎(chǔ)均為ERM理論,基于BP神經(jīng)網(wǎng)絡(luò)智能算法在天然氣水合物預(yù)測的出色表現(xiàn),為解決算法穩(wěn)定性低、參數(shù)難以確定和適用范圍局限于純天然氣體系的問題,本文以荔灣氣田現(xiàn)場注醇工藝為依托,借鑒機(jī)器學(xué)習(xí)算法,建立了基于PSO-LSSVM模型的含熱力學(xué)抑制劑天然氣水合物形成預(yù)測模型,與BP神經(jīng)網(wǎng)絡(luò)模型模擬結(jié)果進(jìn)行對比分析,并在荔灣氣田現(xiàn)場管道進(jìn)行預(yù)測應(yīng)用。
模型的可靠性和準(zhǔn)確度在很大程度上依賴于其所使用數(shù)據(jù)庫的優(yōu)越性與普遍性。為提高模型的可信度及適用范圍,建立了包含超過1500個實驗數(shù)據(jù)點的廣泛數(shù)據(jù)庫。數(shù)據(jù)庫覆蓋了從1941年至2018年在國際著名期刊所發(fā)表的文獻(xiàn),涉及純水及含熱力學(xué)抑制劑的溶液與不同組分的天然氣所形成的水合物,含括溶液-天然氣-水合物等多相態(tài)油氣水系統(tǒng),廣泛數(shù)據(jù)庫中氣液組分及溫度壓力范圍如表1所示,部分實驗數(shù)據(jù)參數(shù)如表2 所示,具體數(shù)據(jù)如圖1 所示。利用廣泛數(shù)據(jù)庫內(nèi)的實驗數(shù)據(jù)作為基礎(chǔ)變量輸入PSO-LSSVM模型中,從而確定模型的核參數(shù)和正則化參數(shù)等,將建立的模型應(yīng)用至荔灣氣田現(xiàn)場管道,預(yù)測其水合物生成的溫度和壓力等條件。
圖1 廣泛數(shù)據(jù)庫Fig. 1 Extensive database
表1 廣泛數(shù)據(jù)庫參數(shù)范圍Table 1 Range of extensive database parameters
表2 廣泛數(shù)據(jù)庫中部分實驗數(shù)據(jù)參數(shù)Table 2 Some experimental data parameters in extensive database
本研究以廣泛數(shù)據(jù)庫作為樣本支撐,建立了基于PSO-LSSVM模型的含熱力學(xué)抑制劑天然氣水合物形成預(yù)測模型,并將其應(yīng)用至荔灣氣田現(xiàn)場注醇管道。模型建立過程為:首先分析含熱力學(xué)抑制劑天然氣水合物的平衡特點及形成影響因素[34],即天然氣水合物組分和熱力學(xué)抑制劑種類及類型,確定LSSVM的輸入變量為熱力學(xué)抑制劑種類及類型和天然氣水合物組分及壓力,輸出變量為天然氣水合物形成溫度。根據(jù)不同類型的核函數(shù)特點,選取徑向基函數(shù)(Radial Basis Function,RBF)作為該模型的核函數(shù),其可以削弱過濾樣本數(shù)據(jù)中的噪聲且具有較強(qiáng)的局部性和抗干擾能力。建立LSSVM模型后,基于Matlab編程,利用訓(xùn)練樣本對模型進(jìn)行模擬訓(xùn)練,確定模型中各參數(shù)的取值。采用PSO算法對LSSVM模型的核參數(shù)與正則化參數(shù)進(jìn)行優(yōu)化。技術(shù)路線如圖2所示。
圖2 PSO-LSSVM模型的技術(shù)路線Fig. 2 Technical route of PSO-LSSVM model
采用最大最小法對實驗數(shù)據(jù)進(jìn)行歸一化處理,有利于提高算法的精準(zhǔn)度(xi),如式(1)所示。
式中,xk為影響天然氣水合物形成的某種因素,為處理前的數(shù)據(jù),k代表某種影響因素,k= 1時為第1種影響因素,如C1含量,k= 2時為第2種影響因素,如C2含量;xi為影響天然氣水合物形成的某種因素,為處理后的數(shù)據(jù),i代表某種影響因素,i= 1時為第1種影響因素,如C1含量,i= 2時為第2種影響因素,如C2含量;xmin為實驗數(shù)據(jù)中的最小值,xmax為實驗數(shù)據(jù)中的最大值。
荔灣氣田輸氣管道為氣液兩相流,水合物的形成主要與組分、壓力和溫度有關(guān)。將天然氣組分、液態(tài)組分及壓力作為模型的輸入變量,形成天然氣水合物的溫度作為模型的輸出變量。
蘋果樹適宜在年平均溫度8~12攝氏度的地區(qū)栽植。貴州蘋果主要集中在威寧縣和長順縣種植。威寧縣境內(nèi)海拔1 800~2 200米的區(qū)域大多能滿足蘋果栽培的氣候條件,長順縣蘋果種植建議選擇海拔1 200米以上區(qū)域種植。園地周邊5公里無污染源,適合優(yōu)質(zhì)鮮食蘋果生產(chǎn)生態(tài)指標(biāo),土壤較肥沃,有灌溉水源,交通便捷,通訊良好。
核函數(shù)和參數(shù)的選取在一定程度上影響所建模型的精確度。荔灣氣田輸氣采用注醇工藝,由于含熱力學(xué)抑制劑天然氣水合物的形成預(yù)測為非線性問題,因此,選用高斯核函數(shù)為建模基礎(chǔ)。高斯核函數(shù)屬于局部核函數(shù),對實驗數(shù)據(jù)中的噪聲具有較強(qiáng)的篩選能力,如式(2)所示。
式中,T為天然氣水合物的形成溫度,K;x為影響天然氣水合物形成的因素;σ為高斯函數(shù)的核參數(shù)。
引入含熱力學(xué)抑制劑的水溶液對天然氣水合物形成的影響,將熱力學(xué)抑制劑質(zhì)量分?jǐn)?shù)與目標(biāo)函數(shù)相關(guān)聯(lián),如式(3)所示。
式中,p為形成天然氣水合物的壓力,kPa;C為熱力學(xué)抑制劑的質(zhì)量分?jǐn)?shù),%;Z為氣體組分的物質(zhì)的量分?jǐn)?shù),%。
設(shè)給定N個訓(xùn)練數(shù)據(jù)樣本 ,其中,
為m維的數(shù)據(jù)樣本輸入, 為樣本輸出。將廣泛數(shù)據(jù)庫中70%的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),30%的數(shù)據(jù)作為測試數(shù)據(jù),采用隨機(jī)抽樣的方式劃分訓(xùn)練樣本和測試樣本。LSSVM算法的優(yōu)化如式(4)和式(5)所示。
式中,s.t.的全稱為subject to,中文含義為受限制于;min與s.t.聯(lián)合使用的數(shù)學(xué)含義為在滿足式(5)的前提條件下使式(4)中的目標(biāo)函數(shù)J達(dá)到最??;φ(·):Rm→Rmf為從原空間到高維空間的映射函數(shù);
根據(jù)目標(biāo)函數(shù)和約束條件,建立拉格朗日函數(shù)并經(jīng)過計算轉(zhuǎn)換最終得到水合物形成溫度的最優(yōu)決策函數(shù),如式(6)所示。
式中,K為拉格朗日函數(shù);ai為拉格朗日因子;b為偏置量。
在PSO中建立一個粒子種群,包含了各粒子的初始值,c1、c2取值為1.4959,種群數(shù)量N取值為30,迭代次數(shù)G最大值設(shè)定為300,慣性權(quán)重v取值設(shè)定為0.9。針對種群中的各個粒子,基于其所對應(yīng)的實驗數(shù)據(jù),利用LSSVM模型計算各粒子所對應(yīng)的位置值及誤差,并將各粒子所對應(yīng)的誤差作為其適應(yīng)度值。優(yōu)選比較粒子本身的適應(yīng)度值和目前位置的適應(yīng)度值,將粒子適應(yīng)度最優(yōu)值所對應(yīng)的位置作為當(dāng)前位置,進(jìn)而比較粒子的適應(yīng)度最優(yōu)值及種群的適應(yīng)度最優(yōu)值。若粒子的適應(yīng)度最優(yōu)值更優(yōu),則將粒子目前的位置作為種群的最優(yōu)位置,并更新粒子的速度與位置,如式(7)和式(8)所示。當(dāng)滿足終止條件時,則輸出此時的LSSVM參數(shù)值。
式中,c1、c2為常數(shù),取值為1.4959; 和 為速度限制; 和 為位置限制;r1和r2為[0,1]區(qū)間內(nèi)的一個隨機(jī)數(shù); 為直到第k次迭代微粒個體最優(yōu)位置;為第k次迭代的輸入值,即LSSVM模型的超參數(shù),如核參數(shù)、正則化參數(shù); 為直到第k次迭代整個群體的最好位置。
根 據(jù)Zahedi等[20]和Zarenezhad等[21]的研 究 可知,BP神經(jīng)網(wǎng)絡(luò)天然氣水合物預(yù)測模型具有較為出色的表現(xiàn),但存在算法穩(wěn)定性低且參數(shù)難以確定的問題。為測試PSO-LSSVM模型的計算精度和預(yù)測性能,建立了神經(jīng)網(wǎng)絡(luò)模型,并與該模型進(jìn)行了對比分析。由于關(guān)于天然氣水合物神經(jīng)網(wǎng)絡(luò)模型的研究較多,建模過程此處不再贅述。本文基于靈敏度分析,采用PSO算法優(yōu)化LSSVM模型的超參數(shù),得到核參數(shù)的值為1.0210368871948,正則化參數(shù)的值為321.1523642521。以壓力數(shù)據(jù)作為輸入?yún)?shù),利用所建模型計算水合物形成溫度,計算結(jié)果與實驗結(jié)果進(jìn)行比較,得到模型的計算誤差,如圖3所示。
圖3 模型的數(shù)據(jù)誤差Fig. 3 Model data error
由圖3可知,統(tǒng)計誤差數(shù)據(jù)得出平均相對誤差(Average Absolute Relative Deviation,AARD,%):
PSO-LSSVM模型為0.49%,具有更高的預(yù)測精度,而BP神經(jīng)網(wǎng)絡(luò)模型為1.92%;平均絕對誤差(Average Absolute Deviation,AAD,%):PSO-LSSVM模型為0.04%,模擬數(shù)據(jù)更加均勻地分布在實驗曲線兩側(cè),而BP神經(jīng)網(wǎng)絡(luò)模型為0.13%。
統(tǒng)計模擬數(shù)據(jù)的誤差分布規(guī)律,可得到PSOLSSVM模型和BP神經(jīng)網(wǎng)絡(luò)模型的相對誤差分布圖,如圖4和圖5所示。確度的指標(biāo),PSO-LSSVM模型相對誤差的最大值為4.47%,最小值為0.03%。而BP神經(jīng)網(wǎng)絡(luò)模型相對誤差的最大值為6.37%,最小值為0.06%,說明PSO-LSSVM模型具有更高的預(yù)測穩(wěn)定性。
圖4 PSO-LSSVM模型模擬誤差分布Fig. 4 Simulation error distribution of PSO-LSSVM model
圖5 BP神經(jīng)網(wǎng)絡(luò)模型模擬誤差分布Fig. 5 Simulation error distribution of BP Neral Network model
PSO-LSSVM模型的相對誤差主要分布在0%~1%之間,在大于1%的誤差區(qū)間內(nèi)數(shù)據(jù)較少。雖然BP神經(jīng)網(wǎng)絡(luò)模型的相對誤差亦主要分布在0%~1%之間,但在大于1%的誤差區(qū)間內(nèi)數(shù)據(jù)個數(shù)明顯多于PSO-LSSVM模型的數(shù)據(jù)個數(shù)。因此,PSO-LSSVM模型具有更強(qiáng)的預(yù)測能力。此外,相對誤差范圍亦是評價模型精
由于荔灣氣田部分管道未注入甲醇,因此,首先分析不同氣體組分下天然氣與純水形成的水合物曲線,如圖6所示,其中各氣體組分組成如表3所示。PSO-LSSVM模型與實驗數(shù)據(jù)[28]具有更高的吻合度,且波動較小,說明PSO-LSSVM模型的超參數(shù)選取較合理,可有效地預(yù)測純水存在下形成天然氣水合物的溫度。BP神經(jīng)網(wǎng)絡(luò)模型在部分?jǐn)?shù)據(jù)點具有較優(yōu)的預(yù)測性能,但在其他數(shù)據(jù)點預(yù)測精度較低,預(yù)測曲線波動較大,這是BP神經(jīng)網(wǎng)絡(luò)模型過度學(xué)習(xí)而陷入局部極小值所造成的。
圖6 純水與不同氣體組成天然氣形成水合物的預(yù)測結(jié)果Fig. 6 Prediction results of hydrate formed by pure water and natural gas with different gas composition
荔灣氣田多數(shù)輸氣管道均采用注醇工藝,因此,引入熱力學(xué)抑制劑的水溶液分析天然氣水合物形成,如圖7所示,其中各氣體組分組成如表3所示。以純水為基礎(chǔ)介質(zhì)時,PSO-LSSVM模型和BP神經(jīng)網(wǎng)絡(luò)模型均具有較高的預(yù)測精度。以含熱力學(xué)抑制劑水溶液為基礎(chǔ)介質(zhì)時,PSO-LSSVM模型仍表現(xiàn)出較為出色的預(yù)測能力,但BP神經(jīng)網(wǎng)絡(luò)模型的模擬曲線逐漸偏離實驗曲線[28],預(yù)測能力明顯下降。因此,PSO-LSSVM模型可較精確地預(yù)測含熱力學(xué)抑制劑天然氣水合物的形成與解離。
圖7 含熱力學(xué)抑制劑水溶液與不同氣體組成天然氣形成水合物的預(yù)測結(jié)果Fig. 7 Prediction results of hydrate formed by aqueous solution containing thermodynamic inhibitor and natural gas with different gas composition
表3 不同氣體組成天然氣Table 3 Different natural gas composition
為分析PSO-LSSVM模型的現(xiàn)場應(yīng)用效果,采用荔灣3-1氣田立管回接平臺處現(xiàn)場數(shù)據(jù)對模型進(jìn)行分析,該氣田氣體組成如表4所示,模擬結(jié)果與現(xiàn)場數(shù)據(jù)如圖8所示。由圖8可知,PSO-LSSVM模型計算得到水合物形成了平衡曲線。同溫度下,壓力高于曲線數(shù)值則會產(chǎn)生水合物。荔灣氣田現(xiàn)場形成水合物的紅色數(shù)據(jù)點位于曲線上方,未形成水合物的綠色數(shù)據(jù)點位于曲線下方,與模擬結(jié)果相符,說明PSO-LSSVM模型對于現(xiàn)場生產(chǎn)具有較強(qiáng)的適用性。采用此模型進(jìn)行模擬計算,可為甲醇注入量的確定和現(xiàn)場安全運行策略的制定提供理論依據(jù)。
圖8 荔灣氣田現(xiàn)場數(shù)據(jù)與模擬結(jié)果比較Fig. 8 Comparison of data and simulation results in Liwan gas field
表4 荔灣氣田氣組成Table 4 Gas composition of Liwan gas field
本文以荔灣氣田注醇工藝為基礎(chǔ),建立了基于PSO-LSSVM的含抑制劑天然氣水合物形成解離模型,并與BP神經(jīng)網(wǎng)絡(luò)模型模擬結(jié)果進(jìn)行了對比分析。主要結(jié)論如下:
(1)PSO算法優(yōu)化LSSVM模型的核參數(shù)選取1.0210368871948,正則化參數(shù)選取321.1523642521,驗證了參數(shù)選取合理。PSO-LSSVM模型平均相對誤差為0.04%,模擬數(shù)據(jù)均勻地分布在實驗曲線兩側(cè),具有較強(qiáng)的預(yù)測能力和穩(wěn)定性。
(2)對于以純水為基礎(chǔ)介質(zhì)的天然氣體系,PSO-LSSVM模型模擬結(jié)果與實驗數(shù)據(jù)具有更高的吻合度,且波動較小,BP神經(jīng)網(wǎng)絡(luò)模型因過度學(xué)習(xí)陷入局部極小值造成預(yù)測曲線波動較大;對于含熱力學(xué)抑制劑的天然氣體系,PSO-LSSVM模型預(yù)測精度較高,而BP神經(jīng)網(wǎng)絡(luò)模型模擬曲線逐漸偏離實驗曲線,預(yù)測能力明顯下降。
(3)PSO-LSSVM模型對于荔灣氣田現(xiàn)場生產(chǎn)有較強(qiáng)適用性,可為甲醇注入量的確定和現(xiàn)場運行策略的制定提供理論依據(jù)。