梁龍貴,張 龍,郭仕為,景玉平,梁 挺,李姜超
(1.中國(guó)石油塔里木油田公司 克拉采油氣管理區(qū) 地面工藝部,新疆 庫(kù)爾勒 841000;2.中國(guó)石油塔里木油田公司克拉采油氣管理區(qū) 克深8采氣作業(yè)區(qū),新疆 庫(kù)爾勒 841000;3.中國(guó)石油塔里木油田公司 克拉采油氣管理區(qū)生產(chǎn)辦,新疆 庫(kù)爾勒 841000)
隨著我國(guó)經(jīng)濟(jì)實(shí)力和科技水平的不斷提高,越來(lái)越多的陸上及深海天然氣資源被勘探和開(kāi)發(fā)。在其開(kāi)采、運(yùn)輸和處理的過(guò)程中,一旦滿足高壓、低溫和飽和水的條件,天然氣和水會(huì)形成冰晶狀的籠形結(jié)構(gòu)產(chǎn)物,即天然氣水合物(簡(jiǎn)稱“水合物”)[1]。形成的水合物可堵塞管道、井筒,增大管線起點(diǎn)壓力,影響管輸量,并造成設(shè)備腐蝕減薄,對(duì)正常生產(chǎn)造成較大的影響[2-3]。保障流動(dòng),解決水合物帶來(lái)的問(wèn)題,制定水合物防治措施,先決條件是研究水合物的生成相平衡條件。
近年來(lái),國(guó)內(nèi)外學(xué)者針對(duì)水合物生成條件進(jìn)行了研究,形成了經(jīng)驗(yàn)圖解法、熱力學(xué)模型法和關(guān)聯(lián)公式法等主要方法。其中,經(jīng)驗(yàn)圖解法和關(guān)聯(lián)公式法的計(jì)算過(guò)程相對(duì)簡(jiǎn)單,但預(yù)測(cè)效果和精度不盡如人意,常造成現(xiàn)場(chǎng)操作失誤[4]。以van der-Waals-Platteeuw為代表的熱力學(xué)模型,通過(guò)建立水合物相中水的化學(xué)位與富水相中水的化學(xué)位之間的關(guān)系,采用壓力迭代法對(duì)水合物生成條件進(jìn)行預(yù)測(cè),并由此衍生出了Parrish-Prausnitz(P-P)、Ng-Robinson(N-R)、Holder-John(H-J)、Chen-Guo和Du-Guo等模型[5],預(yù)測(cè)精度得到進(jìn)一步提高。但該熱力學(xué)模型依然存在基礎(chǔ)參數(shù)眾多、計(jì)算復(fù)雜的問(wèn)題,且在狀態(tài)方程的適應(yīng)性和選擇性上有所不同。
隨著計(jì)算機(jī)的高速發(fā)展,越來(lái)越多的非解釋類數(shù)據(jù)挖掘算法被用于水合物生成條件的預(yù)測(cè)。馬貴陽(yáng)等[6]通過(guò)遺傳算法(GA)和支持向量機(jī)(SVM)預(yù)測(cè)了水合物生成壓力,平均相對(duì)誤差為2.678%;卞小強(qiáng)等[7]量化了酸性氣體對(duì)水合物的形成權(quán)重,通過(guò)SVM對(duì)酸性體系下的水合物生成條件進(jìn)行預(yù)測(cè),平均相對(duì)誤差為5.7%;徐小虎等[8]對(duì)比了神經(jīng)網(wǎng)絡(luò)(BP)和最小二乘支持向量機(jī)(LSSVM)兩種算法的預(yù)測(cè)效果,在抑制劑體系下,LSSVM 模型的預(yù)測(cè)效果更好,最大相對(duì)誤差為4.47%;李恩等[9]采用正余弦算法(SCA)優(yōu)化BP 模型中各層的權(quán)值和閾值,對(duì)于酸性體系和醇鹽體系下水合物的生成溫度進(jìn)行了預(yù)測(cè),模型最大相對(duì)誤差為1.99%。以上研究中BP 模型和SVM 模型本質(zhì)上是基于環(huán)境資源管理的傳統(tǒng)統(tǒng)計(jì)方法,當(dāng)輸入?yún)?shù)樣本不均衡時(shí),仍有較大概率陷入局部最小值,且需要優(yōu)化的模型參數(shù)較多,增大了算法隨機(jī)性失誤、泛化能力變?nèi)醯目赡苄?。此外,上述研究的誤差在低溫低壓條件下尚可接受,但在高壓水合物的生成預(yù)測(cè)中明顯偏大。
概率神經(jīng)網(wǎng)絡(luò)(PNN)可根據(jù)數(shù)據(jù)樣本和預(yù)設(shè)期望值,自動(dòng)獲得各層單元之間的連接權(quán)值,在參數(shù)優(yōu)化上只需設(shè)置一個(gè)平滑參數(shù),具有收斂速度快、預(yù)測(cè)精度高和無(wú)需反復(fù)訓(xùn)練網(wǎng)絡(luò)等特點(diǎn)[10]?;诖?,本文在收集天然氣水合物生成實(shí)驗(yàn)數(shù)據(jù)的基礎(chǔ)上,將天然氣組分、水相質(zhì)量分?jǐn)?shù)和壓力作為輸入變量,將水合物形成溫度作為輸出變量,構(gòu)造PNN 模型;并采用改進(jìn)的天鷹(ⅠAO)算法實(shí)時(shí)優(yōu)化平滑參數(shù),形成適合不同體系的水合物生成條件預(yù)測(cè)模型;通過(guò)與熱力學(xué)方法和其他機(jī)器學(xué)習(xí)模型比較,驗(yàn)證算法的優(yōu)越性。
概率神經(jīng)網(wǎng)絡(luò)(PNN)模型是基于貝葉斯理論和Parzen窗的前饋型神經(jīng)網(wǎng)絡(luò),由輸入層、模式層、求和層和輸出層組成[11]。其中,輸入層只負(fù)責(zé)輸入樣本的預(yù)處理,將其轉(zhuǎn)化為輸入向量傳入模式層;模式層負(fù)責(zé)計(jì)算輸入向量與權(quán)值向量之間的相似程度,即計(jì)算各類別樣本的出現(xiàn)概率;求和層負(fù)責(zé)對(duì)各類別的輸出進(jìn)行加權(quán)平均;輸出層通過(guò)貝葉斯分類規(guī)則,將后驗(yàn)概率最大或響應(yīng)度最大的值作為系統(tǒng)輸出。模型公式見(jiàn)式(1):
式中,X為輸入向量;Wi為兩層之間的權(quán)值;δ為光滑因子。
天鷹(Aquila optimizer,AO)算法是2021 年由ABUALⅠGAH等提出的仿生學(xué)算法,屬于較新的種群優(yōu)化算法,在調(diào)參和收斂未知域上具有優(yōu)越性[12]。標(biāo)準(zhǔn)算法包括拓展搜索(X1)、縮小搜索范圍(X2)、擴(kuò)大范圍(X3)和縮小開(kāi)發(fā)范圍(X4)等步驟,根據(jù)迭代次數(shù)和隨機(jī)數(shù)大小,選擇相應(yīng)的捕捉策略,最終將獵物捕獲。不同搜索策略下的位置信息算法公式分別見(jiàn)式(2)~式(5):
式中,Xi(t+1)為不同搜索策略下t+1次迭代的解;Xbest(t)為t次迭代的最優(yōu)解,表示獵物的大致方位;XM(t)為當(dāng)前解的位置均值;rand為[0,1]的隨機(jī)數(shù);T為最大迭代次數(shù);Levy(D)為在D維空間中的萊維飛行函數(shù);XR(t)為隨機(jī)解;y和x分別為搜索范圍,呈螺旋上升趨勢(shì);α和β為固定參數(shù),取值為0.1;UB和LB分別為所求解函數(shù)的上限和下限;QF為用于平衡搜索策略的質(zhì)量函數(shù);G1、G2為天鷹跟蹤獵物過(guò)程中的飛行斜率。
從算法實(shí)現(xiàn)過(guò)程看,位置更新中式(3)會(huì)收斂為常數(shù),式(5)會(huì)收斂為0,且兩種位置均采用了萊維飛行,保證種群分布的均勻性和搜索的隨機(jī)性,因此只需對(duì)式(2)和式(4)進(jìn)行改進(jìn)。式(2)中的(1-t/T)作為Xbest(t)的系數(shù),表示當(dāng)前策略下最優(yōu)解的生成權(quán)重。此時(shí),采用線性減小的方式會(huì)明顯降低局部搜索能力,故將指數(shù)函數(shù)引入其中,通過(guò)自適應(yīng)權(quán)重確定目標(biāo)獵物的范圍,改進(jìn)后的公式見(jiàn)式(6):
以T=100 為例,改進(jìn)前后的數(shù)值大小見(jiàn)圖1。前期的非線性變化速度較快,權(quán)重較大,有利于全局搜索;后期的非線性變化速度較慢,權(quán)重較小,有利于局部搜索。
圖1 Xbest(t)數(shù)值的變化趨勢(shì)Fig.1 Variation trend of Xbest(t) values
同理,式(4)中的α和β為固定值,也會(huì)降低種群的尋優(yōu)趨向和收斂精度,在前期應(yīng)保證α大于β,以便盡快確定最優(yōu)解范圍;在后期應(yīng)保證α小于β,防止最優(yōu)解突破問(wèn)題邊界,在此采用雙曲正切函數(shù)進(jìn)行改進(jìn)。α、β修正后的公式分別見(jiàn)式(7)、式(8):
同樣以T=100 為例,改進(jìn)前后的數(shù)值大小見(jiàn)圖2。改進(jìn)后兩個(gè)參數(shù)的變化策略與算法特點(diǎn)相匹配,尋優(yōu)能力進(jìn)一步增強(qiáng)。最終,對(duì)AO算法進(jìn)行了改進(jìn),形成了ⅠAO(Ⅰmproved aquila optimizer)算法。
圖2 α和β數(shù)值的變化趨勢(shì)Fig.2 Variation trends of α and β values
在實(shí)際生產(chǎn)過(guò)程中,水合物的形成與多種因素相關(guān),溫度、壓力是形成水合物的外因,氣質(zhì)組分、水相組分和抑制劑成分是形成水合物的內(nèi)因[13-14]。當(dāng)氣體中乙烷和丙烷含量增加時(shí),相平衡曲線向右側(cè)偏移,說(shuō)明這兩種氣體會(huì)促進(jìn)水合物的生成,且水合物結(jié)構(gòu)由Ⅰ型變?yōu)棰瘼裥停籋2S和CO2等酸性氣體的加入對(duì)水合物的生成起促進(jìn)作用,且H2S 的促進(jìn)作用更強(qiáng);N2的加入可輕微抑制水合物的生成;甲醇、乙醇和乙二醇等熱力學(xué)抑制劑對(duì)相平衡曲線的影響程度不一,隨著抑制劑含量增大,甲醇的抑制效果不變,乙醇的抑制效果變小,乙二醇的抑制效果變大;不同鹽類同樣會(huì)破壞電離平衡,改變水合物的相平衡常數(shù),對(duì)水合物起到抑制作用,主要以NaCl和MgCl2為代表性的地層孔隙水成分為主[15]。
模型建立過(guò)程如下:(1)建立數(shù)據(jù)庫(kù),廣泛選取文獻(xiàn)中水合物的生成實(shí)驗(yàn)數(shù)據(jù),選取原則為溫度、壓力應(yīng)保持較大范圍,且同一組分體系下的數(shù)據(jù)點(diǎn)足夠多??紤]到現(xiàn)場(chǎng)工況均以甲烷為主體系的水合物,故刪除乙烷、丙烷、丁烷和CO2含量(物質(zhì)的量分?jǐn)?shù))超過(guò)80%的數(shù)據(jù),最終提取了512個(gè)數(shù)據(jù)。數(shù)據(jù)結(jié)構(gòu)見(jiàn)表1。第二列以CH4-H2O 的二元體系為主,第三列以CH4-C2H6-C3H8的多元體系為主,第四列以CO2-H2S 等酸性體系為主,第五列以NaCl、CH3OH等醇鹽體系為主,且每種體系下的數(shù)據(jù)量基本一致,保證了后續(xù)數(shù)據(jù)回歸的均衡性。除醇鹽體系外,其余體系的最高壓力較大,這對(duì)于我國(guó)四川盆地、塔里木盆地等高壓氣藏井下及井口節(jié)流后,水合物的預(yù)測(cè)起到重要作用。
(2)數(shù)據(jù)處理,為避免量綱差距過(guò)大對(duì)預(yù)測(cè)精度造成影響,將數(shù)據(jù)按照最大最小法進(jìn)行歸一化處理,統(tǒng)一至[0,1]區(qū)間。
(3)劃分?jǐn)?shù)據(jù)集,將數(shù)據(jù)集按照4:1,分為訓(xùn)練集和測(cè)試集,訓(xùn)練集用于訓(xùn)練模型參數(shù)和網(wǎng)絡(luò)結(jié)構(gòu),以便得到最優(yōu)PNN模型;測(cè)試集用于檢驗(yàn)?zāi)P皖A(yù)測(cè)未知參數(shù)的泛化能力。鑒于現(xiàn)場(chǎng)對(duì)水合物形成溫度的關(guān)注度較大,將天然氣組分、水相質(zhì)量分?jǐn)?shù)和壓力作為輸入變量,水合物生成溫度作為輸出變量。
(4)模型優(yōu)化,將訓(xùn)練集代入PNN模型,初始化ⅠAO 算法參數(shù),按照式(2)~式(8)分策略計(jì)算適應(yīng)度值,比較不同策略下適應(yīng)度值的優(yōu)劣,并根據(jù)最優(yōu)解更新個(gè)體最優(yōu)位置,當(dāng)偏差達(dá)到預(yù)設(shè)值或不再變化時(shí)優(yōu)化結(jié)束,得到最優(yōu)光滑因子δ下的PNN 模型,形成訓(xùn)練好的ⅠAO-PNN 模型。適應(yīng)度函數(shù)值Fitness公式見(jiàn)式(9):
式中:Z為數(shù)據(jù)個(gè)數(shù);y為實(shí)驗(yàn)值;y’為預(yù)測(cè)值。
(5)模型預(yù)測(cè),將測(cè)試集代入優(yōu)化后的PNN 模型,將輸出結(jié)果反歸一化處理,通過(guò)均方根誤差(RMSE)和決定系數(shù)(R2)兩個(gè)統(tǒng)計(jì)學(xué)參數(shù),評(píng)價(jià)模型的預(yù)測(cè)效果。
為驗(yàn)證AO 算法改進(jìn)的有效性,將ⅠAO、AO、粒子群(PSO)和麻雀(SSA)算法進(jìn)行比較,考察了其在訓(xùn)練集上的適應(yīng)度曲線,如圖3。
圖3 不同算法的適應(yīng)度曲線Fig.3 Fitness curves of different algorithms
PSO和SSA算法的原理和參數(shù)選取參照文獻(xiàn)[29],PSO算法中加速因子均為1.5,慣性權(quán)重為2;SSA算法中安全值取0.8,警戒值為0.2;所有算法的種群大小均為50,維度取10。在迭代過(guò)程中,ⅠAO 的收斂速度、收斂精度和魯棒性均優(yōu)于其余算法,PSO 和SSA 算法經(jīng)歷了多次局部最優(yōu)解,但始終無(wú)法跳出局值限值。
為進(jìn)一步體現(xiàn)算法性能,采用Wilcoxon秩和檢驗(yàn)進(jìn)行非參數(shù)統(tǒng)計(jì)分析,驗(yàn)證算法之間是否存在顯著差異,通過(guò)假設(shè)檢驗(yàn)概率p值,衡量結(jié)果的顯著性水平,當(dāng)p<0.05時(shí),表示該算法的顯著性強(qiáng)于其余算法;當(dāng)p>0.5 時(shí),表示該算法的顯著性弱于其余算法,如表2。其中,ⅠAO 和AO 算法的p值均小于0.05,且ⅠAO 算法的p值更小,PSO 和SSA 算法的p值大于0.05,說(shuō)明ⅠAO 算法與其余算法存在明顯差異。
表2 不同算法的Wilcoxon秩和檢驗(yàn)結(jié)果Table 2 Wilcoxon rank sum test results of different algorithms
設(shè)置ⅠAO-PNN模型的網(wǎng)絡(luò)結(jié)構(gòu)為17-400-400-1,根據(jù)上述ⅠAO 算法的優(yōu)化情況,最優(yōu)光滑因子δ=0.35641,訓(xùn)練結(jié)果如圖4。模型訓(xùn)練值均在回歸線附近,RMSE為0.6176,R2為0.9994,只有高溫高壓情況下存在少許偏離回歸線的點(diǎn),這可能與實(shí)驗(yàn)室內(nèi)高壓危險(xiǎn)性較大、數(shù)據(jù)較少有關(guān),但總體來(lái)說(shuō)訓(xùn)練效果較好。
圖4 IAO-PNN模型的訓(xùn)練結(jié)果Fig.4 Training results of IAO-PNN model
3.3.1 與熱力學(xué)模型對(duì)比
將訓(xùn)練好的ⅠAO-PNN 模型用于水合物生成溫度的預(yù)測(cè),同時(shí)與經(jīng)典的熱力學(xué)模型預(yù)測(cè)結(jié)果進(jìn)行對(duì)比,如圖5。
圖5 不同體系下水合物生成溫度預(yù)測(cè)結(jié)果Fig.5 Prediction results of hydrate formation temperature in different systems
P-P 模型簡(jiǎn)化了Langmuir 常數(shù)的計(jì)算方法,Chen-Guo 模型通過(guò)兩步生成模型預(yù)測(cè)水合物形成過(guò)程[30],Du-Guo模型將抑制劑體系和酸性體系加入預(yù)測(cè)模型[31],這3 種模型在預(yù)測(cè)水合物生成條件下的代表性較強(qiáng),故采用以上熱力學(xué)模型進(jìn)行對(duì)比實(shí)驗(yàn)。對(duì)于二元體系和多元體系,Chen-Guo 模型在低壓時(shí)的預(yù)測(cè)精度均不足,與第一個(gè)實(shí)驗(yàn)點(diǎn)的差距較大;P-P 和Du-Guo 模型在低壓時(shí)偏差較小,在高壓時(shí)偏差較大,可能與傳統(tǒng)模型未考慮水合物晶格體積變化,同時(shí)氫鍵作用增強(qiáng),未考慮氫鍵間的締合作用有關(guān)。對(duì)于酸性體系和醇鹽體系,熱力學(xué)模型中Chen-Guo的預(yù)測(cè)效果最好,但在高壓下與實(shí)驗(yàn)值仍存在較大偏離,其余熱力學(xué)模型未考慮水溶液中,氣體溶解和離子反應(yīng)對(duì)水合物誘導(dǎo)及生成的影響,在逸度計(jì)算上有所差異,故預(yù)測(cè)效果較差。ⅠAOPNN模型預(yù)測(cè)值與實(shí)驗(yàn)值的吻合度較高,預(yù)測(cè)曲線均穿過(guò)實(shí)驗(yàn)值,精度優(yōu)于其他熱力學(xué)模型,且在高壓下依然保持較好的預(yù)測(cè)效果。此外,數(shù)據(jù)在測(cè)試集上的RMSE為0.7624,R2為0.9991,與訓(xùn)練集相比,誤差和決定系數(shù)在同一數(shù)量級(jí)內(nèi),說(shuō)明ⅠAO-PNN模型具有良好的泛化能力。
3.3.2 與BP、SVM模型對(duì)比
針對(duì)傳統(tǒng)熱力學(xué)模型在水合物生成條件預(yù)測(cè)上的局限性,將訓(xùn)練好ⅠAO-PNN模型用于水合物生成溫度的預(yù)測(cè),并與BP、LSSVM等機(jī)器學(xué)習(xí)模型進(jìn)行對(duì)比,預(yù)測(cè)結(jié)果的絕對(duì)誤差(預(yù)測(cè)值與實(shí)驗(yàn)值的差值)如圖6。BP 和LSSVM 的網(wǎng)絡(luò)結(jié)構(gòu)參照相關(guān)文獻(xiàn)設(shè)置[8-9],BP 模型的權(quán)值和閾值由ⅠAO 算法優(yōu)化,SVM 模型的懲罰因子、核系數(shù)及不敏感參數(shù)統(tǒng)計(jì)也由ⅠAO 算法優(yōu)化。ⅠAO-PNN 模型的預(yù)測(cè)精度明顯優(yōu)于其余兩種模型,絕對(duì)誤差在±0.2 K 的范圍內(nèi);BP和LSSVM模型的絕對(duì)誤差基本一致,但兩者在高溫高壓區(qū)的預(yù)測(cè)精度有所下降,說(shuō)明模型對(duì)于數(shù)據(jù)樣本的要求較高,對(duì)于多子樣、小樣本的預(yù)測(cè)效果不好。BP和LSSVM模型在測(cè)試集上的RMSE分別為1.2468和1.1543,R2分別為0.9861和0.9905,與ⅠAO-PNN 模型(測(cè)試集上的RMSE為0.7624,R2為0.9991)相比精度明顯降低。
圖6 不同算法預(yù)測(cè)結(jié)果的絕對(duì)誤差分布Fig.6 Absolute error distribution of prediction results by different algorithms
以某氣田2022年4月3日至8月10日的現(xiàn)場(chǎng)數(shù)據(jù)為例,其組分如表3。采用ⅠAO-PNN模型用于現(xiàn)場(chǎng)水合物相平衡的預(yù)測(cè),對(duì)照管道維搶修記錄,觀察不同氣井集輸管道壓力的波動(dòng)情況。除氣流脈動(dòng)和傳感器故障外,壓力在一定時(shí)段內(nèi)上升則認(rèn)為管線中有水合物生成,如圖7。測(cè)試的15口氣井中有8口氣井位于相平衡曲線右側(cè),壓力未出現(xiàn)較大波動(dòng);7口氣井位于相平衡曲線左側(cè),壓力數(shù)次出現(xiàn)異常波動(dòng),此后均通過(guò)加大氣嘴流量和末點(diǎn)降壓的方式予以解堵。
表3 氣田氣組成Table 3 Gas composition in gas field
圖7 水合物預(yù)測(cè)結(jié)果與現(xiàn)場(chǎng)數(shù)據(jù)對(duì)比Fig.7 Comparison of prediction results and field data of hydrate
針對(duì)傳統(tǒng)熱力學(xué)模型和機(jī)器學(xué)習(xí)在水合物生成條件預(yù)測(cè)上的局限性,收集相關(guān)實(shí)驗(yàn)數(shù)據(jù),建立了適合不同水合物體系的ⅠAO-PNN模型,并針對(duì)模型的泛化性和魯棒性進(jìn)行了評(píng)價(jià),得到如下主要結(jié)論。
(1)通過(guò)自適應(yīng)權(quán)重和雙曲正切函數(shù)對(duì)AO 算法進(jìn)行了改進(jìn),形成ⅠAO 算法,其尋優(yōu)精度和收斂速度明顯優(yōu)于AO、PSO和SSA算法,可迅速跳出局部最優(yōu)解的限制。
(2)與傳統(tǒng)熱力學(xué)模型和機(jī)器學(xué)習(xí)算法相比,ⅠAO-PNN模型與實(shí)驗(yàn)數(shù)據(jù)的吻合性最高,適合不同體系下的水合物預(yù)測(cè),訓(xùn)練集上的RMSE為0.6176、R2為0.9994,測(cè)試集上的RMSE為0.7624、R2為0.9991,兩者的差距較小,說(shuō)明本文模型未出現(xiàn)過(guò)擬合或欠擬合的現(xiàn)象。
(3)通過(guò)現(xiàn)場(chǎng)驗(yàn)證,水合物預(yù)測(cè)結(jié)果與現(xiàn)場(chǎng)工況保持一致,證明了模型的可靠性,該模型可為現(xiàn)場(chǎng)解堵措施的制定,以及抑制劑加量的優(yōu)化調(diào)整提供參考。