夏俏健 高輝 高長征 凌建磊 梁昌晶
1中國航空油料有限責任公司溫州分公司
2河北華北石油路橋工程有限公司
3中國石油華北油田分公司第三采油廠
4中國石油天然氣管道局工程有限公司
測定的室內實驗[2],再借助電鏡掃描、能譜分析或X射線衍射等材料表征手段,得到第一手的腐蝕數(shù)據(jù),并根據(jù)腐蝕數(shù)據(jù)推斷腐蝕機理。
馮兆陽[3]對N80 套管鋼在H2S/CO2中的腐蝕行為進行了研究,利用由遺傳算法改進后的BP 神經網(wǎng)絡對腐蝕速率進行了預測,但與實測值相比,誤在石油石化行業(yè),腐蝕是危害管道安全、引起管道失效的重要因素,統(tǒng)計數(shù)據(jù)表明,與腐蝕相關的事故占管道總體事故比例的25%以上[1]。目前,有大量的學者對油氣管道的腐蝕機理和腐蝕形態(tài)進行了研究,基本上是采用掛片失重法、極化曲線法和電化學阻抗法在高溫高壓反應釜中進行腐蝕速率差較大,預測誤差最大為10.66%;王如君等[4]運用灰色關聯(lián)分析,并結合馬爾科夫鏈對埋地管道的最大腐蝕深度和腐蝕最大概率狀態(tài)進行了分析和評價,屬于半定量預測,且沒有對腐蝕速率進行預測;黃麗等[5]利用多元線性回歸建立了油田水體腐蝕的預測模型,雖然考慮了溫度、壓力、流速、CO2濃度、礦化度等多種因素的影響,但假定認為各因素和腐蝕速率呈線性關系,結果在顯著性分析中F值過高,導致預測相對誤差偏大。
隨著人工智能的快速發(fā)展,機器學習算法被廣泛應用于電力、水利、通信、電子信息等行業(yè),因此利用機器學習算法對油氣管道的腐蝕速率進行預測是可行的[6]。結合現(xiàn)場實測腐蝕數(shù)據(jù),運用PCA(主成分分析)法對腐蝕速率影響因素進行降維處理,將降維處理后的數(shù)據(jù)輸入SVM(支持向量機)模型中,實現(xiàn)對腐蝕速率的有效預測。
影響油氣管道腐蝕速率的因素有原油組分和輸送條件兩方面。其中,原油組分因素包括含水率、CO2含量、H2S 含量、Cl-含量、Ca2++Mg2+含量、溶解氧含量、pH 值等;輸送條件因素包括溫度、壓力、流速等。
(1)含水率。液態(tài)水的存在是構成腐蝕的基本條件,含水率與腐蝕速率呈正相關,隨著含水率的增加,腐蝕速率也相應增加,并且在越過轉相點之后,腐蝕速率急速增加,主要原因是由于流型轉換造成的管壁潤濕性改變。
(2)CO2含量。CO2溶于水后生成碳酸,在相同pH 值條件下,總酸度高于鹽酸等強酸,因此具有較強的腐蝕性。研究表明,單一的CO2腐蝕較嚴重,腐蝕速率呈線性增加趨勢,但CO2和H2S 共存時,腐蝕機理較復雜。當CO2和H2S 分壓比小于200 時主要以H2S 腐蝕為主,此時CO2分壓對腐蝕速率影響不大;當CO2和H2S 分壓比大于200 時主要以CO2腐蝕為主,此時隨著CO2分壓的增大,腐蝕速率呈線性增大趨勢,主要原因是由于分壓比的不同使腐蝕產物的成膜機制發(fā)生了改變。
(3)H2S 含量。H2S 溶于水后迅速電離出H+,一方面作為陰極的強去極化劑,可以在陽極奪取電子,促進陽極溶解反應;另一方面H+可以滲入基材的腐蝕坑及缺陷處,形成高壓氫氣,發(fā)生氫致開裂、氫鼓泡等氫損傷。在H2S 含量較低的情況下,基材表面會形成一層致密的FeS腐蝕產物,對腐蝕速率起到抑制作用;在H2S含量較高的情況下,大量的H+聚集在腐蝕產物和基材之間形成內應力作用,破壞腐蝕產物膜,腐蝕速率大幅上升。
(4)Cl-含量。基于電價平衡原理,Cl-會優(yōu)先吸附到基材表面阻礙腐蝕產物膜的形成,此外由于Cl-半徑較小,可以通過已形成腐蝕產物的微小孔洞滲入膜內,形成孔蝕核,因此隨著Cl-含量的增加,腐蝕速率呈線性增大趨勢。
(5)Ca2++Mg2+含量。在溫度和壓力的作用下,Ca2+、Mg2+作為成垢離子會形成碳酸鹽和硫酸鹽沉淀,一方面其覆蓋在基材表面抑制了腐蝕,另一方面與腐蝕點形成濃差電池,發(fā)生垢下腐蝕,使腐蝕加速。在不同的部位,腐蝕速率受結垢的影響程度不同。
(6)溶解氧含量。隨著溶解氧含量的增加,腐蝕速率呈線性增大趨勢,主要是氧氣可以作為陰極的強去極化劑,促進陽極的溶解反應;同時由于氧氣的強氧化性,還會進一步氧化腐蝕產物〔主要是Fe2+和Fe(OH)2〕,生成高價的腐蝕產物,促進局部腐蝕。
(7)pH值。pH值越低,說明原油中的酸性物質越多,酸性氣體的溶解度越大,腐蝕速率越大。
(8)溫度。隨著溫度的上升,腐蝕速率呈先上升后下降趨勢,存在腐蝕速率最大值,只是不同管材最大腐蝕速率對應的溫度有所不同,主要是溫度變化改變了腐蝕產物膜的特性,進而對腐蝕行為產生了影響。
(9)壓力。隨著管道壓力的上升,腐蝕速率呈增加趨勢,但整體增速不大。研究表明,對X65管線鋼,壓力從0.1 MPa 增大6 MPa,腐蝕速率僅提高了1.5倍。
(10)流速。當基材表面沒有形成腐蝕產物膜時,隨著流速的增大,由于流體攜帶一定的雜質,腐蝕速率呈線性增加趨勢;當基材表面形成了腐蝕產物膜,雜質介質的傳輸受到阻礙和影響,流速對腐蝕速率的影響有限。
綜上所述,多種因素共同影響著腐蝕速率的變化趨勢,其屬于多變量、非線性的問題,以這些影響因素作為影響腐蝕速率的主要因素進行下一步分析。
本論文數(shù)據(jù)來源于華北油田采油二廠腐蝕監(jiān)測系統(tǒng)。采用腐蝕掛片和電阻探針對腐蝕速率進行了在線檢測,水樣數(shù)據(jù)由現(xiàn)場取樣分析得到,溫度、壓力由現(xiàn)場傳感器遠傳到監(jiān)測平臺。共取得30 組相應的腐蝕樣本數(shù)據(jù),其中部分數(shù)據(jù)如表1所示。
表1 部分腐蝕樣本數(shù)據(jù)Tab.1 Sample data of partial corrosion
按照5∶1 的比例,隨機抽取其中的25 組樣本數(shù)據(jù)作為訓練樣本,另外5組樣本數(shù)據(jù)作為預測樣本。以平均絕對誤差和均方根誤差對PCA-SVM 模型的預測結果進行驗證[7],公式計算如下
式中:MAPE為平均絕對誤差;RMSE為均方根誤差;為腐蝕速率預測值;y為腐蝕速率實際值。
PCA法稱為主成分分析法,通過一系列的矩陣變換,實現(xiàn)對原始數(shù)據(jù)的降維處理。設有n組樣本數(shù)據(jù),每組樣本數(shù)據(jù)的維度是m(即影響因素是m個),可以通過PCA 降維后形成k維數(shù)據(jù),用k維數(shù)據(jù)表示原m維的大部分信息。主要步驟如下:
(1)將上述腐蝕速率影響因素的數(shù)據(jù)組合成矩陣,對所有的數(shù)據(jù)進行中心化處理,即用每一列的數(shù)值減去每列均值,得到矩陣X,求X的協(xié)方差矩陣R。
式中:xki為第k行i列的數(shù)值;為第i行平均值;xkj為第k行j列的數(shù)值;為第j行平均值;m為影響因素數(shù)量。
(2)利用Rx=λx求協(xié)方差矩陣R的特征值λ和特征向量x,其中特征值代表不同影響因素對腐蝕速率的貢獻率。
SVM 稱為支持向量機(Support Vector Machine),SVM法是以統(tǒng)計理論為基礎的綜合評價方法[8]。SVM法可以分為線性可分和線性不可分兩種模型,由于線性可分屬于線性不可分的一種特殊情況,因此采用線性不可分模型。設d維度空間中的判別函數(shù)為
式中:ω b為回歸因子。
為了對所有的樣本正確分類,要求滿足以下公式
滿足式(5)的最小分類面就是最優(yōu)分類面,利用Lagrange函數(shù)將上述問題轉換成對偶問題,對不等式約束條件下的二次函數(shù)求極值后得到的最優(yōu)分類函數(shù)為
約束條件為
為了控制計算速度,減少樣本訓練中出現(xiàn)的誤差,引入了懲罰因子C和不敏感損失參數(shù)ε進行約束。
根據(jù)泛函數(shù)的相關理論,將內積運算(xi?x)轉換成核函數(shù)K(xi?x)運算,可以實現(xiàn)非線性變換后的線性分類,運算的復雜性并沒有增加,變換后的分類函數(shù)為
式中:為Lagrange乘子,K(xi?x)為核函數(shù)。
通過不同的核函數(shù)可以構建不同的SVM 模型。滿足Mercer 條件下常用的內積核函數(shù)有三種,分別是多項式、徑向基和S 形核函數(shù)。研究表明,徑向基核函數(shù)在多數(shù)數(shù)據(jù)庫的選擇和計算上占有一定優(yōu)勢,在隱含層節(jié)點數(shù)一致的條件下,平均絕對誤差最低,因此選擇該核函數(shù)為
利用SPSS 進行PCA 主成分分析,得到含水率、CO2分壓、H2S 分壓、Cl-含量、Ca2++Mg2+含量、溶解氧含量、pH 值、溫度、壓力、流速等10種影響因素的貢獻率和累計貢獻率[9](表2)。
表2 主成分分析結果Tab.2 Analysis results of principal component
由表2可知,含水率、H2S含量、CO2含量、Cl-含量對腐蝕的影響程度較大。其中,含水率的貢獻率最大,為38.471 8%,證明含水率的變化對腐蝕速率的影響最大;壓力的貢獻率最小,為0.223 3%,證明壓力的變化對腐蝕速率幾乎無影響。為了保證下一步SVM 預測結果的準確性,取累計貢獻率大于98%的前8項影響因素代替原先所有影響因素,忽略流速和壓力的影響。
對于SVM 模型來說,懲罰因子C、核參數(shù)σ和不敏感參數(shù)ε的取值直接影響模型的預測精度。參數(shù)尋優(yōu)常用的模型有PSO(粒子群算法)、GA(遺傳算法)、LS(最小二乘算法)、SS(分散搜索算法)、FOA(果蠅算法)等,在此選擇最為常用的LS進行參數(shù)尋優(yōu)。
C值代表錯分樣本的比例和模型復雜程度之間的平衡點,C值過大,模型泛化能力較差,C值過小,計算時間變大,訓練誤差較大。由圖1 可知,平均絕對誤差隨著C值的增大先降低而后緩慢上升,在C=15.168 時達到最小值。σ值直接影響核函數(shù)的映射關系和樣本數(shù)據(jù)的復雜程度,σ值過大,訓練樣本欠學習;σ值過小,訓練樣本過學習。由圖2可知,平均絕對誤差隨著σ值的增大先下降而后緩慢上升,在σ=0.374時達到最小值。
在C和σ值固定的條件下,隨著ε值的增加,模型的平均絕對誤差MAPE先保持不變,隨后呈線性增大趨勢,選擇引起最小絕對誤差的最大ε值為0.01,如圖3所示。
三個參數(shù)共同作用下模型的相關系數(shù)R=0.996 2,證明所選的三個參數(shù)適用于SVM腐蝕速率預測模型,模型中有99.62%的數(shù)據(jù)可以被解釋,只有總變異0.38%的數(shù)據(jù)無法解釋。
圖1 C 值與平均絕對誤差關系Fig.1 Relation between C value and MAPE
圖2 σ 值與平均絕對誤差關系Fig.2 Relation between σ value and MAPE
圖3 ε 值與平均絕對誤差關系Fig.3 Relation between ε value and MAPE
隨后,將降維后的因素代入經參數(shù)優(yōu)化的SVM 模型,以腐蝕速率作為目標輸出函數(shù),建立腐蝕速率預測模型,同時與PCA-BP、PCA-GRNN和PCA-WNN模型的預測結果進行對比,預測結果及誤差統(tǒng)計如表3、圖4所示。
從表3 可知,PCA-BP 和PCA-WNN 模型的平均絕對誤差分別為8.28%、7.79%,且兩者的均方根誤差較大,說明這兩種模型不適合對腐蝕速率進行預測;PCA-SVM 和PCA-GRNN 的預測誤差波動較小,其中PCA-SVM 的平均絕對誤差和均方根誤差均小于PCA-GRNN,分別為1.04%和0.013 39,說明該模型可以對多種因素影響條件下的油氣管道腐蝕速率進行預測,只是由于模型變量復雜,導致訓練時間較長,最長可達到7.48 s。
表3 預測誤差統(tǒng)計Tab.3 Statistics of prediction error
圖4 腐蝕速率預測結果Fig.4 Prediction results of corrosion rate
對影響油氣管道腐蝕速率的原因進行了梳理和總結,應用PCA 法對影響因素進行了降維,選取了累計貢獻率大于98%的前8項影響因素代替原先所有影響因素,忽略流速和壓力的影響。對PCASVM、PCA-BP、PCA-GRNN 和PCA-WNN 四種預測模型進行對比,其中PCA-SVM 的預測效果最好,但訓練時間較長,應進行算法優(yōu)化。今后可嘗試用KPCA 代替PCA 進行主成分分析優(yōu)化,用SVR、SEM等方法進行腐蝕速率的綜合預測。