許霖風一, 偶國富, 金浩哲
(浙江理工大學 流動腐蝕研究所, 浙江 杭州 310018)
隨著原油資源趨緊,石油化工企業(yè)進口含硫和高硫劣質(zhì)原油比例的逐年增加,延遲焦化成為當今煉油廠渣油尤其是劣質(zhì)渣油處理的主要方式[1]。但是焦化裝置腐蝕環(huán)境不斷惡化,設備、管線的硫腐蝕已經(jīng)成為影響焦化裝置安穩(wěn)、長周期運行的主要危害之一[2]。延遲焦化裝置處理原料的硫含量過高,裝置內(nèi)部管線的濕H2S腐蝕和高溫硫腐蝕已成腐蝕防控重點對象。劉宏波等[3]研究了單相流和多相流中的H2S電化學腐蝕與應力腐蝕開裂,得出了不同H2S濃度下N80鋼的腐蝕規(guī)律;Sun等[4]用玻璃細胞實驗分析了X65碳鋼在高、低H2S濃度下形成的表面腐蝕產(chǎn)物,證明不同濃度的H2S會形成不同的金屬表面腐蝕產(chǎn)物;王軍等[5]針對我國高硫原油大型煉油廠設備的H2S腐蝕展開研究,分析了H2S腐蝕的主要影響因素并提出了相關(guān)的防護措施。
濕H2S與高溫硫腐蝕的腐蝕速率都與管線內(nèi)的H2S濃度密切相關(guān),焦化裝置處理原料硫濃度較大,運行過程中產(chǎn)生的H2S在管線死區(qū)堆積,與富含水氣的管道發(fā)生化學反應,因此裝置受到嚴重的濕H2S腐蝕危害。但是目前尚缺少測量封閉管道內(nèi)部H2S濃度準確、實時的傳感器;另外,石化企業(yè)現(xiàn)場工況運行數(shù)據(jù)庫的大量歷史數(shù)據(jù)尚未得到信息挖掘和有效利用。在工業(yè)環(huán)境中,廣義線性模型如邏輯回歸、偏最小二乘回歸(PLSR)被廣泛應用于過程變量的預測[6],因為此類模型輸入直接,結(jié)構(gòu)簡單,可擴展性強,所以有快速的計算能力與特征保持功能。但是化工現(xiàn)場過程數(shù)據(jù)往往是高度非線性相關(guān)的,PLSR等線性模型無法處理變工況復雜環(huán)境下的高度非線性數(shù)據(jù)[7],而神經(jīng)網(wǎng)絡在處理非線性數(shù)據(jù)方面有一定的優(yōu)勢,如典型誤差反傳神經(jīng)網(wǎng)絡(BPNN),已被廣泛應用于分類、預測[8]、回歸等領(lǐng)域,然而BPNN算法權(quán)重更新較慢,且易陷入局部最小誤差。
因此筆者采用一種單層前饋神經(jīng)網(wǎng)絡——隨機權(quán)神經(jīng)網(wǎng)絡(RVFLN)作為基礎算法進行優(yōu)化,提出了小規(guī)范權(quán)重內(nèi)隨機權(quán)神經(jīng)網(wǎng)絡(SNRVFL)的數(shù)據(jù)驅(qū)動方法,并集成分析工業(yè)現(xiàn)場分布式控制系統(tǒng)(DCS)、實驗室信息管理系統(tǒng)(LIMS)等數(shù)據(jù)庫長期運行下的歷史數(shù)據(jù),建立關(guān)于H2S濃度的實時預測模型。最后在前期研究的基礎上,通過分析延遲焦化系統(tǒng)的工藝流程,研究裝置開工線管道的硫腐蝕機理,建立一種基于隨機權(quán)神經(jīng)網(wǎng)絡算法的H2S濃度預測模型,模型的測試效果良好,適用于延遲焦化開工線的H2S濃度預測,為裝置內(nèi)壓力管道的智能腐蝕防控與腐蝕風險評估提供數(shù)據(jù)基礎。
某煉油廠2#延遲焦化裝置原料為減壓渣油,其流程如圖1所示。首先原料經(jīng)過換熱器(E-101A-F)換熱后,進入原料油緩沖罐(D-101),然后由原料油泵(P-101A/B)抽出,經(jīng)換熱器(E-105A-F)換熱后(301℃)與焦化分餾塔底循環(huán)油(360℃)混合(318℃)進入加熱爐進料緩沖罐(D-102)。然后由加熱爐進料泵(P-102A/B)抽出進入焦化加熱爐(F-101A/B)并加熱至500℃,再經(jīng)過四通閥進入焦炭塔(C-101A-D,圖中僅顯示C-101A/B兩裝置)底部,然后通過2臺焦炭塔進行生產(chǎn)。4臺焦炭塔成對操作,一臺運轉(zhuǎn)24 h后,分別經(jīng)過小吹氣、大吹氣、給水、溢流、生焦、清焦等工藝過程,將焦炭從塔底排除,焦炭塔塔頂?shù)臍饬骼^續(xù)進入分餾塔完成循環(huán)。停工再生產(chǎn)時,原料通過四通閥從焦炭塔塔底和開工線同時進入塔內(nèi)進行預熱,其余工況下物料均從焦炭塔底進入。
開工線僅在停工生產(chǎn)時輸入進料預熱,其余工況下混雜著一定濃度H2S的氣體均滯留在開工線管道頂部無法排除,故開工線頂部(圖1中紅框部分)是焦化裝置腐蝕程度最嚴重的區(qū)域。停工檢修時拍下的開工線內(nèi)濕H2S腐蝕形貌圖如圖2所示。
裝置在給水、吹起、溢流、清焦等工藝過程中會產(chǎn)生大量水氣,且開工線內(nèi)部溫度長期處于30~120℃之間,在此種低溫、潮濕環(huán)境下,高濃度的H2S極易引起設備管線的低溫濕H2S腐蝕,腐蝕反應總化學式為:
xFe+yH2S→FexSy+yH2
(1)
圖1 延遲焦化裝置工藝流程圖Fig.1 Flow chart of the delayed coking plant1—Heat exchangers E-101A-F;2—Feed buffer tank D-101;3—Feed pumps P-101A/B;4—Heat exchangers E-105A-F;5—Furnace feed buffer tanks D-102;6—Furnace feed pumps P-102A/B;7—Furnaces F-101A/B;8—Coke drum C-101A;9—Coke drum C-102A;10—Fractionator T-101;11—Recycle oil pumps P-103A/B
圖2 延遲焦化裝置開工線內(nèi)壁腐蝕照片F(xiàn)ig.2 Picture of corroded start-up pipeline inner wall of a delayed coking unit
電離過程:
Fe→Fe2++2e-, H2S→HS-+ H+
(2)
腐蝕反應式:
HS-+Fe2+→FeS↓+H+, 2H++2e-→H2
(3)
當液相介質(zhì)呈現(xiàn)一定酸性時,F(xiàn)eS保護膜會被破壞,設備材料表面重新暴露易腐蝕環(huán)境中,促進了氫去極化腐蝕反應[9]:
Fe2++H2S→FeS↓+2H+
(4)
這些反應產(chǎn)生的氫離子容易滲入金屬內(nèi)部四處擴散,當遇到氫陷阱(如在晶界或相界上缺陷、位錯、三軸拉伸應力區(qū)等)時,堆積增多的氫離子會重新結(jié)合生成氫氣,引起陷阱處的高氫壓力,使金屬在內(nèi)部產(chǎn)生細微裂紋,進一步加劇腐蝕。
根據(jù)以上分析,操作人員根據(jù)開工線內(nèi)部溫度以及H2S濃度來對設備進行腐蝕防控是可行且必要的,但由于濕H2S腐蝕機理復雜,焦化流程冗長且工況變化頻繁,封閉管線內(nèi)部難以測量,操作人員無法根據(jù)實時變化的H2S濃度采取相關(guān)防腐措施,因此建立開工線內(nèi)H2S濃度的實時預測模型具有重要意義。
焦化裝置開工線內(nèi)H2S濃度受眾多工業(yè)過程變量的影響,如果將裝置所有相關(guān)的過程數(shù)據(jù)作為模型的輸入,會造成大量數(shù)據(jù)信息的冗余,高維度的輸入變量將會大大增加算法的計算量,影響數(shù)據(jù)的使用效率和運算速率。主成分分析法(PCA)對于處理高維非線性相關(guān)數(shù)據(jù)有較好的表現(xiàn)。因為實際工業(yè)相關(guān)數(shù)據(jù)中總是存在噪聲擾動,且高維度的過程變量之間通常存在一定相關(guān)性,相關(guān)變量之間所反映的某一信息就會有所重疊。因此PCA通過正交變換將原先收集的所有變量,轉(zhuǎn)化為一組線性不相關(guān)的變量,特征值大的相關(guān)成分被認為是有效的主要成分,小特征值的相關(guān)成分代表信息中的噪音,然后刪除多余重復的變量(關(guān)系緊密的變量),建立盡可能少的新變量,從而將獲得的低維主要成分來代替原始變量,達到過濾噪聲、減小維數(shù)的目的[10-11]。PCA作為基礎的數(shù)學分析方法,在此不再展開介紹。
而在回歸領(lǐng)域中,皮爾遜相關(guān)系數(shù)(r)通常被采用,表示輸入和輸出之間的相關(guān)性。分析兩者之間的關(guān)系時,篩選相應特征作為模型的輸入,其公式見式(5)。
(5)
為了降低模型維度,減小計算量,提高運算速率,可采用主成分分析法對4組不同焦炭塔的H2S濃度進行降維,提取主特征;然后用皮爾遜相關(guān)系數(shù)篩選與輸出相關(guān)性大的過程變量,作為模型的輸入。筆者采取工業(yè)現(xiàn)場DCS、LIMS數(shù)據(jù)庫中某一段時間內(nèi)(大于延遲焦化裝置的生產(chǎn)周期)的焦化裝置實際生產(chǎn)數(shù)據(jù),根據(jù)延遲焦化裝置實際運行工況,計算了數(shù)據(jù)樣本中各類數(shù)據(jù)特征與H2S濃度之間的皮爾遜相關(guān)系數(shù),結(jié)果如表1所示。
表1 各影響因子與H2S濃度間相關(guān)系數(shù)(r)分析Table 1 Correlation analysis between correlation coefficient(r) and H2S concentration
T—Temperature;p—Pressure;F—Flow;φ—Volume fraction;TR—Distillation range;OG—Oil gas line;SL—Start-up line;TT—Top of coke drum;TI—Tower inlet;OF—Overflow line;DG—Dry gas;LG—Liquefied gas;R—Residuum;WO—Wax oil;DO—Diesel oil;P—Petrol
由表1可知,開工線溫度、開工線壓力、干氣H2S體積分數(shù)、干氣流量、液化氣H2S體積分數(shù)、液化氣流量、油氣線總管流量、油氣線總管溫度這8個因子的相關(guān)系數(shù)絕對值明顯要大于其余影響因子,證明開工線內(nèi)H2S濃度受此8種因素的影響最大,且開工線溫度一項與H2S濃度的相關(guān)系數(shù)為負值,說明在低溫情況下H2S濃度反而較高,H2S管道的腐蝕程度也隨之上升,與案例實際腐蝕情況相符。
RVFLN是一種單層隱層前饋網(wǎng)絡(SLFN),最早由Pao和Takefuji于1992年[12]在函數(shù)鏈接型神經(jīng)網(wǎng)絡(FLNN)的基礎上[13]提出的,其性能已經(jīng)在各種應用領(lǐng)域得到證實。與典型3層BP神經(jīng)網(wǎng)絡不同,RVFLN的輸入層經(jīng)過拓展后形成新的隱含層,和原始輸入一起作為新的輸入集進行模型訓練[14]。M維輸入X=[x1,x2,…,xM] 和L維輸出Y=[y1,y2,…,yL]的RVFLN結(jié)構(gòu)如圖3所示。
圖3中iM、hK、oL分別為輸入層、隱含層、輸出層各層節(jié)點的值,輸入層原始輸入變量X=[x1,x2,…,xM]經(jīng)過附著隨機權(quán)重后,得到第k個隱含層拓展節(jié)點的值為:
(6)
式(6)中,hk表示第k個隱含層拓展節(jié)點的輸出值;wmk是連接第m個輸入層節(jié)點到第k個隱含層節(jié)點的權(quán)重;bi,k是第k個隱含層節(jié)點的輸入偏置;fk是第k個隱含層節(jié)點的非線性拓展函數(shù),其一般使用sigmoid邏輯函數(shù)、三角多項式[15]以及切比雪夫多少項式[16]等,sigmoid邏輯函數(shù)如式(7)所示。
(7)
在隨機權(quán)神經(jīng)網(wǎng)絡中,wmk、bi,k均在模型初始化時隨機產(chǎn)生且固定不變,無須進行更新。Bartlett[17]和Huang等[18]指出,相較輸入特征直接放入模型用于進行算法訓練,給輸入附著上[0,1]小規(guī)范內(nèi)的權(quán)重會使算法有更好的泛化性能,本文中的wmk、bi,k均取[0,1]內(nèi)的隨機數(shù)。結(jié)合輸入與隱含層節(jié)點的輸出,則圖3中輸出層節(jié)點的值(yl)可以表示為:
l∈{1,2,…,L}
(8)
式(8)中,wml、wkl分別為輸入層、隱含層到輸出節(jié)點的權(quán)重系數(shù);bi,l、bh,l為第l個輸出節(jié)點的輸入層、隱含層偏置;g為輸出層節(jié)點激活函數(shù),筆者采用sigmoid邏輯函數(shù)。由于輸入層到隱含層的權(quán)重無需更新,將輸入層和隱含層的節(jié)點均視為模型輸入,式(8)可簡寫為:
(9)
因此,為了使算法達到預置誤差要求,只需要更新輸出層的連接權(quán)重wj以及輸出節(jié)點的偏置bl即可,保證了模型的計算速率。
在經(jīng)過PCA降維和相關(guān)性因子的選取后,建模的具體步驟如下:
(1)首先采用離差歸一化對樣本數(shù)據(jù)歸一化:
(10)
式(10)中,S為原始樣本集;Smax、Smin是樣本S中每列特征數(shù)據(jù)最大值、最小值組成的矩陣;Sample表示歸一化后的樣本數(shù)據(jù)集。然后將樣本隨機地分成訓練集Str、驗證集Sva和測試集Ste,訓練集用于模型訓練,驗證集用于網(wǎng)絡隱含層節(jié)點數(shù)選取,最后測試集用于評估模型的性能。
(2)隨機產(chǎn)生一組[0,1]之間的拓展權(quán)重,連接輸入層節(jié)點與隱含層節(jié)點;然后將隱含層視為拓展節(jié)點,與原始輸入一起構(gòu)成最終的輸入矩陣I。
(3)初始化輸出層權(quán)重W在[-1,1]區(qū)間內(nèi)。
(11)
與實際輸出間的誤差記為E,
(12)
(5)用誤差反傳的方法更新權(quán)重W,l是模型的學習率,取l=0.7:
(13)
式(13)中,Wold表示更新前的權(quán)重矩陣;Wnew表示更新后新得到的權(quán)重矩陣。
(6)判斷更新后的權(quán)重是否達到誤差要求,如果達到,記下當前權(quán)重,模型建立完成;如果未達到,則繼續(xù)進行第(4)步至第(5)步,直到模型滿足要求。
由于4臺焦化塔成對操作流程一致,此章節(jié)僅以C-101A焦化塔為考察對象作為示范,建立塔C-101A內(nèi)的H2S濃度實時在線預測模型。結(jié)合2.1節(jié)中的影響因子相關(guān)系數(shù)分析,選取了8個相關(guān)性較大的影響因子作為模型的輸入變量,分別為C-101A開工線溫度、C-101A開工線壓力、出口干氣H2S體積分數(shù)、出口干氣摩爾流量、出口液化氣H2S體積分數(shù)、出口液化氣摩爾流量、油氣線總管流量、油氣線總管溫度;輸出變量為焦化塔C-101A開工線的H2S濃度。其中輸入數(shù)據(jù)的過程變量均可從現(xiàn)場DCS和LIMS數(shù)據(jù)庫中采集得到,模型輸出變量H2S濃度數(shù)據(jù)來自課題組前期開發(fā)的測量軟件,部分歷史數(shù)據(jù)如圖4所示。
圖4 現(xiàn)場測量軟件焦化塔管線內(nèi)H2S質(zhì)量濃度變化曲線圖Fig.4 Real historical curve of H2S mass concentration in the coking drum pipeline by field measurement software
為了保持輸入輸出的頻率一致,以輸出變量H2S為最低采樣頻率,從現(xiàn)場數(shù)據(jù)庫中獲取了一段時間內(nèi)同時刻的4000組輸入、輸出作為數(shù)據(jù)樣本,然后利用數(shù)據(jù)樣本根據(jù)2.3節(jié)中所給的步驟建立預測模型。采取均方根誤差(RMSE)衡量算法模型,對于H2S濃度的預測精度進行計算,見式(14)。
(14)
當隱含層激活函數(shù)選為sigmoid函數(shù)時,為了確定隨機權(quán)神經(jīng)網(wǎng)絡最優(yōu)的隱含層節(jié)點數(shù),需要用訓練集和驗證集對算法不同隱含層節(jié)點下的擬合程度進行模擬,計算各個隱含節(jié)點時算法的最終誤差,模型的誤差隨隱含層節(jié)點數(shù)的變化關(guān)系如圖5所示。
從圖5可知,當隱含層節(jié)點小于24時,驗證集誤差和測試集誤差均隨隱含層節(jié)點數(shù)增加而減小,在此區(qū)域算法屬于欠擬合狀態(tài)。而在隱含層節(jié)點大于24之后,雖然訓練集的誤差依然緩慢變小,但驗證集的誤差開始逐漸增大,模型趨于過擬合狀態(tài),因而確定模型隱含層節(jié)點數(shù)為24時可取得較好的建模效果,可避免節(jié)點過少時的擬合程度欠佳與隱含節(jié)點數(shù)過多導致的過擬合且降低工作效率,最終建立8-24-1的隨機權(quán)神經(jīng)網(wǎng)絡模型。
圖5 SNRVFL模型H2S濃度訓練集誤差與驗證集誤差隨隱含層節(jié)點數(shù)的變化關(guān)系Fig.5 Variation relationship between errors of the H2S concentration train dataset, validation dataset and numbers of hidden nodes with SNRVFL model
為了驗證所得SNRVFL算法模型在預測焦化裝置開工線H2S濃度方面的快速性與準確性,將建模效果與偏最小二乘回歸(PLSR)、支持向量回歸(SVR)、BP神經(jīng)網(wǎng)絡(BPNN)進行比較。對比PLSR、SVR、BPNN 3種常用算法模型,測試集的H2S濃度分布計算效果模擬分布圖和殘差值如圖6所示。由圖6可知,顯然SNVRFL模型的H2S濃度預測曲線擬合度最高,PLSR因為處理非線性數(shù)據(jù)能力較差,預測曲線波動幅度最大,不太適合于H2S濃度的準確預測。對比4種算法的殘差值,SNVRFL前65個測點的殘差在[-1.5,1.5]之間,均在0誤差標準線附近,說明該種算法的預測值最接近運行工況實際值,其預測性能最佳。
圖6 H2S濃度測試集在PLSR、BPNN、SVR、SNRVFL 4種算法下的模擬分布圖和殘差圖(前65個測試點)Fig.6 Analog distribution and residuals for H2S mass concentration testing dataset from PLSR, BPNN, SVR and SNRVFL algorithms (first 65 test points)(a) Analog distribution; (b) Residuals
從算法結(jié)構(gòu)上說,SNRVFL與BPNN均屬于需要更新權(quán)重的神經(jīng)網(wǎng)絡,由于SNRVFL輸入層到隱含層的權(quán)重是小范圍內(nèi)([-1,1])隨機確定的,因而只需要更新鏈接輸出層與其上一層之間的權(quán)重即可,迭代速率明顯快于典型的3層BPNN,其比較結(jié)果如圖7所示。
最后為了證明算法在精度與速率方面的優(yōu)勢并非偶然性,隨機打亂初始樣本重新分配訓練集與測試集(交叉驗證),用SNRVFL、PLSR、SVR、BPNN 4種算法模型分別模擬10次,計算各自均方根值(RMSE)與運行時間,結(jié)果見表2。
圖7 BPNN與SNRVFL迭代速率比較(隱含層節(jié)點數(shù)均為24) Fig.7 Comparison of iteration speed between BPNN and SNRVFL(24 hidden layer nodes)
OrderRMSECalculation time/msPLSRSVRBPNNSNRVFLPLSRSVRBPNNSNRVFL111.3757.3758.1077.1341391360413629.7687.5966.9637.05914876592130310.3247.4557.8386.89116924625127410.7897.7418.3247.17711967613284512.0408.1948.2657.35113893587134610.1977.4307.7296.72914901682141711.0067.1627.9147.58214928601135811.9147.8788.4867.23115913579133910.7627.4299.0597.109129576101621012.3077.9387.8027.17813864599149Average11.0487.6208.0497.14414914609153
綜合圖6~7與表2可以看出,SNRVFL較其他3種算法有更好的預測能力和泛化性能,在計算精度上,SNRVFL10次預測的均方根誤差平均值為7.1441,是4種算法模型中最小的,說明SNRVFL對該工況下的H2S濃度預測最精準;而且SNRVFL模型的運算速率也明顯要快于SVR和BPNN,說明SNRVFL模型處理非線性數(shù)據(jù)的能力很好且有快速實時的預測速率。因而SNRVFL模型的準確快速與全面性使其可用于焦化系統(tǒng)開工線內(nèi)H2S濃度的在線實時預測。
針對煉油企業(yè)延遲焦化裝置管線硫腐蝕嚴重的問題展開研究,分析確定延遲焦化裝置開工線內(nèi)腐蝕原因為低溫濕H2S腐蝕,基于SNRVFL優(yōu)化算法建立了延遲焦化裝置開工線內(nèi)H2S濃度的預測模型,首先對現(xiàn)場DCS、LIMS數(shù)據(jù)庫采集的各種數(shù)據(jù)特征進行降維預處理,對比影響因子相關(guān)系數(shù)大小,結(jié)合濕H2S腐蝕機理,提取了影響開工線內(nèi)H2S濃度的主要因素。然后為提高算法的非線性能力與泛化性能,對特征變量附著小范圍內(nèi)隨機權(quán)重并引入非線性函數(shù)拓展模型的輸入特征,用誤差反傳算法對輸出權(quán)重進行更新。計算結(jié)果表明,與其他算法比較,SNRVFL誤差收斂速率快,運算速率良好(僅次于PLS),預測精度高且具有較好的泛化性能。SNRVFL算法模型效率、準確且全面,故認為此方法可作為延遲焦化裝置開工線內(nèi)H2S濃度的智能預測模型。