李 偉,薛永強,賈 鑫,劉祥彪,徐海豐
(1.東北石油大學(xué) 機械科學(xué)與工程學(xué)院,大慶 163318; 2.中國石油天然氣集團有限公司 工程和物裝管理部,北京 100007)
隨著經(jīng)濟的快速發(fā)展,我國對石油能源的需求不斷增加,而常壓儲罐作為石油的專用儲存容器,保障其長期安全穩(wěn)定運行極為重要。儲罐所有部位中底板是最易腐蝕但也是最難檢測的部位,常規(guī)無損檢測方法在不開罐的前提下無法對儲罐底板進行有效檢測和評價,目前聲發(fā)射檢測是儲罐底板腐蝕狀態(tài)在線檢測的主要技術(shù)之一[1]。依據(jù)標準 JB/T 10764-2007 《無損檢測 常壓金屬儲罐聲發(fā)射檢測及評價方法》 能夠?qū)薜牡装甯g情況做出評價,該標準將儲罐底板腐蝕狀態(tài)劃分為5個等級,其中1級最好,5級最差,然而標準中某些關(guān)鍵參數(shù)值的確定仍需依靠經(jīng)驗,這給儲罐底板腐蝕狀況的評價帶來了不確定因素,同時限制了聲發(fā)射檢測技術(shù)在儲罐底板腐蝕檢測中的推廣應(yīng)用。
隨著機器學(xué)習(xí)技術(shù)的發(fā)展,利用機器學(xué)習(xí)算法、統(tǒng)計方法對數(shù)據(jù)進行分析,智能化評價儲罐底板的腐蝕狀態(tài),對擺脫對傳統(tǒng)經(jīng)驗的依賴具有十分重要的意義。美國聲學(xué)物理公司基于其掌握的大量儲罐檢測數(shù)據(jù)研發(fā)了大型常壓金屬儲罐底板聲發(fā)射檢測專家評估系統(tǒng)(TANKPAC),目前已在全世界進行了大規(guī)模應(yīng)用。國內(nèi),陳榮剛[2]通過遺傳算法優(yōu)化貝葉斯網(wǎng)絡(luò)實現(xiàn)了對儲罐底板腐蝕狀態(tài)的預(yù)測,并將儲罐的宏觀特征作為評價模型的輸入特征,提高模型預(yù)測的準確率。張延兵等[3]、宋高峰等[4]、劉琪華等[5]等則利用BP神經(jīng)網(wǎng)絡(luò)及其優(yōu)化算法建立了儲罐底板腐蝕狀態(tài)的預(yù)測模型,實現(xiàn)了對儲罐底板腐蝕等級的預(yù)測。
儲罐底板腐蝕聲發(fā)射智能評價系統(tǒng)的建立需要大量的聲發(fā)射檢測數(shù)據(jù)支持,這不僅對數(shù)據(jù)的量有要求,數(shù)據(jù)的分布情況也同樣會影響智能評價系統(tǒng)的準確性。儲罐底板腐蝕檢測數(shù)據(jù)庫中各等級樣本分布如圖1所示,可見,儲罐底板腐蝕狀況的實際分布情況往往并不均衡,其中1級(非常微小腐蝕)和4級(存在動態(tài)腐蝕)的儲罐均只有20臺,而大部分儲罐的聲發(fā)射評價等級為2級(存在少量腐蝕)和3級(存在中等腐蝕)。缺陷樣本在數(shù)據(jù)空間分布上存在差異,尤其是在底板腐蝕狀態(tài)極好和極差的儲罐聲發(fā)射檢測數(shù)據(jù)不足的情況下,往往會造成1,4,5等級的欠學(xué)習(xí)和2,3等級的過學(xué)習(xí),從而降低底板腐蝕狀態(tài)智能評價系統(tǒng)的準確性。
圖1 儲罐底板腐蝕檢測數(shù)據(jù)庫中各等級樣本分布
針對以上問題,在結(jié)合專業(yè)人員相關(guān)經(jīng)驗的基礎(chǔ)上,充分考慮了儲罐的宏觀特征和聲發(fā)射特征,并以可能的腐蝕導(dǎo)向?qū)μ卣鬟M行了合理的預(yù)處理,同時提出采用過采樣技術(shù)來優(yōu)化樣本空間,改善數(shù)據(jù)集的平衡性。過采樣技術(shù)是一種廣泛應(yīng)用的數(shù)據(jù)增強方法,其中SMOTE算法是該領(lǐng)域影響力最大的過采樣方法,能大幅度改善數(shù)據(jù)集的平衡性[6],最后結(jié)合灰狼算法優(yōu)化的支持向量機(GWO-SVM),實現(xiàn)對儲罐底板腐蝕聲發(fā)射檢測等級的智能評價。
與試驗數(shù)據(jù)不同,儲罐底板腐蝕的現(xiàn)場聲發(fā)射檢測數(shù)據(jù)非常珍貴,在246個樣本數(shù)據(jù)中,2,3級占83.7%,1,4級均僅占16.3%,存在樣本分布不均衡的情況,為提高后續(xù)模型的訓(xùn)練效果,采用SMOTE算法對少數(shù)類樣本進行擴充。SMOTE算法對距離較近的少數(shù)類樣本進行線性插值生成新的少數(shù)類樣本,以實現(xiàn)數(shù)據(jù)平衡[7]。其主要計算過程為:① 對于每一個少數(shù)類樣本x,計算其到該類中其余所有樣本的歐氏距離并得到k近鄰;② 根據(jù)數(shù)據(jù)集的不平衡比例設(shè)置采樣倍率N,從少數(shù)類樣本x的k近鄰中隨機選擇若干個實例,假設(shè)選擇的近鄰樣本為xn;③ 將隨機選擇的樣本xn按照式(1)計算出新的樣本,并加入到數(shù)據(jù)集中。
xnew=x+rand(0,1)×(xn-x)
(1)
式中:x為少數(shù)類樣本;xnew為生成的新樣本;rand為隨機函數(shù)。
SVM(支持向量機)是一種處理分類和回歸問題的監(jiān)督式機器學(xué)習(xí)算法。在樣本數(shù)據(jù)量不充足的情況下,與人工神經(jīng)網(wǎng)絡(luò)等其他需要大量數(shù)據(jù)訓(xùn)練的分類算法相比,具有更好的學(xué)習(xí)效果[8]。對于線性分類問題,其利用間隔最大化求解最優(yōu)分離超平面;對于非線性分類問題,其通過核函數(shù)將原空間的數(shù)據(jù)映射到新空間,在新的空間里用線性分類學(xué)習(xí)方法學(xué)習(xí)分類模型。對于非線性可分的SVM形式可描述為[9]
(2)
s.t.yi(wxi+b)≥1-ξi,i=1,2,1,…,N
(3)
(4)
(5)
式中:w為權(quán)值;b為誤差;C為懲罰因子;ξi為松弛變量;N為訓(xùn)練樣本數(shù);s.t.為約束條件;xi,xj為樣本;yi為類別號;K(xi,xj)為核函數(shù);αi為拉格朗日乘子;sgn為判別函數(shù);f(x)為分類決策函數(shù);σ2為核函數(shù)參數(shù);g為內(nèi)部參數(shù),g=1/(2σ2)。
懲罰因子C和核函數(shù)內(nèi)部參數(shù)g共同決定了SVM模型的精度,依靠經(jīng)驗確定SVM的參數(shù)難以使模型達到最大準確率,因此對SVM的參數(shù)C和g進行優(yōu)化,確定最優(yōu)值十分重要。
在眾多支持向量機的優(yōu)化方法中,灰狼優(yōu)化算法(GWO)與其他傳統(tǒng)方法相比具有在復(fù)雜空間的全局搜索能力,GWO算法是受狼群捕獵行為啟發(fā)而提出的群體優(yōu)化算法,優(yōu)化過程分為以下3個部分[10]。
(1) 包圍獵物。狼群在狩獵過程中需要確定獵物位置并包圍獵物,用數(shù)學(xué)方程描述為
D=|SXP(t)-X(t)|
(6)
X(t+1)=XP(t)-AD
(7)
A=2ar1-a
(8)
a=2-2t/T
(9)
S=2r2
(10)
式中:D為灰狼與獵物之間的距離;XP(t)為當(dāng)前最優(yōu)解即獵物位置;X(t)表示灰狼當(dāng)前位置;X(t+1)為迭代至t+1次時灰狼的位置;A和S為系數(shù);r1和r2為在 [0,1] 區(qū)間內(nèi)的隨機數(shù);a為收斂因子,隨著迭代次數(shù)增加從2線性遞減到0;T為最大迭代數(shù)。
(2) 狩獵過程。在狩獵時,狼群的位置不斷變化,此過程在α狼、β狼、δ狼的引導(dǎo)下,計算ω狼群與前3個狼的距離并不斷更新位置,接近獵物,此過程的數(shù)學(xué)描述為
(11)
(12)
Xt+1=(X1+X2+X3)/3
(13)
式中:Dα,Dβ,Dδ分別為α,β,δ狼與其他狼之間的距離;Xα,Xβ,Xδ分別為α,β,δ狼的當(dāng)前位置;S1,S2,S3,A1,A2,A3為系數(shù);X1,X2,X3為普通灰狼向α,β,δ狼移動的步長;Xt+1為迭代至t+1次時獵物的位置。
(3) 攻擊獵物。在最后階段,狼群攻擊追捕獵物即完成尋優(yōu)過程,獲取最優(yōu)解。在收斂因子a從2線性遞減到0的過程中,當(dāng)|A|≤1時狼群集中攻擊,捕獲獵物位置進行局部搜索,當(dāng)|A|≥1時狼群發(fā)散,遠離獵物進行全局搜索。
首先利用SMOTE算法處理擴充數(shù)據(jù)集,實現(xiàn)樣本數(shù)據(jù)的平衡,利用SVM算法進行訓(xùn)練,并采用GWO算法優(yōu)化SVM算法中的參數(shù),從而得出使儲罐底板腐蝕等級評價精度最高的最佳參數(shù),優(yōu)化評價結(jié)果。SMOTE-GWO-SVM模型的流程圖如圖2所示。
圖2 SMOTE-GWO-SVM模型流程圖
儲罐聲發(fā)射檢測數(shù)據(jù)均來源于課題組所依托的國家認證聲發(fā)射檢測實驗室近年來進行現(xiàn)場儲罐聲發(fā)射檢測所建立的數(shù)據(jù)庫。每條數(shù)據(jù)有兩類特征(宏觀特征和聲發(fā)射特征),共20個特征參數(shù),具體如表1所示。
表1中數(shù)據(jù)類型復(fù)雜,部分宏觀特征并不是數(shù)值型數(shù)據(jù),考慮到不同條件底板腐蝕的情況不同,因此并沒有直接采用one-hot編碼,而是以可能的腐蝕狀況為導(dǎo)向?qū)拮址秃暧^特征進行預(yù)處理,預(yù)處理結(jié)果如圖3所示(腐蝕速率為歸一化數(shù)值,無量綱)。處理分析如下所述。
表1 儲罐宏觀特征和聲發(fā)射特征數(shù)據(jù)
圖3 儲罐宏觀特征腐蝕導(dǎo)向預(yù)處理結(jié)果
(1) 儲存介質(zhì)。儲罐內(nèi)的各儲存介質(zhì)對儲罐的腐蝕程度不同,重質(zhì)儲罐的腐蝕程度比輕質(zhì)儲罐的腐蝕程度更嚴重[11]。
(2) 運行溫度。對于絕大多數(shù)化學(xué)反應(yīng),反應(yīng)速率會隨溫度升高而加快[12]。
(3) 外觀腐蝕情況。外觀腐蝕情況包括罐壁、罐底邊緣板及焊縫腐蝕情況,防腐漆脫落情況等,外觀情況較差則儲罐腐蝕更嚴重[13]。
(4) 基礎(chǔ)完好情況。儲罐基礎(chǔ)無防滲層、表面有粘土、底部滲水、沉降等都會加重儲罐的腐蝕[14]。
(5) 保溫結(jié)構(gòu)。保溫層多為疏松多孔結(jié)構(gòu),易吸水,且保溫層下的水分冷凝難以蒸發(fā),與雜質(zhì)形成電解質(zhì)溶液更易造成儲罐腐蝕[15]。
(6) 材料類別。建造常壓儲罐所用材料多為低碳鋼和合金鋼,低碳鋼S和P的含量較高,而合金鋼添加了Mn,Cr,Ni等耐腐蝕元素,其耐蝕性比低碳鋼耐蝕性更好[16]。
(7) 儲罐結(jié)構(gòu)。浮頂儲罐浮盤支柱與儲罐底板接觸部位的涂層易受到破壞無法再次涂刷,且浮頂儲罐支柱易對底板造成沖擊,更易造成儲罐底板腐蝕[17]。
預(yù)處理后的數(shù)據(jù)宏觀特征和聲發(fā)射特征之間的量級相差較大,如果不進行無量綱化處理會對后續(xù)計算造成較大影響,因此對數(shù)據(jù)進行了歸一化處理,公式為
y=(x-xmin)/(xmax-xmin)
(14)
式中:x為樣本值;xmax,xmin分別為樣本的最大值和最小值;y為歸一化后的值,范圍在01之間且無量綱。
儲罐宏觀特征和聲發(fā)射預(yù)處理后的數(shù)據(jù)如表2所示(表中宏觀特征均已數(shù)據(jù)化)。
表2 儲罐外觀和聲發(fā)射數(shù)據(jù)預(yù)處理后的數(shù)據(jù)
為提高模型的訓(xùn)練效果,使用SMOTE算法進行少數(shù)類樣本擴容,將每個等級各20個原數(shù)據(jù)集樣本作為測試集,其余樣本和擴充樣本作為訓(xùn)練集,同時,采用GWO優(yōu)化算法對SVM算法的懲罰因子C和和核數(shù)參數(shù)g進行優(yōu)化,以獲得最佳模型,經(jīng)試驗,最終尋參結(jié)果為C=3.97,g=1.79,圖4為SVM參數(shù)尋優(yōu)過程示意。
圖4 SVM參數(shù)尋優(yōu)過程示意
為驗證SMOTE-GWO-SVM模型用于儲罐底板腐蝕等級評價的有效性,將未進行SMOTE處理和SMOTE處理后數(shù)據(jù)的分類結(jié)果進行對照,其中未經(jīng)過SMOTE處理的數(shù)據(jù)中1級、4級各10個,2級、3級各20個原數(shù)據(jù)集樣本作為測試集,其余作為訓(xùn)練集。同時與BP神經(jīng)網(wǎng)絡(luò)和隨機森林(RF)算法進行分類準確性對比,結(jié)果如表3所示,各個模型的混淆矩陣如圖5所示。
圖5 各預(yù)測模型的混淆矩陣
表3 各模型準確率對比
由分析結(jié)果可知,在進行SMOTE處理之前,儲罐底板腐蝕1級和4級的樣本數(shù)量較少,模型得不到充分訓(xùn)練,導(dǎo)致這兩類數(shù)據(jù)的分類準確率極低。對數(shù)據(jù)集進行SMOTE處理后,針對不平衡小樣本數(shù)據(jù)的分類準確率有較明顯提升,準確率從71.67%提升至96.25%。
從模型準確率的角度分析,SOMTE-GWO-SVM模型的準確率最高,從模型安全性的角度分析SOMTE-GWO-SVM模型將低腐蝕等級預(yù)測為高腐蝕等級,雖然可能會提高后續(xù)儲罐的維護成本,但是更好地滿足了石化行業(yè)對安全性的高要求,因此采用SOMTE-GWO-SVM模型對儲罐底板腐蝕等級進行預(yù)測,可滿足企業(yè)安全生產(chǎn)和維護要求。
儲罐典型聲發(fā)射特征參數(shù)分布如圖6所示(IQR為四分位距),可見,儲罐腐蝕情況越嚴重,聲發(fā)射參數(shù)中的定位事件密度、撞擊平均值、能量標準差和振鈴計數(shù)標準差就越大,這與儲罐聲發(fā)射檢測評價標準一致。標準將評定區(qū)域內(nèi)每小時出現(xiàn)的定位數(shù)和每個通道每小時出現(xiàn)的撞擊數(shù)作為儲罐底板腐蝕等級的評價依據(jù)。從圖6也可以看出,不同腐蝕等級的聲發(fā)射數(shù)據(jù)存在一定程度的重合區(qū)域,對于某一腐蝕等級,儲罐個體數(shù)據(jù)之間可能存在差異,而智能評價模型對多維度數(shù)據(jù)(聲發(fā)射特征和宏觀特征)進行學(xué)習(xí)和訓(xùn)練,避免了某個維度數(shù)據(jù)偏差給整體評價帶來影響。
圖6 儲罐典型聲發(fā)射特征參數(shù)分布
儲罐樣本不同特征的分布如圖7所示,圖中儲罐的腐蝕等級與儲罐的使用年限、運行溫度、外觀腐蝕情況和儲罐基礎(chǔ)沉降情況呈正相關(guān)。不難理解,儲罐服役年限越長,儲罐底板累積腐蝕產(chǎn)物越多,服役狀態(tài)越差,而溫度越高,存儲介質(zhì)越容易與底板材料發(fā)生化學(xué)反應(yīng)。外觀腐蝕情況和儲罐沉降則體現(xiàn)了企業(yè)對儲罐的日常維護和維修情況,若外觀疏于維護,罐內(nèi)底板的腐蝕狀態(tài)也不會太好。此外,儲罐腐蝕狀態(tài)與儲罐體積呈負相關(guān),即儲罐體積越大,底板腐蝕狀態(tài)越好。數(shù)據(jù)研究發(fā)現(xiàn),大型儲罐建造年限都比較短,同時由于建造費用高,企業(yè)對大型儲罐的維護投入也較高,所以儲罐容積越大,儲罐底板越不容易腐蝕。
圖7 儲罐樣本不同特征分布
(1) 將儲罐宏觀信息和聲發(fā)射數(shù)據(jù)相結(jié)合,并以可能的腐蝕狀況導(dǎo)向?qū)藓暧^信息進行預(yù)處理,提高了數(shù)據(jù)的合理性。
(2) SMOTE-GWO-SVM智能評價模型能夠通過擴充少數(shù)類數(shù)據(jù)集樣本,實現(xiàn)各類樣本空間的平衡,相對未采用SMOTE算法的智能評價模型,準確率從71.67%提升至96.25%。
(3) 智能評價結(jié)果表明,儲罐腐蝕與聲發(fā)射參數(shù)中的定位事件密度、撞擊平均值、能量標準差和振鈴計數(shù)標準差呈正相關(guān),與外觀參數(shù)中的儲罐使用年限、運行溫度和外觀腐蝕情況呈現(xiàn)正相關(guān)。
(4) 利用同時考慮聲發(fā)射特征和宏觀特征的智能評價模型對多維度數(shù)據(jù)進行分析,實現(xiàn)了對儲罐底板腐蝕狀態(tài)評價分級,避免了某個維度數(shù)據(jù)偏差給整體評價帶來影響。