朱 峰,胡建中,張延兵
(1.東南大學 機械工程學院,南京 211189;2.江蘇省特種設備安全監(jiān)督檢驗研究院 南通分院,南通 226011)
儲罐在長期使用過程中受到自然環(huán)境和內部介質不利因素的影響,某些部位均會受到不同程度的腐蝕,為了保障儲罐安全可靠運行,需要對儲罐進行檢測、評估與維護[1]。相比于定期開罐檢查,聲發(fā)射檢測技術作為一種無損檢測方式[2],具有在線、高效、經濟的巨大優(yōu)勢,并逐漸受到石化行業(yè)的普遍關注,其應用越來越廣泛。
儲罐底板聲發(fā)射在線檢測是指通過獲取罐底板腐蝕而產生的聲發(fā)射信號,對其腐蝕狀況進行綜合評價[3]。根據檢測標準TB/T10764—2007《常壓金屬儲罐聲發(fā)射檢測及評價方法》,聲發(fā)射在線檢測的結果可以采用時差定位分析方法進行分級,對評定區(qū)域內定位相對較集中的所有定位區(qū)域進行局部放大分析,并計算出每小時出現的定位事件數,根據定位事件數進行相應的腐蝕狀態(tài)評價。因此,研究罐底腐蝕區(qū)域識別方法對于罐底的腐蝕狀態(tài)評價具有十分重要的意義。
對罐底腐蝕區(qū)域進行評價主要是根據定位事件數分布的疏密情況,尋找事件數多發(fā)區(qū)域,進而為罐底腐蝕評價提供依據。傳統(tǒng)的方法是利用人工視覺分析事件數分布,預先設定聚類數目后,通過K均值進行聚類,該方法容易受人感覺因素的影響,存在不足;還有通過小波聚類的方法對罐底腐蝕區(qū)域進行識別[4],該方法能夠識別任意形狀分布的腐蝕區(qū)域,但其結果受到初始參數設置的影響。針對上述問題,筆者提出一種基于自適應仿射傳播的儲罐罐底聲發(fā)射腐蝕檢測評價方法。
仿射傳播聚類算法是一種快速有效的聚類算法,它將每一個數據點作為潛在的聚類中心點,通過循環(huán)迭代和消息傳遞,動態(tài)地確定聚類中心[5]。給定一個有N個樣本的數據集合X={x1,x2,…,xN},定義相似度距離:
式中:i∈{1,2,...,N},k∈{1,2,...,N},xi、xk分別為樣本點和類代表點;s(i,k)表示xk作為xi的類代表點的適合程度;p為偏向參數[7],該參數會影響消息傳遞的過程和類代表點的數目。
一般p取較大值時,產生的聚類數目也較多。故在無先驗知識的情況下,為產生數目適中的聚類結果,偏向參數的取值一般取相似度矩陣中各元素的中值pm=(Smax+Smin)/2,該值一般不為0。
計算數據集中兩兩數據點間的相似度距離,組成相似度矩陣:
式中:p為偏向參數;s(1,N)與s(N,1)為對應s(i,k)的相似度距離。
數據點之間存在著兩種不同的消息傳遞,數據點xk對點xi的吸引度R(i,k),反映了數據點xk作為點xi的類代表點的吸引程度。相應地,數據點xi對于點xk的歸屬度A(i,k),反映了數據點xi選擇xk的類代表點的歸屬程度,初始化歸屬度A(i,k)=0。兩種消息的迭代方程如下:
在消息的迭代過程中,有時會產生數據震蕩。因此需要設定一個重要的參數,稱為阻尼因子λ。在每次循環(huán)迭代中,R(i,k)和A(i,k)的更新結果都是由當前迭代更新的值和上一步迭代的結果加權得到的,該參數有效減少了震蕩,使得算法盡快收斂。加權更新公式為:
仿射傳播算法本質上是通過循環(huán)迭代不斷地進行證據的收集和傳遞以產生高質量的類代表點和對應的聚類,通過搜索使得聚類的能量函數得到最小化的過程。聚類的能量函數為各數據點與其聚類中心的相似度之和,即
式中:i∈Ci,Ci為點i的聚類中心。
在算法的實現過程中,消息點之間不斷進行信息的更新,隨著計算過程中消息的傳遞與累計并不斷進行循環(huán)迭代和信息傳遞,最終聚類產生高質量的類代表點的數目為m類[6]。
自適應仿射傳播算法是針對仿射傳播算法的改進算法,針對原算法中的阻尼因子和偏向參數這兩個參數進行改進[7-8]。主要方法包括掃描偏向參數空間以尋找最優(yōu)聚類結果,通過調整阻尼因子來消除震蕩以及降低偏向參數的值以逃離震蕩。自適應仿射傳播算法無需設置初始聚類中心點,并且通過遍歷偏向參數空間的方法可以消除初始參數設置的影響[9-10]。
當得到一系列聚類中心點后,還需要通過聚類的有效性指標來對聚類的有效性進行評價。在眾多的有效性指標中,Silhouette指標[11]以其性能好、簡單易用而得到廣泛的應用。
給定一個p維數據集D={x1,x2,…,xn},n為數據集D中數據對象的個數。聚類算法將D劃分為Nc個子集的集合D={C1,C2,...,CNc},子集Ci稱為D的子類(簇)。用ci表示類Ci中心點,ni表示類Ci中對象個數,d(x1,x2)表示對象間的距離。則Silhouette有效性指標定義為:
式中:a(x)為聚類Ci中的樣本x與類內所有其他樣本的平均距離,反映類的緊密型;b(x)為其他類與類Ci的最小類間距離,反映類的可分性。
一個數據集的所有樣本的Silhouette平均值可以反映聚類結果的質量,平均Silhouette指標越大表示聚類質量越好。
儲罐底板腐蝕評價主要是根據儲罐底板事件數分布的疏密情況,找出事件數多發(fā)區(qū)域,并依據相應聲發(fā)射檢測標準對儲罐底板的腐蝕狀態(tài)進行評價。儲罐底板事件數反映儲罐底板腐蝕事件發(fā)生的頻度,通常單位時間內出現的區(qū)域事件數越密集,評定區(qū)域的腐蝕狀態(tài)越嚴重,因此如何確定事件數集中區(qū)域對儲罐底板腐蝕評價至關重要。根據JB/T 10764—2007《常壓金屬儲罐聲發(fā)射檢測及評價方法》[12],對儲罐底板進行聲發(fā)射檢測結果進行基于時差定位的分級,根據定位圖中的事件分布,以不大于直徑10%的長度對儲罐底板劃出正方形或圓形區(qū)域,對評定區(qū)域內比較集中的定位集團進行局部放大分析,計算每小時的定位事件數E,對評定區(qū)域的有效聲源按照表1 進行分級。其中,C的具體數值須通過進行一定數量的儲罐檢測試驗和開罐驗證試驗后獲得。對采集到的儲罐聲發(fā)射信號進行定位后,采用自適應仿射傳播算法對罐底定位事件數進行聚類分析,找出罐底板聲發(fā)射事件數集中區(qū)域,對找出的事件數集中區(qū)域附近再次進行搜索,找出最大事件數區(qū)域,并按照表1對罐底事件數集中區(qū)域腐蝕狀態(tài)進行評價。
基于自適應仿射傳播的罐底腐蝕評價方法步驟如下:①對儲罐進行現場勘測,在盡可能排除噪聲的情況下開始采集信號,正常情況下采集2h。②使用數據濾波等信號處理方法對采集的信號進行降噪處理,對降噪后的信號采用平面三角定位算法,對聲發(fā)射事件進行定位。③初始化基本參數,如衰減因子λ(初始化λ為0.5)、最大迭代次數N等。④計算所有聲發(fā)射源樣本點的相似度矩陣S和偏向參數p,p以一個較大的值作為起始值,可以取為p=0.5×pm。⑤多次循環(huán)執(zhí)行仿射傳播算法,得到K個類代表點。⑥判斷個類代表點是否收斂,若收斂,則以減少p值;若不收斂,則p=p+以一定步幅增大λ;若λ≥λmax(λmax取0.85)時仍不收斂,說明該p值下的震蕩是固執(zhí)的,可按上式繼續(xù)減少p值以逃離震蕩。⑦判斷算法是否滿足終止條件,若滿足,終止迭代轉至⑧,否則轉至⑤。⑧采用Silhouette指標作為聚類有效性指標,輸出聚類結果。⑨以直徑10%的長度對聚類中心劃出正方形區(qū)域作為局部搜索區(qū)域,以直徑0.1%長度作為搜索步長,找出罐底事件數最大區(qū)域。⑩對罐底事件數最大區(qū)域進行腐蝕等級評價。
表1 基于時差定位分析的聲發(fā)射源的分級
為驗證該方法的適用性,選取三個儲罐作為試驗對象,1#儲罐直徑為4 000 mm,材料為碳鋼,介質為石油;2#儲罐直徑為14 000mm,材料為碳鋼,介質為甲醇;3#儲罐直徑為2 300 mm,材料為碳鋼,介質為石油。檢測儀器均為美國PAC 公司的SAMOS系統(tǒng),傳感器型號為DP3I,工作頻率范圍為20~100kHz,前放增益為40dB。
聲發(fā)射源在笛卡爾坐標系中有x和y兩個坐標。由于檢測過程中只記錄定位在罐內的聲發(fā)射源,故兩坐標的范圍均為[-D/2,D/2],D為儲罐直徑,罐圓心設為坐標原點(0,0),三個儲罐聲發(fā)射源分布圖如圖1所示。
圖1所示的三個罐底聲發(fā)射源,可以細分為局部集中型,如圖1(a)所示;松散分布型,如圖1(b)所示;密集集中型,如圖1(c)所示三種類型。
3.1.1 自適應仿射傳播算法聚類
對圖1所示三個罐底聲發(fā)射源進行自適應仿射傳播聚類,得到相應的Silhouette 值分別為0.6 251,0.5 565和0.5 649,可認為自適應仿射傳播算法能夠將各個聚類分開,如圖2所示。
3.1.2K均值聚類
傳統(tǒng)的K均值算法在執(zhí)行之前需要預先設定聚類數目,而實際情況中儲罐的聚類數目是不得而知的,自適應仿射傳播算法則并不存在上述問題,可以自動進行區(qū)域識別。為驗證自適應仿射傳播算法對于現場罐底聲發(fā)射源數據是適用的,此處將K均值算法的初始聚類數目設置為自適應仿射傳播算法得到的聚類數目相同,得到的結果如圖3所示。計算各自的平均Silhouette值,如表2所示。
表2 自適應仿射傳播算法與K 均值算法聚類數目對比
從表中對比的結果可知,對于現場罐底聲發(fā)射源數據,自適應仿射傳播算法能夠達到傳統(tǒng)K均值聚類算法的精度,得到一個較好的聚類結果。并且克服了傳統(tǒng)K均值聚類對于初始類中心選擇敏感,需要預知聚類數目的缺點。
通過分析對比可以發(fā)現,自適應仿射傳播算法對于現場罐底聲發(fā)射源數據是適用的。
圖1 儲罐罐底聲發(fā)射源分布圖
圖2 不同儲罐自適應仿射傳播算法聚類分布
通過上述方法得到聚類中心點后,以儲罐直徑10%的長度對聚類中心劃出正方形區(qū)域作為局部搜索區(qū)域,以直徑0.1%長度作為搜索步長,進行局部搜索以求得最大定位事件數,如圖4所示。將本方法得到的最大定位事件數,與K均值聚類結果和網格搜索算法得到的結果進行對比,如表3 所示。通過對比可以發(fā)現,該方法能夠達到K均值聚類和網格搜索算法的精度,相對于K均值聚類算法,自適應仿射傳播算法能夠自動確定聚類數目。由于自適應仿射傳播算法是在聚類中心點附近進行局部搜索,而網格搜索算法則需要對全局進行搜索,因此方法具有更快的搜索速度。
根據儲罐聲發(fā)射檢測標準,儲罐底板聲發(fā)射檢測結果可以基于時差定位,對儲罐底板腐蝕等級進行評價。根據上述步驟求得罐底最大定位事件數,所在區(qū)域即為腐蝕最嚴重區(qū)域。根據表1,對三個儲罐底板腐蝕等級進行評價,將得到的結果與實際開罐檢驗的結果進行對比,1#儲罐腐蝕等級為Ⅴ級,實際開罐檢驗結果為Ⅴ級;2#儲罐腐蝕等級為Ⅱ級,實際開罐檢驗結果為Ⅱ級;3#儲罐腐蝕等級為Ⅳ級,實際開罐檢驗結果為Ⅳ級。開罐結果如圖5所示,表明基于自適應仿射傳播的罐底腐蝕檢測評價方法是可行的。
表3 罐底最大定位事件數
圖3 不同儲罐K 均值聚類
圖4 不同儲罐罐底最大事件數所在區(qū)域
圖5 罐底實際開罐檢驗結果
筆者提出了一種基于自適應仿射傳播的儲罐罐底聲發(fā)射腐蝕檢測評價方法,該方法通過采用自適應掃描偏向參數空間及調整阻尼因子等方法,確定聲發(fā)射事件數集中區(qū)域,并按相應的檢測標準對區(qū)域內罐底的腐蝕狀態(tài)級別進行評價。通過現場應用分析表明,該方法很好地克服了傳統(tǒng)K均值算法無法準確獲知聚類數目的缺點,能夠精確地確定罐底事件數集中區(qū)域,從而提高罐底腐蝕檢測評價的準確率。
[1]戴光,李偉,王婭莉,等.常壓立式儲罐腐蝕狀態(tài)檢測與評價技術的研究與應用[J].無損檢測,2012,33(12):58-61.
[2]閆河,趙彥修,李曉林,等.常壓儲罐底板泄漏的聲發(fā)射源特征[J].無損檢測,2013,35(7):32-35.
[3]RIAHI M,SHAMEKH H,KHOSROWZADEH B.Differentiation of leakage and corrosion signals in acoustic emission testing of aboveground storage tank floorswith artificial neural net works[J].Russian Journal of Nondestructive Testing,2008,44(6):436-441.
[4]王偉魁,曾周末,李一博,等.基于小波聚類的罐底聲發(fā)射源聚集區(qū)域自動識別[J].納米技術與精密工程,2012,10(6):531-536.
[5]FREY B J,DUECK D.Clustering by Passing Messages Between Data Points[J].Science,2007,315:972-976.
[6]王羨慧,陳俊英,覃征,等.基于動態(tài)阻尼因子的動態(tài)阻尼仿射傳播聚類[J].華中科技大學學報:自然科學版,2012,40(2):116-122.
[7]TANG D M,ZHU Q X,YANG F.A Poisson-based adaptive affinity propagation clustering for SAGE data[J].Computational Biology and Chemistry,2010,34(1):63-70.
[8]趙健,唐潔,謝瑜.仿射傳播算法在圖像聚類應用中的實現與分析[J].計算機應用研究,2012,29(10):3980-3982.
[9]ZHANG X L,FURTLEHNER C,SEBAG M.Data streaming with affinity propagation[J].Machine Learning and Knowledge Discovery in Databases,Lecture Notes in Computer Science,2008,5212:628-643.
[10]鄭文棟,王輝,錢勇,等.基于自適應仿射傳播聚類的GIS局放缺陷分類研究[J].高壓電器,2013,49(8):50-55.
[11]王開軍,張軍英,李丹,等.自適應仿射傳播聚類[J].自動化學報,2007,33(12):1242-1246.
[12]JB/T 10764—2007,常壓金屬儲罐聲發(fā)射檢測及評價方法[S].