(南昌航空大學 無損檢測技術教育部重點實驗室,南昌 330063)
超聲檢測技術具有檢測成本低、靈敏度高等優(yōu)點,被廣泛應用于工業(yè)無損檢測中。目前的超聲檢測技術中,對缺陷進行定性的方法還沒有取得滿意的效果[1]。在對缺陷信號類型的分析過程中,最重要的步驟就是提取缺陷信號的特征量。根據回波信號的時域幅值雖然能夠判斷出是否存在缺陷,但是僅僅從時域獲得的缺陷信號信息是有限的。為了獲得更多的表征缺陷信息的特征量,對信號進行頻域分析也是非常有必要的[2]。
針對信號特征量的提取,相關人員進行了大量的研究。文獻[3]提取A掃描數據作為特征量,并結合向量機對管道的缺陷進行了有效識別。文獻[4]提取了缺陷信號的波峰時刻和幅值作為特征量,識別了不同類型的脫黏缺陷。文獻[5]對信號進行EMD經驗模態(tài)分解后,提取了IMF分量信號的最大幅值、中心頻率和信號能量作為特征量以識別缺陷,取得了較好的效果。文獻[6]對信號進行了小波包變換,從近似系數及細節(jié)系數提取樣本的特征量,對復合材料進行缺陷識別,并證明了該方法能夠進行有效分類。文獻[7]以獨立分量分析為基礎,與瞬間態(tài)特征提取的特點相結合來進行信號特征提取,并取得了較好的效果。
筆者提出一種基于小波包分解及主成分分析的方法對缺陷信號進行分類。以鋁板為例,提取了缺陷信號經過7層小波包分解后各個頻段的能量占比作為特征量;結合PCA(主成分分析)對多維特征量進行降維,以累計貢獻率達到90%及以上的特征值個數選取主成分個數得到融合特征量;最后將融合特征量輸入BP神經網絡系統(tǒng)進行缺陷分類,實現了對缺陷類型的識別。
小波包分解是一種使用小波基為基底信號,將信號f(t)表示為小波函數線性組合的方法。Mallet在多分辨率分析的基礎上提出了正交小波變換分解與重構的快速算法,具體為:信號f(t)的N層小波包分解是將信號以尺度N變換到空間L2=(R)的兩個正交子空間VN與WN上,由VN得到離散近似值cAN,由WN得到離散近似值cDN,下一層以尺度N+1繼續(xù)將cAN分解到子空間VN+1和WN+1,不斷分解下去,進行多分辨率分解[6]。
由于小波包分解不僅能夠對信號分解后的低頻分解系數進行分解,還能夠對信號分解后的高頻系數進行再分解,得到更精確的頻譜成分,提供不同頻段上信號的構成信息。所以不同類型的缺陷信號經小波包分解后, 在各頻帶的能量分布是不同的。針對不同類型的缺陷信號,對不同頻率段的能量分布進行數值量化可以作為表征缺陷信息的特征[8]。
假設對缺陷信號進行7層小波包分解,可以將信號頻率范圍分解成128個頻段。當前N個頻段為信號能量分布的有效頻段時,計算出小波包分解后第7層前N個頻率段中每個頻段的能量值所占第7層前N個頻段總能量的比值,即可得到一個N維矩陣LN=(b1,b2,b3,…,bN)作為信號在頻域內的特征量。
bi=xi/A7
(1)
式中:xi(i=1,2,3,…,N)為小波包分解后第7層中第i個頻段的能量;A7為小波包分解后第7層前N個頻段的總能量值。
為了全面反映缺陷信號中包含的信息,需要提取多個特征值進行分析。但是特征值的數量過多會增加分類測試時的負擔,且會對分析造成影響,所以在多維特征值中找到最能體現出缺陷信號差異的特征值,并將多維特征空間降維到低維特征空間是非常有必要的。
PCA的基本思想是將原數據進行重組[9-10],得到一組新的互不相關且相互獨立的數據,來達到以較少的數據表現原數據特征信息的目的[11-12]。對于一組有N個指標的數據組,進行主成分分析后利用新的組合形式表征原數據組合,在所有的線性組合中選取方差Var(N)最大的組合稱為第一主成分,記為Q1,當主成分Q1不足以表征原數據信息時,選取新的組合形式來補充表征原數據信息,稱為第二主成分Q2,且Q2不應與Q1的信息重合,Q1與Q2滿足COV(Q1,Q2)=0,依次類推直到主成分個數能夠表征原信息特征。PCA分析步驟如下。
(1) 假設有一組樣本記為K,首先對樣本進行標準化處理得到標準化樣本矩陣R。
(2)
式中:i=1,2,…,m;j=1,2,…,n。
(2) 計算標準化樣本的相關系數矩陣B
(3)
(3) 設特征值為λ,則可以計算出相關系數矩陣B的特征方程,由特征方程可以得到m個特征根。
|B-λIm|=0
(4)
根據計算出的特征值λi(i=1,2,3,…,m),可得到單位特征向量P1,P2,P3,…,Pm。
主成分個數,根據主成分累計貢獻率來確定,對各主成分組合確定的數據矩陣及其矩陣的轉置矩陣,求出協(xié)方差矩陣V及其特征值。主成分貢獻率Ai,累計貢獻率Cm可由式(5),(6)確定。
(5)
(6)
式中:p為確定特征值的個數。
當主成分累計貢獻率大于90%時,此處可認為前p個主成分組合包括了原數據的大部分特征信息。對應的P就是前p個主成分[13]。
試件為一塊鋁板,在板表面人為加工3類缺陷:10 mm×5 mm 的長方形裂紋(缺陷1)、直徑為10 mm的孔洞(缺陷2)及直徑為20 mm的孔洞(缺陷3)。試驗裝置由JPR-600C高功率信號發(fā)射接收器、外置信號放大器、電腦、掃查架、數據采集卡、鋁板和空氣耦合超聲探頭組成。其中,空氣耦合超聲探頭中心頻率為400 kHz,晶片尺寸(長×寬)為14 mm×20 mm,采樣頻率設置為5 MHz,采樣數據點為1001個。將空氣耦合超聲發(fā)射探頭與接收探頭的角度設置為8.8°,并采用透射回波檢測方式將探頭在鋁板同側對向放置。
使用JPR-600C信號發(fā)射接收器發(fā)射電壓為180V(峰峰值),周期數為7的矩形脈沖波激勵空氣耦合超聲探頭??諝怦詈铣曁筋^在無缺陷區(qū)域以及3種不同類型的缺陷區(qū)域試驗時,接收到的波形如圖1所示。
圖1 無缺陷區(qū)域接收信號以及3種不同類型的缺陷信號
對比圖1中3種類型的缺陷蘭姆波信號,從時域幅值方面來說無明顯區(qū)別,不足以對缺陷類型進行識別。接下來使用db9小波基對3種缺陷信號進行小波包7層分解,分解后可得到128個頻段,提取第7層中前30個頻段的能量值,并由式(1)計算出每個頻段所占總能量的比值作為缺陷信號在頻域內的特征量,3種缺陷前30個頻段的能量占比分布如圖2所示。
圖2 3種缺陷的能量分布直方圖
從圖2可知,3種缺陷在前30個頻段內的能量分布明顯存在差異,說明頻段能量分布可以作為區(qū)分缺陷類型的特征量。根據對缺陷信號提取的頻段能量占比,每個缺陷信號最終可以得到30個特征量。對此3種缺陷共取150個信號(各缺陷分別取50個)進行同樣的特征量提取,最后可以得到一組150×30的聯(lián)合特征量矩陣。為了提高數據的分析效率以及降低數據信號的冗余度,使用PCA主成分分析方法對聯(lián)合特征量矩陣進行降維處理得到融合特征量。首先根據式(2)將數據標準化預處理,然后根據式(3)~(6)分別得出其相關系數矩陣、特征值、對應的特征向量、特征貢獻率和特征累計貢獻率。最后將其全部特征值按由大到小的順序依次排列,并根據特征累計貢獻率大于90%的特征值個數便可得到特征向量的主分量。缺陷1信號特征量的前5個主成分特征值、貢獻率和累計貢獻率如表1所示。
表1 缺陷1信號特征量的前5個主成分特征值
圖3 3種缺陷的特征值貢獻率
圖4 3種缺陷的特征值累計貢獻率
從圖3所示的特征值貢獻率可知,隨著主成分特征值數量的增加,其特征貢獻率越來越低,這說明各個主成分特征值能夠表征3種缺陷信息的能力越來越低。為了避免信息冗雜,提高信號類型識別率,結合圖4所示的3種缺陷累計貢獻率可知,當特征值的數量達到2個時,其累計貢獻率就已經達到了90%,這說明前2個特征值就已經能夠表征3種缺陷信號的大部分信息。所以選取前2個主成分來組合得到一個150×2的融合特征量矩陣。
針對150組數據進行PCA降維后獲得的特征融合量,以及未經PCA處理的聯(lián)合特征量,分別取缺陷1信號30組,缺陷2信號30組,缺陷3信號30組組成訓練樣本,剩下的60組樣本組成測試樣本。將缺陷1、缺陷2和缺陷3的信號特征融合量進行類型編碼,3種類型的編碼分別為100、010和001。將樣本歸一化后輸入BP神經網絡進行訓練和識別。文章構建的BP神經網絡的具體結構為:輸入層、隱含層及輸出層[2],包括的神經元個數分別為2,10,3。選取函數log-sigmoid作為神經網絡傳遞函數,訓練次數設為1 000次,訓練誤差值為0.01。經過神經網絡訓練后,未經PCA處理的聯(lián)合特征量經過380步訓練達到了性能參數要求,PCA處理后的融合特征量經過97步訓練就已經達到了參數要求,測試結果如表2所示。
表2 3種缺陷的分類結果
從表2可知,提取小波包分解后的頻段能量分布作為識別缺陷信號特征量的方法是可行的,且經過PCA處理后,BP神經網絡對缺陷信號的識別率明顯得到了提高,且測試速度更快。
提取小波包多層分解后的頻段能量作為特征量,結合PCA主成分分析法對特征量進行降維融合,去除冗雜信息,最后輸入BP神經網絡對缺陷進行了分類測試。試驗結果表明,該特征量提取的方法能夠有效地識別出缺陷信號的類型,且經過PCA處理后的特征量的分類測試精度和速度都明顯得到了提高。