李 睿,張 純,萬 樂,閆小青
(南昌大學 建筑工程學院, 南昌 330031)
聲發(fā)射是指材料局部因能量的快速釋放而發(fā) 出瞬態(tài)彈性波的現(xiàn)象。聲發(fā)射信號的檢測、分類與分析有助于揭示結(jié)構(gòu)內(nèi)部損傷演化規(guī)律及破壞類型,在復合材料損傷檢測、機械故障診斷等領域得到了廣泛應用[1-2]。
特征參數(shù)分析和全波形分析是聲發(fā)射信號處理的兩種主要手段[3]。特征參數(shù)法是從各聲發(fā)射信號的波形出發(fā),人為設定并提取反映波形主要特征的參數(shù)用于信號診斷分析[4-5]。常見的特征參數(shù)有持續(xù)時間、上升時間、能量、幅值等。波形分析方法則是對聲發(fā)射信號原始波形進行時頻分析[6],直接利用時頻特征或結(jié)合主成分分析、支持向量機[7]等技術(shù),研究聲發(fā)射信號與損傷類型之間的關系。信號處理時,兩種方法提取的信號特征都是人為預先設定的,但對于實際的結(jié)構(gòu)或材料,其聲發(fā)射信號復雜多樣,受材料性能、結(jié)構(gòu)形式、加載方式等多種因素影響;因此,人為預先設定的信號特征參數(shù)并不一定對材料損傷類型或模式敏感,不適當?shù)剡x用特征反而會導致聲發(fā)射信號的聚類分析效果不佳。
對于不同的聲發(fā)射信號,信號特征的自適應提取以及聚類分析對解釋AE(聲發(fā)射)信號,進行模式識別意義重大。目前,以卷積神經(jīng)網(wǎng)絡(CNN)等為代表的深度學習技術(shù)是發(fā)展最為迅速的信號特征自動提取方法,其通過對圖像、信號等數(shù)據(jù)的直接學習,能實現(xiàn)從具體到抽象等多個層次數(shù)據(jù)特征的自動提取[8]。在聲發(fā)射信號的相關研究中,BARAT等[9]、ISLAM等[10]都利用CNN自動提取了聲發(fā)射信號時頻圖的特征,來識別不同缺陷對應的聲發(fā)射信號。NASIRI等[11]同樣采用CNN提取原始聲發(fā)射信號的特征,用于監(jiān)測SiCf-SiCm復合材料管損傷過程的3個階段。這些基于深度神經(jīng)網(wǎng)絡的聲發(fā)射模式識別工作均屬于有監(jiān)督學習,即需要人為去設定用于訓練的聲發(fā)射信號標簽(信號對應何種損傷類別或階段)。人工逐一分析聲發(fā)射數(shù)據(jù)并設定信號標簽的工作量極大,在實際工程中是難以做到的。引入無監(jiān)督學習方法,提出了使用深度自動編碼器提取聲發(fā)射信號特征,并結(jié)合K均值聚類進行聲發(fā)射信號準確分類的方法。在無先驗知識的情況下,2種不同類型聲發(fā)射信號的分類識別試驗驗證了所提方法的有效性與可靠性。
深度自動編碼器是一種無監(jiān)督學習的非線性特征提取模型,可實現(xiàn)對無標簽復雜高維輸入數(shù)據(jù)不同層次分布特征的自動提取。其神經(jīng)網(wǎng)絡結(jié)構(gòu)具有對稱性,包括編碼器和解碼器2個部分(見圖1)。編碼器利用卷積、池化和激活等操作,對原始輸入數(shù)據(jù)進行壓縮降維;解碼器則利用反卷積、反池化等操作,對降維后的特征進行原始數(shù)據(jù)重建,并利用反向傳播算法來訓練網(wǎng)絡,使得網(wǎng)絡輸出盡量逼近網(wǎng)絡輸入。因此,深度自動編碼器在學習過程中無需人為設定樣本標簽。學習完成后,最少神經(jīng)元層的編碼結(jié)果即可代表原數(shù)據(jù)最佳的低維特征值,可進一步用于信號聚類分析。
圖1 卷積自編碼器結(jié)構(gòu)示意
對于聲發(fā)射波形信號,文章采用了一維卷積層[12]對原始信號進行直接處理,而未利用時頻變換將原始信號轉(zhuǎn)變?yōu)槎S圖像處理,減少了信號處理的工作量。輸入的聲發(fā)射信號在經(jīng)過多個一維卷積和池化處理后,會得到多個通道的中間層(最少神經(jīng)元層)數(shù)據(jù);將中間層每一個通道的數(shù)據(jù)通過平均池化(取均值)壓縮為一個實數(shù),這個實數(shù)在某種程度上具有全局的感受野;再按照通道順序?qū)⑦@些實數(shù)進行組合即可得到信號的通道維度特征。
在解決聲發(fā)射信號模式識別的問題時,選取信號特征參數(shù)進行聚類分析是一種常見的做法[13-14]。由于聲發(fā)射信號特征參數(shù)類型和個數(shù)的選擇將直接影響聚類結(jié)果的好壞,所以為避免人為特征選擇的困難,文章基于深度卷積自編碼器自動提取的信號通道維度特征,結(jié)合K均值聚類算法對聲發(fā)射信號進行聚類分析。
K均值聚類算法使用歐式距離衡量數(shù)據(jù)點的相似度,通過反復迭代,每個數(shù)據(jù)點和距離其最近的類簇之間的距離平方最小[15]。利用K均值聚類算法處理自編碼器自動提取的特征,并完成聲發(fā)射信號聚類分析的流程如圖2所示。
圖2 聲發(fā)射信號識別流程圖
試驗采用的聲發(fā)射檢測儀器為PCI-2型聲發(fā)射儀,選用了2個中心頻率為150 kHz的R15型諧振式傳感器。將2個傳感器分別用黑色膠帶固定在玻璃纖維復合材料板試件兩端,并在探頭與試件的接觸部位涂凡士林耦合劑,以防止聲發(fā)射信號在傳感器和試件界面處過度散射和衰減。處理系統(tǒng)選用AEwin軟件,前置放大增益為40 dB、信號門檻值為30 dB、系統(tǒng)采樣頻率為1 MHz。用直徑為0.5 mm的鉛芯在玻璃纖維復合材料板上摩擦和突然斷裂生成2類聲發(fā)射信號,用于模擬不同損傷模式下的聲發(fā)射現(xiàn)象。為方便結(jié)果驗證,在整個試驗過程中,始終保持鉛芯與試件的摩擦,并隨機、間斷地進行100次斷鉛試驗。
整個試驗過程中共記錄了3 860個聲發(fā)射信號,其中包含斷鉛信號200個(2個傳感器均會接收到斷鉛信號)、摩擦信號3 660個;但具體聲發(fā)射信號類別未知。部分聲發(fā)射信號波形如圖3所示(信號類別均由后期的人工分析得到),每個聲發(fā)射信號波形均包括1 024個采樣點。
深度卷積自編碼器模型的網(wǎng)絡結(jié)構(gòu)參數(shù)如表1所示(表中各參數(shù)均無量綱)。該模型編碼器部分共有6層卷積層與池化層,解碼器部分與其對等。在編碼器部分,各層卷積核大小均設為3。模型的輸入和輸出均直接采用原始聲發(fā)射信號(3 860個波形數(shù)據(jù)),損失函數(shù)采用均方誤差,激活函數(shù)為ReLU(修正線性單元),初始學習率設置為0.001,共進行5 000批次的迭代訓練,訓練時保存最優(yōu)模型作為最終的深度自編碼器。
圖4 卷積自編碼器可視化聚類結(jié)果在時間上的分布
將所有聲發(fā)射信號輸入一維卷積深度自編碼器訓練后,再利用自編碼器自動提取的信號特征進行聚類的結(jié)果如圖4所示(圖中特征1,特征2數(shù)值均為自編碼器輸出值,無量綱)。文章提出的聲發(fā)射信號聚類分析算法將所有聲發(fā)射信號劃分為2類,其中類別1包含3 660個聲發(fā)射信號,類別2包含200個聲發(fā)射信號。進一步觀察類別2中信號的波形特征以及2個傳感器中信號出現(xiàn)的時間(斷鉛信號會被2個傳感器接收到),可以獲知類別2即為斷鉛信號集。聚類結(jié)果的輪廓系數(shù)在0.85以上,可視化圖像也顯示出了2類信號被清晰地分割,表明文章提出的方法能在無先驗知識的情況下,通過無監(jiān)督學習,準確實現(xiàn)了聲發(fā)射信號的類型識別。
分類后的聲發(fā)射信號傳統(tǒng)特征參數(shù)值在試驗時間上的分布如圖5所示。在常見的特征參數(shù)中,類別2的聲發(fā)射信號(斷鉛信號)具有較低的上升時間、持續(xù)時間和計數(shù),但和類別1(摩擦信號)的信號有重疊;區(qū)分度最大的特征參數(shù)是能量與幅值,而峰頻則無法用于區(qū)分不同信號的類別。
圖5 聚類結(jié)果的傳統(tǒng)聲發(fā)射特征參數(shù)在時間上的分布
進一步比較基于傳統(tǒng)特征參數(shù)的聚類方法和提出的方法在信號分類上的性能。試驗測得的聲發(fā)射信號部分特征參數(shù)如表2所示。由于可以采用不同的特征參數(shù)組合作為聚類變量,所以根據(jù)已有研究[16-18]分別選取表3中(PA為幅值,D為持續(xù)時間,RT為上升時間,E為能量,C為振鈴計數(shù),PF為峰值頻率)的3種特征參數(shù)組合,同時考慮3.1節(jié)的計算結(jié)果,補充選取區(qū)分度最高的兩個特征參數(shù)(能量和幅值)作為聚類特征組合。傳統(tǒng)聲發(fā)射信號特征參數(shù)在量綱上存在很大的差異,因此在聚類分析前利用平均數(shù)方差標準化消除量綱對分類結(jié)果的影響,相應的計算公式為
(1)
表2 聲發(fā)射信號特征參數(shù)
表3 聲發(fā)射信號特征參數(shù)聚類結(jié)果
將聚類特征參數(shù)標準化處理后,再統(tǒng)一使用K均值算法對試驗信號進行類別判斷,識別結(jié)果如表4所示。為方便比較,圖6給出了不同特征參數(shù)組合的聚類結(jié)果在能量與幅值上的分布關系。
圖6 不同特征參數(shù)組合的聚類結(jié)果在能量與幅值上的分布關系
表4 不同自編碼器聚類結(jié)果
聚類結(jié)果表明,不同特征參數(shù)的組合會不同的聚類效果。組合4中,特征參數(shù)幅值和能量是經(jīng)過人工分析選擇出的最具區(qū)分度的聚類指標;因此,僅用兩個指標聚類就能達到很高的分類準確率(只出現(xiàn)1例斷鉛信號誤判)。組合1在組合4的基礎上增加了振鈴計數(shù)和持續(xù)時間2個特征參數(shù),但分類效果反而降低了,斷鉛信號出現(xiàn)了26例誤判。組合2選擇的5個特征參數(shù)能完全正確地進行聲發(fā)射信號分類;組合3在組合2的基礎上僅增加了振鈴計數(shù),但分類準確率顯著降低。從由圖6(c)可知,基于組合3特征參數(shù)的聚類算法將斷鉛信號中的一個子集識別為一類,而將其他斷鉛信號與摩擦信號混為另一類。由此可見,不是所有的特征參數(shù)都利于信號聚類,不合適的特征參數(shù)類型與個數(shù)選擇反而會降低聲發(fā)射信號的聚類分析效果;所以,基于特征參數(shù)的信號聚類與識別方法仍然需要大量的人為分析和計算驗證。
與基于人工選擇特征參數(shù)的聚類算法相比,表3和圖6(e)所示結(jié)果都表明,文章所提算法無需考慮特征參數(shù)類型和數(shù)目的選擇,依賴于深度自編碼器的自動特征提取功能,可實現(xiàn)聲發(fā)射信號自動化的準確聚類。
在處理聲發(fā)射信號的一維卷積神經(jīng)網(wǎng)絡中,卷積核的大小是一個很重要的網(wǎng)絡結(jié)構(gòu)參數(shù)。自編碼器特征提取層的每一個元素所對應的輸入數(shù)據(jù)時間段(即感受野)大小是由卷積核的尺寸和網(wǎng)絡層數(shù)決定的。卷積核大小會直接影響深度自編碼器對聲發(fā)射信號特征的提取。卷積核尺寸越大,提取特征對應的原始聲發(fā)射信號時間段也就越長,其效果相當于忽略更多的細節(jié)、提取更抽象的信號特征。
為了進一步研究深度卷積自編碼器結(jié)構(gòu)對聲發(fā)射信號識別的影響,保持表1所示的深度自編碼器網(wǎng)絡基本結(jié)構(gòu)不變,設置了5種自編碼器,其第一層卷積核的大小分別為64,32,16,8,3,解碼器的最后一個反卷積層也相應改變。聲發(fā)射信號聚類分析的結(jié)果如表4所示。當深度自編碼器第一層卷積核尺寸逐步減小時,信號類別診斷的準確率以及類別的可分性(輪廓系數(shù))整體上呈現(xiàn)不斷提高的趨勢;而且當?shù)谝粚泳矸e核小于16后,信號類別檢測的準確性就能達到接近完全正確的程度。第一層卷積核的大小會直接改變中間層數(shù)據(jù)的感受野大小。第一層卷積核為64時,中間層每個數(shù)據(jù)對應的感受野大小為524,即相當于原波形信號中524個時間點的數(shù)據(jù)被壓縮到一個值。顯然,使用小的第一層卷積核可以保留更多的信號細節(jié)特征。計算表明,使用較小的第一層卷積核對聲發(fā)射信號的分類是有利的。
(1) 在眾多人為設定的聲發(fā)射信號特征參數(shù)中,不是所有特征參數(shù)都有利于信號的模式識別與類別檢測。在該試驗中,僅能量和幅值對斷鉛、摩擦聲源具有較高的檢測靈敏度。因此,需要人工對聲發(fā)射信號特征進行分析,選取合適的特征類型與個數(shù)。
(2) 利用無監(jiān)督的深度學習方法能夠很好地克服參數(shù)分析、波形分析中存在的特征有效性不足以及需要人工干預的問題。利用自編碼器進行聲發(fā)射信號特征自動提取,再結(jié)合K均值算法能夠有效地區(qū)別不同聲源的聲發(fā)射信號,特別是在聲發(fā)射信號事件較多且無法獲得標簽的時候具有明顯的優(yōu)勢。
(3) 深度自編碼器具備很強的特征學習能力,可從原始聲發(fā)射波形信號中自適應提取有效特征用于聚類分析;而且使用較小的第一層卷積核尺寸,可以保留更多信號的細節(jié)特征,有利于聲發(fā)射信號的識別與分類。