別鋒鋒,都騰飛,龐明軍,谷 晟
(江蘇省綠色過程裝備重點實驗室,江蘇 常州 213164)
管道阻塞是一種常見故障狀態(tài),近年來,聲波檢測法被廣泛應(yīng)用于對管道阻塞的判別。但由于傳感器采集的聲信號具有非線性、非平穩(wěn)的特征,同時處理多通道信號往往存在分解尺度不同的問題[1-2]。如何從非線性,非平穩(wěn)的信號中提取故障特征是狀態(tài)識別的關(guān)鍵。對于聲信號中有用信息的提取,國內(nèi)外學(xué)者進(jìn)行了大量的研究分析,提出了很多方法。主要有短時傅里葉變換、小波分析、經(jīng)驗?zāi)B(tài)分解、局部均值分解[3-5]等。1998年Huang[6-7]等提出的經(jīng)驗?zāi)B(tài)分解(EMD,Empirical Mode Decomposition),克服了小波分析小波基的選擇問題,可以根據(jù)信號的特征自適應(yīng)選擇基底來對信號進(jìn)行多分辨率分析,但該方法不足之處在于分解的固有模態(tài)函數(shù)(IMF,Intrinsic Mode Function)會產(chǎn)生模態(tài)混疊的情況。為降低模態(tài)混疊的影響,Wu等[8]又在EMD基礎(chǔ)上提出了集合經(jīng)驗?zāi)B(tài)分解(EEMD,Ensemble Empirical Mode Decomposition),該方法利用加入輔助白噪聲來降低模態(tài)混疊影響。YEH等[9]又對EEMD做了改進(jìn),提出了互補集合經(jīng)驗分解法(CEEMD,Complete Ensemble Empirical Mode Decomposition),采用正、負(fù)成對的形式加入輔助噪聲,通過正、負(fù)抵消重構(gòu)信號中的輔助噪聲,降低模態(tài)混疊影響,并且可以減少加入的噪聲集合次數(shù),提高計算效率。完全集合經(jīng)驗?zāi)B(tài)分解(CEEMDAN,Complete EEMD with Adaptive Noise)算法[10]克服了EEMD算法存在的不足,該方法將自適應(yīng)的白噪聲添加到EEMD算法分解的每一階段,各個模態(tài)函數(shù)分量通過計算唯一的余量信號獲取,使其分解過程既具有完整性,又能抑制噪聲成分。本文采用進(jìn)一步優(yōu)化的分解方法[11]ICEEMDAN(Improved Complete EEMD with Adaptive Noise)。該方法極大地抑制了初始分解過程引起的虛假分量和模態(tài)混疊問題,具有更好的分解結(jié)果。
神經(jīng)網(wǎng)絡(luò)作為一種人工智能的方法,目前已廣泛應(yīng)用于故障診斷領(lǐng)域。通過自組織和自適應(yīng)的學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)可以達(dá)到良好的分類效果。但是神經(jīng)網(wǎng)絡(luò)算法容易造成過擬合的問題,實際訓(xùn)練過程中需要大量的訓(xùn)練樣本。極限學(xué)習(xí)機(jī)(ELM)由于其結(jié)構(gòu)簡單,方便使用,近年來已有很大的應(yīng)用,除了解決了神經(jīng)網(wǎng)絡(luò)易產(chǎn)生過擬合的問題外,ELM只需要設(shè)置隱藏層節(jié)點的數(shù)量、輸入權(quán)重和隱藏元素的偏差,便可獲得全局最優(yōu)解[12]。因此,它在模式識別領(lǐng)域得到了廣泛應(yīng)用和發(fā)展。
本文將ICEEMDAN、聲壓級和ELM算法相結(jié)合來分析和識別堵塞管道的聲信號脈沖響應(yīng)信號。首先,通過ICEEMDAN信號預(yù)處理得到若干個IMF分量。其次,綜合相關(guān)系數(shù)和方差貢獻(xiàn)率作為相關(guān)判據(jù),篩選出表征管道阻塞信息的IMF分量,計算IMF分量的聲壓級構(gòu)造特征向量,然后輸入ELM進(jìn)行分類與識別。
本文第一部分將介紹ICEEMDAN算法、ELM算法以及IMF的選取原則。第二部分將介紹基于ICEEMDAN聲壓級的特征提取方法和基于ELM的模式識別方法。第三部分是實驗分析,第四部分是結(jié)論。
EEMD算法在每次分解的開始階段,都存在一個局部均值和一個IMF分量,而真正模態(tài)分量是混合原信號和噪聲信號的平均模態(tài)分量,其中包含著一些殘余的噪聲。另一方面,在CEEMDAN算法分解過程中使用上一個模態(tài)分量分解后的殘差來計算下一個模態(tài),每一階模態(tài)計算都是連續(xù)的。而Colominas提出的ICEEMDAN算法在此基礎(chǔ)上進(jìn)行了改進(jìn)。
CEEMDAN方法在分解過程中加入的是高斯白噪聲,而ICEEMDAN方法加入的是一種特殊的白噪聲Ek(w(i)),即高斯白噪聲經(jīng)過EMD分解過后的第k個IMF分量,對每個模態(tài)分量計算信號加噪聲的局部均值,并將分解得到的IMF定義為殘差信號與局部均值的差值。ICEEMDAN分解方法大大減少了IMF分量中的殘余噪聲,改進(jìn)了傳統(tǒng)方法在分解重構(gòu)的早期階段容易產(chǎn)生虛假分量和模態(tài)混疊的不足。
定義操作符Ek(·)表示EMD分解后的第k個模態(tài)分量,M(·)表示信號的局部均值。那么E1(x)=x-M(x)。操作符表示取均值,具體的分解過程如下:
第一步:構(gòu)造x(i)=x+α0E1(w(i)),其中,w(i)表示被添加的第i個白噪聲,α0表示噪聲標(biāo)準(zhǔn)差。計算x(i)的局部均值M(x(i)),取均值得到第一個殘差分量
第二步:計算第一模態(tài)分量IMF1值
第三步:計算第二模態(tài)分量IMF2值r2,式中
使用極限學(xué)習(xí)機(jī)ELM對管道聲信號進(jìn)行模式識別。極限學(xué)習(xí)機(jī)ELM是在單隱層前饋網(wǎng)絡(luò)SLFN的基礎(chǔ)上發(fā)展起來的,而單隱層前饋網(wǎng)絡(luò)SLFN是具有一層隱含層的特殊BP神經(jīng)網(wǎng)絡(luò)[13]。ELM的體系結(jié)構(gòu)如圖1所示。
式中:wij和bi是輸入層和隱含層的權(quán)重和閾值,g(x)是隱含層神經(jīng)元的激活函數(shù),文中選用sigmoid函數(shù)。βij是隱含層和輸出層間的權(quán)值,H表示隱含層的輸出矩陣。對輸入層向量首先進(jìn)行一個線性化的計算得到wijxi+bi,然后通過激活函數(shù)g(x)計算出隱含層的輸出矩陣H,H=g(wijxi+bj),再將H乘以隱含層和輸出層間的權(quán)值βij得到輸出向量T。極限學(xué)習(xí)機(jī)在計算過程中具有以下幾個優(yōu)點:
圖1 極限學(xué)習(xí)機(jī)(ELM)結(jié)構(gòu)圖
(1)隱含層和輸入層間的權(quán)值wij和閾值bi是隨機(jī)產(chǎn)生的,并在計算過程中保持不變。
(2)隱含層和輸出層間的連接權(quán)值βij不是通過迭代計算的方式而是通過解方程組的方式一次計算完成的,因此模型的泛化能力較強,求解速度很快。
其中,誤差函數(shù)可由下式得出
上式的解為β^=H+T′。T′是T的轉(zhuǎn)置矩陣,H+是隱含層輸出矩陣的Moore-Penrose廣義逆。
具體的ELM計算步驟如下:
第一步為隨機(jī)產(chǎn)生隱含層和輸入層的連接權(quán)值wij和閾值bi;
第二步為選一個無限可微的激活函數(shù)g(x),本文用的是sigmoid函數(shù);
第三步為計算隱含層的輸出矩陣H,H=g(wijxi+bj);
第四步為求解隱含層和輸出層的連接權(quán)值β^。
信號處理的過程中,相關(guān)性[14]是一個非常重要的概念。通過將分解后的固有模態(tài)函數(shù)與原信號做相關(guān)性分析,尋找出與原信號相關(guān)程度大的部分,從而將信號的虛假分量剔除,提高對處理后的時頻分析信號特征提取的準(zhǔn)確率。相關(guān)系數(shù)的具體計算方式如下:
首先計算原信號和各個IMF分量的自相關(guān)函數(shù),計算公式如下
將自相關(guān)函數(shù)進(jìn)行歸一化,求各個IMF分量的自相關(guān)函數(shù)RIMF1(m)、RIMF2(m)…RIMFn(m)與原信號的自相關(guān)函數(shù)Rx(m)的相關(guān)系數(shù),相關(guān)系數(shù)的定義為
式中:N為信號采樣點數(shù);j代表第j個IMF分量。
因子分析法的統(tǒng)計意義表明,方差貢獻(xiàn)率可以確定因子的相對重要性[15],高的因子方差貢獻(xiàn)率說明該因子與原信號間的相互影響越大。通過計算各個IMF分量和原信號的方差貢獻(xiàn)率,篩選出影響因子較大的分量。對于采樣時間t內(nèi)采集的聲信號(含有k個數(shù)據(jù)點),定義各個IMF分量fi與原始信號的方差貢獻(xiàn)率計算公式如下
相關(guān)系數(shù)和方差貢獻(xiàn)率都是表示兩組信號相關(guān)性的指標(biāo),一般來說當(dāng)指標(biāo)數(shù)值大于0.3時就認(rèn)為有較強的相關(guān)性,IMF分量真實有效,可以予以保留。通過計算相關(guān)系數(shù)和方差貢獻(xiàn)率,綜合考慮選取包含原始信號特征的IMF分量。
聲壓表示聲波通過某種介質(zhì)時,由于振動而產(chǎn)生壓強的改變量。定義聲壓p為聲波在媒介中存在于某點的壓強pf與介質(zhì)在平衡狀靜壓pref的差值
由于某點的實際聲壓p為瞬時聲壓,而有效聲壓的計算公式為[13]
上式中的T表示信號的周期。有效聲壓Pe單位為帕斯卡(Pa),儀器儀表測得的聲壓和我們通常所指的聲壓都是有效聲壓。聲壓級是通過儀表儀器來反映人耳對聲音強弱的主觀判斷,符號為SPL,其定義為
其中:Pe表示有效聲壓,Pref表示參考聲壓,聲壓級的單位是分貝(dB)。
本文提出了一種基于ICEEMDAN分解和聲壓級(SPL)相結(jié)合的信號處理方法。針對管道聲信號的特征處理識別方法流程如下:
(1)對多通道采集的聲脈沖響應(yīng)信號進(jìn)行ICEEMDAN分解,得到多組不同分解尺度的IMF分量;
(2)計算各IMF分量和原信號的相關(guān)系數(shù)xg和方差貢獻(xiàn)率mseb,篩選出含有管道特征信息的主要IMF分量;
(3)計算各IMF分量的聲壓級(S1,S2,S3…)并作為管道聲信號檢測的特征值;
(4)構(gòu)造特征向量T=[S1,S2,S3…] ;
(5)將一部分特征向量用于訓(xùn)練ELM分類器,然后將剩余的測試數(shù)據(jù)輸入到ELM以識別阻塞狀態(tài)。整個流程如圖2所示。
圖2 聲信號的特征提取與模式識別圖
實驗裝置包括4個拾音器、揚聲器、MARC8聲卡、功率放大器和Win MLS測試軟件。如圖3所示,4個拾音器集成在一個電路板上和揚聲器連接在一起。拾音器的靈敏度為1 V/Pa、1 kHz。揚聲器發(fā)出聲信號后被拾音器接收,轉(zhuǎn)換為電信號。
該實驗裝置如圖4所示,聲卡控制揚聲器輸出大小。MARC8聲卡能夠在50 Hz~18000 Hz的頻率范圍內(nèi)發(fā)射聲能,通過揚聲器系統(tǒng)測試軟件WinMLS產(chǎn)生最大長度為14階的偽隨機(jī)序列,拾音器有4個通道接收返回信號。兩者通過采集卡和放大器與計算機(jī)相連。實驗時通過一個螺栓將傳感器固定在管道內(nèi)。
圖3 管道聲信號傳感器裝置圖
圖4 管道聲信號實驗裝置圖
實驗采樣頻率為44100 Hz。管道的材質(zhì)為黏土,長度為15 m,障礙物設(shè)置在距離揚聲器5 m的地方,如圖5所示。
圖5 實驗管道工況設(shè)置示意圖
為模擬實際運行中的管道狀態(tài),一共設(shè)置4種不同的工況。A、B管道模擬管內(nèi)有流體運行情況,A管道在距離揚聲器5 m的地方設(shè)置了障礙物模擬管道阻塞的情形,管道內(nèi)通水。將B管道和A管道作對比,通水但不設(shè)置障礙物。C、D管道模擬管道內(nèi)無流體空載時的情形,C管道在距離揚聲器5 m的地方設(shè)置障礙物模擬管道阻塞,D管道只為空管。當(dāng)管道中存在流體和堵塞情況時,拾音器接受到的返回信號會有變化,通過區(qū)分比較采集的返回信號可以分析和辨別管道的狀態(tài)。
實驗中通過設(shè)置A、B、C、D 4類不同狀態(tài)的管道,采集相關(guān)的原始信號的時域波形如圖6所示。
圖64 類信號時域波形圖
A、C管道內(nèi)有障礙物模擬管道阻塞情況,A、B管中有水,C、D管中無水。從圖6可以看出,4類工況下的脈沖波形表征極為相似,僅從時域圖上很難做出區(qū)分。
基于以上情況,開展對所采集的實驗聲信號特征提取就顯得十分必要,本文提取管道聲信號聲壓級(SPL)進(jìn)行分析。首先對多通道采集的聲信號進(jìn)行ICEEMDAN分解,分解得到11個IMF分量和一個殘差余量,圖7展示了A管道聲信號通過ICEEMDAN分解得到的IMF分量(前8階)。
若對IMF直接進(jìn)行分析,很難得出原信號相關(guān)的有效特征。通過綜合比較相關(guān)系數(shù)和方差貢獻(xiàn)率這兩個參數(shù)可以篩選出IMF中的有效分量。將各個IMF分量的相關(guān)系數(shù)和方差貢獻(xiàn)率繪制成圖8。
圖8反映了各種情況下IMF分量與原信號的相關(guān)系數(shù)和方差貢獻(xiàn)率的關(guān)系,保留數(shù)值大于0.3的IMF分量。相關(guān)系數(shù)分析保留分量IMF4~I(xiàn)MF7。方差貢獻(xiàn)率分量分析中保留分量IMF5~I(xiàn)MF7,綜合考慮選取IMF4~I(xiàn)MF7分量,其余的IMF分量予以剔除。表1展示了4種工況下IMF分量的聲壓級分布。
本文使用極限學(xué)習(xí)機(jī)ELM進(jìn)行故障分類的識別。實驗所采樣的ABCD 4種工況下的聲脈沖信號每類分為12組數(shù)據(jù),共48組數(shù)據(jù)。在4類數(shù)據(jù)中每組分別隨機(jī)選取8組共32組數(shù)據(jù)作為訓(xùn)練樣本,其余16組作為測試樣本。先對隨機(jī)選取的訓(xùn)練樣本數(shù)據(jù)進(jìn)行ICEEMDAN分解,根據(jù)相干系數(shù)和方差貢獻(xiàn)率,篩選出分量IMF4~I(xiàn)MF7,計算各個分類的聲壓級SPL,圖9給出了48組數(shù)據(jù)的IMF分量的聲壓級特征值分布,將4個IMF分量特征值構(gòu)成特征向量T=[S1,S2,S3…] ,歸一化后將特征向量T輸入ELM進(jìn)行訓(xùn)練,對12組測試樣本同樣計算出特征向量進(jìn)行驗證。
圖7 管道聲信號的ICEEMDAN分解
表14 類管道聲信號在IMF4~I(xiàn)MF7分量的聲壓級/dB
訓(xùn)練時,A類管道的信號設(shè)置為1,B類管道的信號設(shè)置為2,C類管道的信號設(shè)置為3,D類管道的信號設(shè)置為4。圖10展示了根據(jù)單次隨機(jī)樣本抽取的測試集識別準(zhǔn)確率,識別率為100%。
為了進(jìn)一步分析ELM的性能,文中隨機(jī)采樣了10次樣本數(shù)據(jù),同時使用BP神經(jīng)網(wǎng)絡(luò)和SVM進(jìn)行對比試驗。表2給出了10次預(yù)測的準(zhǔn)確率和計算時間。
如圖11所示,極限學(xué)習(xí)機(jī)ELM具有較高的預(yù)測準(zhǔn)確率,SVM次之,BP神經(jīng)網(wǎng)絡(luò)的預(yù)測準(zhǔn)確率最差。
圖12給出了3種方法的預(yù)測計算時間,在計算機(jī)性能相同時,BP神經(jīng)網(wǎng)絡(luò)由于要反復(fù)迭代需要較長的計算時間。
SVM由于應(yīng)用核函數(shù),計算時間次之,而ELM由于連接權(quán)值w和隱含層閾值b在訓(xùn)練時是隨機(jī)選擇的,并且在訓(xùn)練過程中可以保持不變,這種方法可以大大減少參數(shù)的計算量,因此在3種方法中具有較快的計算速度,再一次證明了ELM在識別準(zhǔn)確率和計算時間上的優(yōu)越性能。
圖8 各階IMF相關(guān)系數(shù)和方差貢獻(xiàn)率變化趨勢
圖9 4類管道聲信號聲壓級分布
圖10 極限學(xué)習(xí)機(jī)ELM識別圖
表2 基于ELM、SVM、BP的分類結(jié)果
圖11 基于ELM、SVM、BP分類準(zhǔn)確率識別
圖12 基于ELM、SVM、BP分類計算時間
對不同狀態(tài)的管道聲脈沖信號進(jìn)行特征提取與模式識別,具體結(jié)論如下:
(1)基于ICEEMDAN分解的方法由于是基于信號的自適應(yīng)分解,適用于非平穩(wěn)和非線性的管道聲信號的處理。
(2)理論和實驗分析證明,本文所提出的基于相干系數(shù)和方差貢獻(xiàn)率來判斷IMF分量和原信號相關(guān)性,并以聲壓級作為聲信號處理的特征值,從而提取出特征向量的方法切實可行。
(3)給出了一種ELM分類器來對管道阻塞狀態(tài)進(jìn)行模式識別的方法,并通過與BP神經(jīng)網(wǎng)絡(luò)和SVM對比分析,證明了ELM在識別準(zhǔn)確性和耗時方面的良好效果,突出了ELM在模式識別中的優(yōu)勢。