范 磊 殷時(shí)蓉 陳 婕
(重慶交通大學(xué)機(jī)電與車輛工程學(xué)院 重慶 400074)
液壓驅(qū)動(dòng)器具有響應(yīng)速度快、功重比大和柔順性好的特點(diǎn),被廣泛應(yīng)用于外骨骼機(jī)器人柔性關(guān)節(jié)[1]。液壓泵作為外骨骼機(jī)器人柔性關(guān)節(jié)液壓系統(tǒng)的關(guān)鍵工作元件,其工作狀態(tài)關(guān)系整個(gè)液壓系統(tǒng)的穩(wěn)定性。外骨骼機(jī)器人柔性關(guān)節(jié)液壓系統(tǒng)是高度復(fù)雜與非線性的系統(tǒng),液壓回路具有多種故障機(jī)理與失效形式,因此提取故障的有效特征存在難度[2-3]。研究液壓信號(hào)有效特征的提取與高精度故障類別識(shí)別具有重要意義[4]。
液壓信號(hào)通過傳感器采集,是一種典型的機(jī)械振動(dòng)信號(hào),因此液壓類的故障診斷方法與機(jī)械振動(dòng)信號(hào)的信號(hào)處理方法相似[5-6]。其中,經(jīng)典故障診斷的特征提取方法主要從信號(hào)的時(shí)域與頻域兩個(gè)方面進(jìn)行特征提取,然后再進(jìn)行狀態(tài)識(shí)別[7-8]。希爾伯特變換、小波變換和信號(hào)分解等是應(yīng)用于這類問題中最常用的方法[9]。唐宏賓等[10]對(duì)信號(hào)進(jìn)行了經(jīng)驗(yàn)?zāi)J椒纸猓缓笥謱?duì)信號(hào)的包絡(luò)譜進(jìn)行分析,選取計(jì)算得到有效的故障特征,最終實(shí)現(xiàn)了液壓泵狀態(tài)的有效分類。曹斌等[11]先使用小波包對(duì)原始信號(hào)進(jìn)行降噪,然后使用小波包分解并重構(gòu)了降噪后的信號(hào),最后將信號(hào)的頻帶能量作為特征,成功實(shí)現(xiàn)了液壓信號(hào)的分類。韓可等[12]采用了變分模態(tài)分解和支持向量數(shù)據(jù)描述相結(jié)合的識(shí)別評(píng)估方法,完成了軸向柱塞泵故障的分析。王武[13]結(jié)合三層小波包分解與隨機(jī)森林分類器實(shí)現(xiàn)了液壓故障的分類。
梅爾倒譜系數(shù)(MFCC)是一種廣泛運(yùn)用于聲音類信號(hào)特征提取的方法[14],對(duì)低頻信號(hào)具有較好的敏感性,特征魯棒性較好[15]。由于液壓信號(hào)與聲音信號(hào)具有相似性,本文提出將梅爾倒譜系數(shù)作為特征用于外骨骼機(jī)器人柔性關(guān)節(jié)液壓泵的泄漏狀態(tài)識(shí)別。本文提取樣本液壓信號(hào)的12個(gè)梅爾倒譜系數(shù),再組合信號(hào)的12個(gè)時(shí)域特征作為樣本的特征向量,然后采用隨機(jī)森林作為分類器,對(duì)液壓泵泄漏狀態(tài)進(jìn)行識(shí)別,并比較分析了梅爾倒譜系數(shù)結(jié)合隨機(jī)森林分類器與小波特征加希爾伯特-黃特征結(jié)合隨機(jī)森林分類器和支持向量機(jī)的分類識(shí)別效果,以驗(yàn)證方法的有效性。
梅爾倒譜系數(shù)是Davis和Mermelstein在1980年首先提出來的,是對(duì)信號(hào)的一種短時(shí)能量表示。梅爾頻率倒譜系數(shù)的計(jì)算方式主要借鑒于人耳聽覺系統(tǒng)對(duì)聲音的感知方法。在計(jì)算過程中,通過線性余弦變換將信號(hào)的頻譜映射到基于聽覺系統(tǒng)的Mel非線性頻譜中,最后再轉(zhuǎn)換到倒譜上[16]。將普通頻率變換為Mel刻度上的表示的公式為:
(1)
式中,f為信號(hào)頻率,單位為Hz。
設(shè)需要計(jì)算的液壓信號(hào)為S(n),梅爾倒譜系數(shù)的提取過程如圖1所示。
圖1 梅爾倒譜系數(shù)的提取過程Fig.1 The extraction process of Mel cepstrum coefficients
(1)預(yù)加重:為了增強(qiáng)信號(hào)的高頻部分,使得信號(hào)變得平滑,將信號(hào)通過高通濾波器。這樣信號(hào)中高低頻中的所有頻帶就可以使用相似的信噪比來求取頻譜。
(2)分幀:液壓信號(hào)為非平穩(wěn)、非線性信號(hào),具有時(shí)變特性,但在短時(shí)間內(nèi)可以被看做是平穩(wěn)信號(hào)。因此,將原始信號(hào)按N個(gè)采樣點(diǎn)重新分段,形成新的信號(hào)波形單位,稱為幀。同時(shí),為了防止臨近每幀信號(hào)之間變化過大,將相鄰兩幀之間進(jìn)行部分重疊。
(3)漢明窗:將信號(hào)分成一幀一幀的信號(hào)后,幀之間存在不連續(xù)性,于是將信號(hào)的每一幀與漢明窗相乘。乘以漢明窗后的信號(hào)為:
S′(n)=S(n)×W(n), 0≤n≤N-1
(2)
(3)
式中,W(n)為使用的漢明窗。
(4)快速傅里葉變換(FFT):能量的分布反映著信號(hào)的特性,為了得到信號(hào)的能量譜,對(duì)每一幀信號(hào)進(jìn)行快速傅里葉變換。
(4)
式中,N為原始信號(hào)的幀數(shù)。
(5)帶通濾波器:使用一系列均勻重疊在梅爾頻率軸上的三角窗對(duì)能量譜進(jìn)行轉(zhuǎn)換,得到一組系數(shù)。
(6)對(duì)數(shù)能量:對(duì)第五步中的每個(gè)濾波器組進(jìn)行計(jì)算,然后取對(duì)數(shù),所得結(jié)果即為對(duì)數(shù)能量,這樣,就得到不同頻帶的對(duì)數(shù)功率譜。相應(yīng)計(jì)算過程如下:
(5)
式中,s(m)即對(duì)數(shù)能量;Hm(k)為帶通濾波器得到的一組系數(shù);M為濾波器組中濾波器個(gè)數(shù);m=1,2,3,…,M。
(7)離散余弦變換(DCT):對(duì)對(duì)數(shù)能量譜進(jìn)行余弦變換,將頻譜變換到時(shí)域上,就得到梅爾倒譜系數(shù)。計(jì)算過程如下:
(6)
式中,n和m分別是計(jì)算的信號(hào)的幀數(shù)與梅爾倒譜系數(shù)的個(gè)數(shù),0≤n≤N,0≤m≤M。濾波器的個(gè)數(shù)M取12。
最后,由于濾波器個(gè)數(shù)為M,就可以得到12個(gè)梅爾倒譜系數(shù),這12個(gè)系數(shù)就可以作為信號(hào)的12維特征向量用以表征信號(hào)。
為了獲得液壓信號(hào)所包含的更多信息,除了梅爾倒譜系數(shù)特征,本文還計(jì)算了液壓信號(hào)的方差、均值、方根幅值、均方根值和最大值,還包括信號(hào)的標(biāo)準(zhǔn)差、偏斜度和峭度,最后還有信號(hào)的峰值因子、裕度因子、波形因子、脈沖因子一共12個(gè)值,作為液壓信號(hào)的時(shí)域特征來表征信號(hào)[17]。最后將12個(gè)梅爾倒譜系數(shù)特征與12個(gè)時(shí)域特征一共24特征組合,作為表征每條液壓信號(hào)記錄的特征向量。
隨機(jī)森林(RF)是一種將多棵決策樹集成的分類器。其基本原理是LeoBreiman和Adele Cutler提出的隨機(jī)森林算法。如圖2所示,隨機(jī)森林的基本思想就是將多個(gè)弱分類器集成為一個(gè)強(qiáng)的分類器,通過多棵決策樹的平均結(jié)果來產(chǎn)生最終結(jié)果。在一個(gè)由L棵決策樹集成的隨機(jī)森林分類器中,每棵單獨(dú)的決策樹都是一個(gè)分類器,其中弱分類器為每個(gè)決策樹的節(jié)點(diǎn)[18]。每個(gè)決策樹都會(huì)有一個(gè)判別結(jié)果,所有決策樹的分類結(jié)果的平均就是隨機(jī)森林的最終分類結(jié)果。
當(dāng)隨機(jī)森林開始訓(xùn)練時(shí),首先,每個(gè)決策樹都會(huì)從全部樣本中隨機(jī)選擇一個(gè)子樣本集,然后,在每個(gè)節(jié)點(diǎn)上,決策樹都會(huì)選擇一個(gè)分類效果最好的弱分類器,最后,將所有的弱分類器組合成為最終的分類器[19]。
假設(shè)一個(gè)K類的分類任務(wù),每個(gè)樣本p在經(jīng)過每個(gè)決策樹分類器后,會(huì)輸出K個(gè)置信度作為輸出值。其中每個(gè)置信度分別表示該樣本判別為某一類樣本的概率[20]。最后,從所有決策樹判別的平均結(jié)果中可以得到整個(gè)隨機(jī)森林分類器的判別結(jié)果。表達(dá)式如下:
(7)
式中,p(n,p)(f(p)=c)表示樣本p判別屬于c類的概率。
圖2 隨機(jī)森林示意圖Fig.2 Diagram of random forest
本文所使用數(shù)據(jù)取自機(jī)器學(xué)習(xí)數(shù)據(jù)庫(kù)平臺(tái)(UCI Machine Learning Repository)2018年公布的液壓監(jiān)測(cè)數(shù)據(jù)集。該數(shù)據(jù)集是在周期性的負(fù)載試驗(yàn)臺(tái)上測(cè)量獲得,該試驗(yàn)臺(tái)由一級(jí)工作和二級(jí)冷卻-過濾回路組成(如圖3所示),試驗(yàn)臺(tái)的負(fù)載循環(huán)周期為60 s。本文所使用的每個(gè)樣本數(shù)據(jù)有3個(gè)通道,這3個(gè)通道是來自壓力傳感器PS1,PS2,PS3的壓力信號(hào),壓力傳感器的采樣周期為試驗(yàn)臺(tái)的一個(gè)60 s 的負(fù)載周期,采樣頻率為1 000 Hz,數(shù)據(jù)長(zhǎng)度為6 000個(gè)數(shù)據(jù)點(diǎn)。該數(shù)據(jù)集包含液壓泵無泄漏、微弱泄漏、嚴(yán)重泄漏3種狀態(tài)的樣本數(shù)據(jù),本文選取每種狀態(tài)下的450個(gè)樣本數(shù)據(jù)。
圖3 液壓系統(tǒng)圖Fig.3 Hydraulic system diagram
本文數(shù)據(jù)處理的具體步驟如下:
(1)提取每個(gè)樣本的MFCC特征12個(gè)與時(shí)域特征12個(gè),組合成為液壓信號(hào)的特征向量。因選擇了3個(gè)通道的壓力信號(hào),所以最后每個(gè)樣本將會(huì)用1×72的特征向量表示。
(2)每類泄漏狀態(tài)各有450個(gè)樣本,隨機(jī)選擇每類狀態(tài)的250個(gè)樣本作為訓(xùn)練集,200個(gè)樣本作為測(cè)試集,最后組成訓(xùn)練集樣本量為750個(gè),測(cè)試集樣本量為600個(gè)。
(3)建立訓(xùn)練集與測(cè)試集對(duì)應(yīng)標(biāo)簽,具體見表1。
(4)設(shè)置隨機(jī)森林分類器樹數(shù)目為500,使用訓(xùn)練集訓(xùn)練分類器。最后使用訓(xùn)練好的模型與測(cè)試集進(jìn)行預(yù)測(cè)。
表1 液壓泵樣本數(shù)據(jù)Table 1 Sample data of hydraulic pump
表2為梅爾倒譜系數(shù)結(jié)合隨機(jī)森林的最終識(shí)別結(jié)果。由表2可知,液壓泵狀態(tài)識(shí)別的綜合識(shí)別率達(dá)到了99.3%,無泄漏、弱微泄漏與嚴(yán)重泄漏3種狀態(tài)的正確識(shí)別數(shù)量分別為199,197,200,識(shí)別率分別為99.5%,98.5%與100%。無泄漏、弱微泄漏和嚴(yán)重泄漏3種狀態(tài)識(shí)別錯(cuò)誤的樣本數(shù)分別為1,3,0個(gè)。因此可以得出,本文提出的方法能夠有效識(shí)別出液壓泵3種不同的泄漏狀態(tài)。
表2 梅爾倒譜系數(shù)結(jié)合隨機(jī)森林的識(shí)別結(jié)果Table 2 Recognition results of random forest combined with Mel cepstrum coefficient
為了說明梅爾倒譜系數(shù)在液壓泵泄漏狀態(tài)識(shí)別中的有效性,將小波特征加希爾伯特-黃特征與梅爾倒譜系數(shù)進(jìn)行對(duì)比。采用希爾伯特-黃變換得到2個(gè)特征,再采用小波分解得到6個(gè)特征,融合這8個(gè)特征作為液壓信號(hào)的特征,使用隨機(jī)森林作為分類器進(jìn)行對(duì)比實(shí)驗(yàn)。表3為小波分解、希爾伯特-黃變換結(jié)合隨機(jī)森林的識(shí)別結(jié)果。由表3可以看出,小波分解、希爾伯特-黃變換結(jié)合隨機(jī)森林的識(shí)別率為94.0%,低于梅爾倒譜系數(shù)結(jié)合隨機(jī)森林的識(shí)別率(99.3%),說明梅爾倒譜系數(shù)在液壓泵泄漏狀態(tài)識(shí)別中具有更佳的特征提取效果。
表3 小波分解、希爾伯特-黃變換結(jié)合隨機(jī)森林的識(shí)別結(jié)果Table 3 Recognition results of random forest combined with wavelet decomposition, Hilbert-Huang transform
本文進(jìn)一步采用對(duì)比實(shí)驗(yàn)對(duì)提出的隨機(jī)森林與MFCC加時(shí)域組合特征的液壓泵泄漏狀態(tài)識(shí)別方法進(jìn)行驗(yàn)證。對(duì)比模型分別使用隨機(jī)森林與支持向量機(jī),使用相同的訓(xùn)練集與測(cè)試集分別進(jìn)行10次獨(dú)立重復(fù)實(shí)驗(yàn)。圖4為對(duì)比實(shí)驗(yàn)分類識(shí)別率結(jié)果。從圖4可以看出,對(duì)于使用MFCC加時(shí)域組合特征的液壓泵泄漏狀態(tài)的識(shí)別,隨機(jī)森林(RF)具有較好的識(shí)別效果,識(shí)別率穩(wěn)定在99%左右,最高達(dá)到99.3%;支持向量機(jī)的識(shí)別效果相對(duì)較差,識(shí)別率在95%左右,并且具有較大的波動(dòng)性。通過對(duì)比實(shí)驗(yàn),可以確定,隨機(jī)森林在本文的識(shí)別任務(wù)中具有更好的識(shí)別率。
圖4 實(shí)驗(yàn)結(jié)果對(duì)比Fig. 4 Comparison of experimental results
本研究提出了基于梅爾倒譜系數(shù)(MFCC)與時(shí)域組合特征和隨機(jī)森林分類器相結(jié)合的外骨骼機(jī)器人柔性關(guān)節(jié)液壓泵泄漏狀態(tài)識(shí)別方法。將梅爾倒譜系數(shù)特征引入液壓泵狀態(tài)的識(shí)別中,結(jié)合液壓信號(hào)的時(shí)域特征,有效地完成了液壓泵泄漏狀態(tài)的分類識(shí)別。
本文的研究也證明了梅爾倒譜系數(shù)在機(jī)械振動(dòng)信號(hào)的故障診斷的應(yīng)用的可能性。未來,可繼續(xù)探究梅爾倒譜系數(shù)特征在其他振動(dòng)信號(hào)故障診斷中的應(yīng)用,為其他類信號(hào)的故障診斷提供更多的解決方法。