靳震震,賀德強(qiáng),苗 劍,徐偉倡
(1. 廣西大學(xué) 機(jī)械工程學(xué)院,廣西 南寧 530004;2. 南寧中車軌道交通裝備有限公司,廣西 南寧 530000)
隨著軌道交通行業(yè)的不斷發(fā)展及列車運(yùn)行速度的不斷提高,鐵路的運(yùn)載量在不斷增大,給列車安全運(yùn)行帶來嚴(yán)峻的挑戰(zhàn)。列車轉(zhuǎn)向架長期在重載工況下持續(xù)運(yùn)轉(zhuǎn),且運(yùn)行環(huán)境不斷變化,增加了軸承故障發(fā)生的概率[1]。及時掌握軸承運(yùn)轉(zhuǎn)狀態(tài)、有效進(jìn)行軸承故障診斷,這對保障列車安全健康運(yùn)行具有重要意義?;谡駝有盘栠M(jìn)行分析是目前軸承故障診斷常用的方法[2],現(xiàn)有使用技術(shù)中,時域和頻域信號分析方法雖然能夠進(jìn)行故障診斷,但是時域信號分析方法不能夠準(zhǔn)確判斷出哪個元件出現(xiàn)故障;而頻域信號分析方法不能體現(xiàn)故障發(fā)生的時刻。此外,軌道激擾、運(yùn)行速度不確定以及軌道接縫的沖擊振動等因素使轉(zhuǎn)向架軸承的振動信號呈現(xiàn)非線性和非平穩(wěn)性,導(dǎo)致轉(zhuǎn)向架軸承的故障特征難以被提取,故障診斷的準(zhǔn)確率低下。
信息熵是一種用來評估信號復(fù)雜程度的指標(biāo)。通過信息熵,可以量化振動信號;借助其包含的復(fù)雜信息,能夠達(dá)到特征提取的目的[3]。樣本熵和排列熵作為信息熵的兩種形式,已被作為提取特征的主要方式,應(yīng)用于列車軸承故障診斷領(lǐng)域。文獻(xiàn)[4]中,樣本熵被用于有效地提取隱藏在轉(zhuǎn)向架振動信號中的故障特征;文獻(xiàn)[5]利用排列熵提取了列車滾動軸承振動信號中的故障特征。但是,樣本熵和排列熵作為單一尺度的分析方法,并不能完全反應(yīng)信息的復(fù)雜程度;而多尺度樣本熵反映了信號在不同尺度下的復(fù)雜程度,相比于樣本熵和排列熵,其在特征提取方面具有較大的優(yōu)勢。
極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)[6]是一種單層前饋神經(jīng)網(wǎng)絡(luò),不需要對隱含層參數(shù)進(jìn)行反復(fù)調(diào)整,相比傳統(tǒng)的模式識別算法,其具有速度快和泛化性好的優(yōu)勢,已被作為模式識別算法應(yīng)用于故障診斷領(lǐng)域。文獻(xiàn)[7]將ELM作為齒輪故障模式識別方法,通過實驗驗證了方法的有效性。文獻(xiàn)[8]將得到的特征向量輸入到ELM以識別柱塞泵故障模式,實驗結(jié)果表明,ELM相比支持向量機(jī)在分類速度和精度上的優(yōu)勢更加明顯。但ELM也存在一定的局限性,其分類精度與輸入的權(quán)值、隱含層節(jié)點閾值密切相關(guān)。粒子群優(yōu)化算法(particle swarm optimization,PSO)是一種應(yīng)用較為廣泛的算法,具有精度高、收斂速度快的優(yōu)點,在解決優(yōu)化問題方面具有一定優(yōu)勢。因此,本文將粒子群算法與ELM相結(jié)合,利用PSO算法解決ELM參數(shù)設(shè)置問題。
基于上述分析,針對列車轉(zhuǎn)向架軸承故障診斷率低的問題,本文提出一種基于多尺度樣本熵改進(jìn)ELM的列車轉(zhuǎn)向架軸承故障診斷方法,實驗結(jié)果表明,本文提出的方法能夠有效提取故障特征信息,準(zhǔn)確實現(xiàn)軸承故障模式的識別。
樣本熵確定的是單一尺度熵信號的復(fù)雜程度,熵值越大,信號越復(fù)雜。多尺度樣本熵是通過粗?;^程獲得的,其計算步驟如下:
式中:j——粗?;蛄虚L度;s——尺度因子,s=1, 2,…,[K/s] 。其中,[K/s]表示K/s取整。
極限學(xué)習(xí)機(jī)是一種性能優(yōu)良的神經(jīng)網(wǎng)絡(luò)算法,其可以隨機(jī)初始化輸入權(quán)值和隱含層閾值,利用廣義逆矩陣?yán)碚搩H通過一步計算即可得到相應(yīng)的網(wǎng)絡(luò)輸出權(quán)值。設(shè)ELM網(wǎng)絡(luò)有m個輸入神經(jīng)元、L個隱含層神經(jīng)元和n個輸出層神經(jīng)元,其網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 ELM結(jié)構(gòu)圖Fig.1 ELM structure diagram
假定有N個訓(xùn)練樣本集(xi,yi), 1≤i≤N,其中,xi∈Rm,yi∈Rn。圖1中,輸入層的m個神經(jīng)元與輸出層的n個神經(jīng)元分別對應(yīng)m個輸入變量和n個輸出變量,則網(wǎng)絡(luò)輸出可表示為
式中:wj——輸入權(quán)值向量;bj——隱含層節(jié)點閾值;βj——輸出權(quán)值向量;G(x)——激活函數(shù);oi——網(wǎng)絡(luò)輸出值。
雖然ELM具有較好的分類精度,但其性能受到輸入的權(quán)值和隱含層閾值的影響。為解決ELM存在的問題,將PSO算法與ELM相結(jié)合,利用PSO算法對ELM參數(shù)進(jìn)行優(yōu)化,將ELM的輸入權(quán)值ω和隱含層節(jié)點閾值b作為PSO算法中的粒子群,并將訓(xùn)練樣本的方均根誤差作為粒子群的適應(yīng)度值,以方均根最小為優(yōu)化目標(biāo)進(jìn)行ELM參數(shù)優(yōu)化,具體過程如圖2所示。
圖2 PSO-ELM流程Fig.2 PSO-ELM process
軸承故障診斷過程主要包括數(shù)據(jù)采集、特征提取和模式識別3個部分。首先,采集軸承的振動信號;然后,利用多尺度樣本熵進(jìn)行特征提取,并將提取的特征劃分為測試集和訓(xùn)練集;最后,利用改進(jìn)的ELM進(jìn)行故障模式識別。
實驗數(shù)據(jù)來源于美國凱斯西儲大學(xué)實驗平臺采集的數(shù)據(jù)。該實驗平臺結(jié)構(gòu)如圖3所示,設(shè)備包括電機(jī)、轉(zhuǎn)矩傳感器和電子控制設(shè)備等,試驗軸承型號為SKF62。
圖3 數(shù)據(jù)采集試驗臺Fig.3 Experimental data acquisition platform
本文采用的數(shù)據(jù)為采樣頻率12 kHz下驅(qū)動端軸承故障數(shù)據(jù),涉及正常、內(nèi)圈故障、外圈故障和滾動體故障4種狀態(tài),每種狀態(tài)采集50個樣本,每個樣本點數(shù)為2 048個數(shù)據(jù)點,原始信號的時域波形如圖4所示。從圖中可以看出,內(nèi)圈和外圈信號出現(xiàn)了顯著的沖擊,滾動體故障沖擊不明顯,無法通過時域信號準(zhǔn)確地判斷出哪個部件出現(xiàn)了故障。
圖4 原始振動信號時域波形圖Fig.4 Time-domain waveforms of original vibration signal
利用多尺度樣本熵提取軸承4種狀態(tài)下的特征信息,設(shè)置多尺度樣本熵的參數(shù)相似容限r(nóng)=0.5 std(data),其中std(data)為樣本數(shù)據(jù)的標(biāo)準(zhǔn)差。尺度因子s過大,會影響診斷效率;過小,則無法完全表征特征信息。為確定尺度因子的值,本文首先設(shè)置s=20。當(dāng)尺度因子取20時,分別計算4種狀態(tài)的多尺度樣本熵值,結(jié)果如圖5所示??梢钥闯?,在尺度因子為9~20時,多尺度樣本熵值下降平緩,變化范圍不超過0.05,信號之間的復(fù)雜程度差異較小。為更好地表征特征信息,本文選擇尺度因子為8時的多尺度熵值。
圖5 4種狀態(tài)的多尺度樣本熵值Fig.5 Multi-scale sample entropy values of four states
模式識別的本質(zhì)是分類問題,本文采用改進(jìn)的極限學(xué)習(xí)機(jī)作為模式識別算法。首先,將200組樣本數(shù)據(jù)打亂,隨機(jī)選擇其中的150組作為訓(xùn)練樣本,剩余的數(shù)據(jù)作為測試樣本。然后,利用PSO算法對極限學(xué)習(xí)機(jī)參數(shù)進(jìn)行優(yōu)化,設(shè)置種群規(guī)模為30,最大速度為0.2,慣性因子起始值為0.8,慣性因子終止值為0.1,種群迭代次數(shù)為100,學(xué)習(xí)因子C1為2.4,學(xué)習(xí)因子C2為1.6,尋優(yōu)結(jié)果如圖6所示。
圖6 尋優(yōu)迭代圖Fig.6 Diagram of optimization iteration
從圖6中可以看出,在第8代時算法達(dá)到最優(yōu),此時適應(yīng)度值為0.42,說明PSO算法在優(yōu)化ELM參數(shù)方面具有精度高和尋優(yōu)速度快的優(yōu)勢,適合用于ELM參數(shù)優(yōu)化。此時對應(yīng)的測試集準(zhǔn)確率為96%,混淆矩陣如圖7所示。
圖7 混淆矩陣Fig.7 Confusion matrix
圖 7 中 1, 2, 3, 4 分別對應(yīng)軸承的外圈故障狀態(tài)、內(nèi)圈故障狀態(tài)、滾動體故障狀態(tài)、正常狀態(tài)??梢钥闯觯疚乃岱椒▽ν馊收蠣顟B(tài)和正常狀態(tài)的識別率為100%,內(nèi)圈故障狀態(tài)和滾動體故障狀態(tài)的識別率分別為90.9%和92.3%。通過圖5可知,內(nèi)圈故障和滾動體故障的振動信號在平穩(wěn)和沖擊時均存在一定的相似性,表明這兩種狀態(tài)的特征存在一定的相似性,因此導(dǎo)致故障模式識別過程出現(xiàn)誤判。但是總的來說,測試集的準(zhǔn)確率達(dá)到了96%,說明本文提出的方法在一定程度上能夠有效地進(jìn)行故障模式識別,同時驗證了多尺度樣本熵在軸承特征提取方面的可行性。
為進(jìn)一步驗證本文提出方法的有效性,采用未優(yōu)化的極限學(xué)習(xí)和支持向量機(jī)進(jìn)行對比,并采用樣本熵作為特征提取方法進(jìn)行對比,故障診斷準(zhǔn)確率如表1所示。
表1 故障診斷方法對比Tab. 1 Comparison among fault diagnosis methods
由表1可以看出,采用未優(yōu)化的極限學(xué)習(xí)機(jī)進(jìn)行模式識別時準(zhǔn)確率為92%,高于支持向量機(jī)作為模式識別算法的(90%),但低于本文提出的改進(jìn)極限學(xué)習(xí)機(jī)方法的。識別準(zhǔn)確率表明極限學(xué)習(xí)機(jī)在模式識別方面具有一定的優(yōu)越性,同時驗證了本文提出方法的有效性。采用樣本熵進(jìn)行特征提取,將提取的特征向量輸入到改進(jìn)的極限學(xué)習(xí)機(jī)中,故障診斷準(zhǔn)確率為90%,低于本文提出的方法。通過對比可知,多尺度樣本熵能夠提取有用故障特征信息,適用于軸承故障特征提取。綜合上述分析可知,本文提出的方法能夠有效進(jìn)行軸承故障模式識別,準(zhǔn)確率高,適用于列車轉(zhuǎn)向架軸承故障診斷。
列車轉(zhuǎn)向架軸承振動信號的非線性和非平穩(wěn)性致使故障特征難以被提取,故障診斷準(zhǔn)確率低。對此,本文提出一種基于多尺度樣本熵改進(jìn)極限學(xué)習(xí)機(jī)(PSO-ELM)的列車轉(zhuǎn)向架軸承故障診斷方法,其采用多尺度樣本熵作為特征提取方法,能夠有效提取故障特征,優(yōu)于單一尺度熵的特征提取方法;PSOELM方法在軸承故障模式識別方面準(zhǔn)確率高,作為模式識別方法具有較大優(yōu)勢。實驗結(jié)果表明,本文提出的基于多尺度樣本熵改進(jìn)極限學(xué)習(xí)機(jī)的列車轉(zhuǎn)向架軸承故障診斷方法具有良好的可行性。
由于列車在實際運(yùn)行中產(chǎn)生的故障數(shù)據(jù)集較少,而正常數(shù)據(jù)集較多,造成了數(shù)據(jù)不均衡的情況。因此,下一步將考慮開展數(shù)據(jù)不均衡情況下列車軸承故障的診斷研究。