郭煒儒,邱存月,張大波,王彥捷,張 利
(遼寧大學 信息學院, 沈陽 110036)
E-mail:zhang_li@lnu.edu.cn
旋轉機械對于現(xiàn)代工業(yè)發(fā)展具有重大意義,滾動軸承作為最重要的部件之一,決定機器運行的狀態(tài).由于復雜的工作環(huán)境以及高負荷的工作任務,設備故障是一個漸進的過程,在該過程中設備會處于“亞健康”狀態(tài).設備“亞健康”狀態(tài)自動且準確的識別,可防止設備進一步發(fā)生嚴重故障,造成重大損失,為此,“亞健康”的識別具有關鍵意義.在旋轉機械運行過程中,處于“亞健康”狀態(tài)的設備振動信號與正常設備振動信號的振動幅度不同,因此可根據(jù)采集的振動信號區(qū)分滾動軸承的狀態(tài)[1-4,22].
近年來,已經(jīng)利用數(shù)據(jù)驅動技術和深度學習(DL)來識別設備狀態(tài),而深度學習源于人工神經(jīng)網(wǎng)絡(ANN)[5],ANN被證明是一種高精度強大的工具,常用的ANN模型如多層感知器(MLP)、遞歸神經(jīng)網(wǎng)絡(RNN)、徑向基神經(jīng)網(wǎng)絡(RBFNN)、概率神經(jīng)網(wǎng)絡(PNN)[6],而RBFNN結構簡單,具有較高運算速度和較強的非線性映射能力,且計算速度方面有很大優(yōu)勢.但是RBFNN在中心向量、寬度、以及連接權值等參數(shù)選取的問題上,沒有直接有效的方法.參數(shù)選擇怎樣才能達到最優(yōu),一些學者提出不同參數(shù)訓練方法:正交最小二乘法[7,8]、基于遺傳算法[9,10]、基于局部競爭算法[11]、基于粒子群和改進粒子群算法[12-14].
文獻[7]提出將正交最小二乘技術與基于梯度的優(yōu)化相結合確定基函數(shù)中心和初始加權因子,減少訓練集的數(shù)量提高算法性能;文獻[8]基于正交最小二乘算法提出中心選擇和學習算法,算法考慮了容錯性,解決中心選擇問題的容錯并行故障情況.文獻[9、10]都使用遺傳算法優(yōu)化RBFNN,分別應用到結構可靠性分析、高速電主軸熱誤差建模.文獻[11]基于局部競爭算法來選擇RBF中心,提出容錯LCA,最小化容錯目標函數(shù),得到最優(yōu)解.文獻[12]采用粒子群(PSO)算法確定RBF最佳參數(shù);文獻[13]提出改進粒子群優(yōu)化算法來選擇最優(yōu)參數(shù)的RBFNN模型,通過初始化基于熵的種群并使用動態(tài)調(diào)整的慣性權重和改善學習因子來改進PSO,將其應用于油氣管道缺陷識別;文獻[14]提出自適應量子粒子群優(yōu)化(AQPSO)算法,將RBFNN的網(wǎng)絡規(guī)模及參數(shù)映射到粒子的空間位置,定義權值平均最優(yōu)的位置,對其中的參數(shù)進行評價,設計隨粒子進化自動調(diào)整的系數(shù)以及網(wǎng)絡規(guī)模,實現(xiàn)RBFNN參數(shù)的自組織學習.
雞群算法和多智能群體優(yōu)化算法如狼群、蜂群、蟻群、粒子群等相似,存在求解精度低、收斂速度慢和易陷入局部最優(yōu)等缺點,在解決復雜高維優(yōu)化問題時尤甚[15],為了克服這些缺陷,在國內(nèi)外相關學者現(xiàn)有研究的基礎上,本文提出一種成長雞群算法,使用混沌搜索求得初始種群,對公雞陷入局部最優(yōu)以及適應度低的小雞問題提出改進,提高算法的尋優(yōu)精度,降低陷入局部最優(yōu)的概率,將得到的尋優(yōu)結果輸入到RBFNN進行訓練,優(yōu)化RBFNN模型,最后將提出的模型用于設備狀態(tài)識別.
徑向基函數(shù)神經(jīng)網(wǎng)絡(Radial basis function neural network)是單隱含層的三層前饋神經(jīng)網(wǎng)絡,具有強大的自學能力,它能夠以任意精度逼近非線性函數(shù)[16,17],而且結構簡單、收斂速度快.傳統(tǒng)的RBFNN由三層網(wǎng)絡結構組成.第一層為輸入層,主要實現(xiàn)輸入向量向隱含層傳遞;中間層為隱含層,也是RBFNN結構中最重要的一層.經(jīng)常使用的徑向基函數(shù)有很多種,如高斯函數(shù),表達式如公式(1)所示:
(1)
其中,Ci為中心向量,σ為寬度.
最后一層為輸出層,將隱含層的輸出結果通過線性組合得到網(wǎng)絡的最終輸出值,其表達式如公式(2)所示:
(2)
其中,wjk為隱含層對輸出層的權值.
RBFNN結構簡單,其性能主要受中心向量、節(jié)點寬度和連接權值影響,在RBFNN中,如何確定隱含層節(jié)點中心向量和寬度是一個困難的問題.針對傳統(tǒng)算法的局限性,利用智能算法求解最優(yōu)化參數(shù)的問題成為國內(nèi)外學者的研究熱點.群體優(yōu)化方法對尋優(yōu)問題的目標范圍和約束條件沒有嚴格規(guī)定,可以與深度學習、數(shù)據(jù)分析等方法相結合求得最優(yōu)解,提高模型的性能.相較于傳統(tǒng)智能算法,雞群算法具有較快的收斂速度和較高的收斂精度.本文采用成長雞群對RBFNN的關鍵參數(shù)進行尋優(yōu),使優(yōu)化后的RBFNN模型可以成功的應用到軸承的故障亞健康識別中,取得了較好的結果.
我國學者孟獻兵在2014年提出一種用于單目標優(yōu)化的生物啟發(fā)算法,雞群算法(Chicken Swarm Optimization,CSO)[18].CSO在搜索食物期間模仿雞群的等級順序和行為,每只雞代表優(yōu)化問題的潛在解決方案.每種類型的雞都有屬于自身的移動路徑并按照相應的移動規(guī)則進行運動,在具體的等級制度下,不同的雞群間具有競爭關系.從本質(zhì)上講,CSO使用以下規(guī)則理想化雞的行為[19]:
1)雞群由幾個群體組成,每個群體的雞按適應度劃分為不同的身份:一只占有優(yōu)勢的公雞,即具有最佳適應度值,小雞,即適應度值較低,母雞,即除公雞和小雞外的雞.
2)當整體雞群等級制度、支配關系和母子關系達到迭代次數(shù)G時,更新等級順序、支配關系和母子關系.
3)每個子群中,公雞是這個子群的中心,每個個體都跟隨公雞覓食,公雞在競爭食物方面具有優(yōu)勢,它們會優(yōu)先找到食物,同時會隨機偷走其它雞已經(jīng)找到的食物,小雞在母親身邊尋找食物.
假設Nc是公雞的數(shù)量、Nd是母雞的數(shù)量、Ne是小雞的數(shù)量、Nf是媽媽母雞的數(shù)量N是整個雞群總體數(shù)量.雞群由公雞、母雞、小雞三種類型的雞組成,每個種類的雞按照不同的位置更新公式更新其位置信息.公雞具有最高的適應度值,也即在廣泛的區(qū)域、最大限度的移動來尋找食物,按照公式(3)更新位置:
xi,j(t+1)=xi,j(t)·(1+Randn(0,σ2))
(3)
其中,xi,j(t)表示迭代t次后第i個雞的位置,Randn(0,σ2)是均值為0、標準差為σ2的一個高斯分布,σ2表達式如式(4)所示:
(4)
其中,ε是一個非常小的數(shù),用于避免零誤差,k是公雞指數(shù),從公雞群中隨機選擇,fi是公雞xi的適應度值.
母雞位置更新公式如公式(5)所示:
(5)
小雞位置更新公式如公式(6)所示;
xi,j(t+1)=xi,j(t)+F·(xm,j(t)-xi,j(t))
(6)
其中,m為第i只小雞跟隨的母雞,F(xiàn)為跟隨系數(shù),表示小雞跟隨母雞覓食,考慮不同小雞之間的差異,取F為[0,2].
混沌搜索策略是利用混沌運動獨特性來提升隨機優(yōu)化算法的效率,混沌搜索過程分為兩個階段:第一階段是映射階段,映射時遵循混沌映射規(guī)則,將初始值通過混沌Logistic映射到混沌變量空間的取值區(qū)間內(nèi),利用混沌變量的遍歷性和規(guī)律性尋優(yōu)搜索[20];第二階段是逆映射階段,將第一階段得到的解線性轉換到初始空間.目前最常用的模型是Logistic映射,其公式如公式(7)所示::
(7)
其中,μ為控制參數(shù).
用混沌搜索策略賦值初始種群的過程為:
2)將這些向量按照式映射到原取值空間.
(8)
其中,M為區(qū)間上界、m為區(qū)間下界.
3)計算目標函數(shù)初始變量的適應度,對適應度進行排序,選取適應度好的前n個初始變量賦值給初始種群.
智能算法在尋優(yōu)過程中,容易陷入局部最優(yōu),雞群算法雖然相比于其他算法易陷入局部最優(yōu)解的概率小,但是仍有一定的概率,從而無法找到最優(yōu)值.為了能夠更好的提升算法尋優(yōu)精度以及降低陷入局部最優(yōu)的概率,提出成長雞群算法(GCSO),對公雞和小雞位置更新分別做出改進:對公雞陷入局部最優(yōu)的問題,本文利用迭代k次的部分適應度高的小雞粒子,繼承公雞特性并同時自我學習,最終得到小雞粒子來代替與成長后小雞粒子數(shù)量相同的部分公雞粒子;對適應度低的小雞粒子,讓其與適應度高的小雞粒子學習,同時向未知位置探索.改進后達到k次迭代時,公雞的位置更新公式如公式(9)所示:
xn+1,j(t+1)=α·xn,j(t)+(1+ω·rand)·xi,j(t)
(9)
其中,α表示繼承公雞特性權重,ω為成長系數(shù).
將小雞的適應度值大小按照4:1的比例分為兩類,第一部分高適應度的小雞粒子正常迭代,剩余適應度低的小雞粒子位置更新公式如公式(10)所示:
(10)
其中,xl,j(t)為高適應度的小雞粒子,H為跟隨系數(shù),表示小雞跟隨適應度值高的小雞覓食.
改進后的成長雞群算法,解決公雞陷入局部最優(yōu)的問題,將小雞分為兩類,適應度高的小雞正常迭代,適應度低的小雞加入跟隨系數(shù),讓其繼續(xù)跟隨適應度高的小雞覓食.
根據(jù)成長雞群算法來尋優(yōu)RBF神經(jīng)網(wǎng)絡的中心向量和節(jié)點寬度,將中心向量和節(jié)點寬度映射為公雞粒子的位置.成長雞群算法優(yōu)化RBF神經(jīng)網(wǎng)絡流程如下:
1)設置迭代次數(shù)、種群規(guī)模、同類型雞的占比比例,最大迭代次數(shù)G等相關參數(shù);
2)根據(jù)混沌搜索求得初始種群;
3)將2)中得到的初始種群帶入雞群算法,得到個體當前最好的位置temp_x和雞群全局最好位置best_x,t=1;
4)如果t%G=1,對適應度排序,將整個雞群分為若干子群,重新建立新的雞群等級制度;
5)使用公式(3)、公式(5)、公式(6)分別更新公雞、母雞和小雞的位置,并分別計算每個個體的適應度值;
6)如果t%G=2,使用公式(9)、公式(10)分別更新公雞粒子位置與小雞粒子位置;
7)更新雞群個體當前最優(yōu)位置信息以及雞群全局最優(yōu)位置信息;
8)迭代次數(shù)t=t+1,若符合終止條件則停止迭代并輸出全局最優(yōu)解,否則轉到4);
9)得到尋優(yōu)結果帶入RBFNN進行訓練,得到訓練模型.
成長雞群算法的流程圖如圖1所示:
實驗的軸承數(shù)據(jù)來自美國西儲大學的實測數(shù)據(jù),實驗平臺由2馬力的電動機、扭矩傳感器/編碼器、測功機和控制電子設備組成.設備健康狀態(tài)直徑0.007英寸.通過使用加速度計收集振動數(shù)據(jù),加速度計放置在電機殼體的驅動端.
圖1 成長雞群算法的流程圖
本文采用的是軸承數(shù)據(jù)集中數(shù)字信號采樣頻率為12000Hz的驅動軸承數(shù)據(jù)用于軸承設備健康狀態(tài)實驗,其中外圈的信號來自6點鐘方向,數(shù)據(jù)參數(shù)如表1所示.
表1 驅動軸承數(shù)據(jù)
Table 1 Drive bearing data
故障直徑(ft)電機負載電機轉速正常信號內(nèi)圈故障信號滾動故障信號外圈設備健康信號0.00701797X97X105X118X1300.00711772X98X106X119X1310.00721750X99X107X120X1320.00731730X100X108X121X133
實驗平臺采集的加速度振動信號平穩(wěn)性較差,存在噪聲干擾,但具有一定的周期性.因此,在輸入模型前需要對信號進行處理.由于噪聲在空間域中無連續(xù)性,經(jīng)小波變換[21]后具有較強隨機性導致系數(shù)較小,而有效信號在空間域呈現(xiàn)連續(xù)的特性,經(jīng)小波變換后系數(shù)較大,所以選擇小波變換對數(shù)據(jù)進行降噪處理.對軸承加速度信號做大量測試后,選取小波基函數(shù)為db9,分解層數(shù)為5層.根據(jù)公式(11)計算sigma.
(11)
其中,th為標準偏差,N為整個信號長度.
選取0負載中正常數(shù)據(jù)、3種設備狀態(tài)數(shù)據(jù)對其降噪處理.由于時域特征參數(shù)多,數(shù)據(jù)經(jīng)過特征選取得到高維度的特征向量,所以選取四種典型的時域特征參數(shù),如表2所示.
為了提高準確率,在進行特征選擇后,采用歸一化處理得到的數(shù)據(jù),公式如式(12)所示:
(12)
表2 4種時域特征
Table 2 Four kinds of time domain feature
指標名稱計算公式均值μx=1n∑ni=1xi峰值xp=maxxi幅值平方和xc=∑ni=1xi2標準差ω=1n-1∑ni=1xi-μx()2
公式(12)中,Xt是歸一化后的結果,X是原始數(shù)據(jù),m和n分別是樣本最大值最小值.
為了對比成長雞群算法的優(yōu)勢,選取常用的五類不同基準測試函數(shù):Ackley、Griewank、Rastrigin、Alpine、Scherfel.利用函數(shù)迭代曲線來直觀的顯示每個算法的性能.不同測試函數(shù)的收斂曲線如圖2至圖6所示.
綜合分析CSO、PSO、GA、GCSO在不同函數(shù)下的適應度變化,在Rastrigin函數(shù)中,PSO算法陷入局部最優(yōu),雖然在后續(xù)性能測試中,增加種群規(guī)模和迭代次數(shù),PSO算法也可以達到較低的收斂精度,但是相同速度下GCSO收斂速度更快、精度高,在其他四種函數(shù)中GCSO算法均表現(xiàn)最優(yōu),無論是收斂速度還是最后結果都優(yōu)于其它三種算法.
圖2 Ackley函數(shù)收斂曲線
圖3 Griewank函數(shù)收斂曲線
圖4 Rastrigin函數(shù)收斂曲線
圖5 Alpine函數(shù)收斂曲線
圖6 Scherfel函數(shù)收斂曲線
為了更能直觀的看出各個算法的性能,本文用GCSO和原始CSO、PSO、GA算法進行對比,測試維度為30,種群規(guī)模為1500,迭代次數(shù)設置為2000,六種函數(shù)的最小值都為0,算法尋優(yōu)結果越小,說明算法的收斂精度越高,四種算法測試結果對比如表3所示.
從表3可以看出,成長雞群算法均表現(xiàn)出較好的搜索性能.相比于PSO、GA、CSO算法,GCSO算法在六組測試函數(shù)上的尋優(yōu)精度、穩(wěn)定性更好.GCSO算法可以提高全局搜索精度、有跳出局部最優(yōu)的能力.
為了驗證GCSO-RBFNN模型的性能,處理后負載為1、2、3的軸承數(shù)據(jù)各1000條,分別對GCSO-RBFNN模型和原始RBF神經(jīng)網(wǎng)絡模型進行性能測試,傳統(tǒng)RBF神經(jīng)網(wǎng)絡模型利用無監(jiān)督學習的K均值聚類確定中心,算法迭代次數(shù)參數(shù)設置為300,種群規(guī)模設置為1000,繼承公雞特性權重設置為0.9,成長系數(shù)設置為0.7,選取80%的軸承數(shù)據(jù)作為訓練集,用剩余20%的軸承數(shù)據(jù)作為測試集,用相同的訓練集與測試集數(shù)據(jù)對兩種模型進行訓練,重復10次求平均分類準確率,準確率對比如表4所示.
從表4可以看出,在各類負載情況下,GCSO-RBFNN模型的準確率高于傳統(tǒng)的RBFNN模型,能較好檢測出數(shù)據(jù)對應的滾動軸承的狀態(tài).
對傳統(tǒng)RBF神經(jīng)網(wǎng)絡模型、信息重構的改進機極限學習機模型(WPE-FWELM)[21]和改進RBF神經(jīng)網(wǎng)絡模型進行對比.將各類負載的正常、故障數(shù)據(jù)混合在一起,選取訓練集數(shù)據(jù)大小為312,測試集數(shù)據(jù)大小為200,測試3種模型檢測性能,得到的準確率和時間對比如表5所示.
表3 四種算法測試結果對比表
Table 3 Comparison table of test results of the four algorithms
函數(shù)算法CSOPSOGAGCSOAckley標準差0.0368580.4474540.2282250.016332平均值0.0956651.3217560.9593560.085421Griewank標準差0.0003180.0178580.0964850.000129平均值0.0006350.0097670.0552520.000375Rastrigin標準差0.0800666.3318560.0399660.101408平均值0.14556633.331090.3192890.120222Alpine標準差0.0014290.0006270.0042150.000932平均值0.0030140.0030920.0294670.001284Scherfel標準差0.0286600.0149480.0030060.028588平均值0.1045870.0594560.6493780.041467
表4 3種負載準確率對比
Table 4 Comparison of accuracy of three loads
模型數(shù)據(jù)負載1負載2負載3傳統(tǒng)RBFNN91.25%82.8125%87.9385%GCSO-RBFNN95.5%93.375%94.125%
表5 準確率和時間對比
Table 5 Accuracy and time comparison
模型全部類型負載數(shù)據(jù)時間(s)傳統(tǒng)RBFNN88.81%0.5434WPE-FWELM92.38%0.4176PSO-RBFNN91.70%0.6627GA-RBFNN90.00%0.7235CSO-RBFNN92.21%0.6167GCSO-RBFNN94.19%0.5986
從表5可以看出,雖然GCSO-RBFNN比傳統(tǒng)的RBF神經(jīng)網(wǎng)絡花費時間多,但是準確率卻高出5.38%,與近年提出的WPE-FWELM模型相比,能夠更準確識別軸承的狀態(tài),與其它的智能算法PSO、GA、CSO優(yōu)化RBFNN相比,準確率更高且花費時間較少.
由于RBF神經(jīng)網(wǎng)絡不能準確計算中心向量、節(jié)點寬度,使其達不到滿意的結果,本文針對這一問題用成長雞群算法對參數(shù)進行擇優(yōu),對于初值的選取,采用混沌搜索策略,成長雞群算法改進原始雞群算法的公雞位置更新公式以及適應度低的小雞位置更新公式,輸出優(yōu)化后的參數(shù),完成RBF神經(jīng)網(wǎng)絡亞健康識別模型的建立.實驗表明,本文算法取得了較高的準確率,能夠對設備的健康狀態(tài)準確識別.但是本文進行的軸承狀態(tài)識別均為離線診斷,在線和實時故障識別有待進一步研究.