武沖鋒
(晉能控股陽(yáng)泉固莊煤業(yè)有限公司,山西陽(yáng)泉 045060)
隨著機(jī)械設(shè)備不斷向智能化和精密化方向發(fā)展,軸承作為機(jī)械設(shè)備的關(guān)鍵部件,其性能退化直接影響整個(gè)設(shè)備的性能[1-4]。為此,對(duì)軸承進(jìn)行實(shí)時(shí)監(jiān)測(cè)和剩余壽命預(yù)測(cè)有著十分重要的研究?jī)r(jià)值和意義?,F(xiàn)研究階段可將剩余壽命預(yù)測(cè)的方法大致分為基于物理失效模型、基于知識(shí)表示和數(shù)據(jù)驅(qū)動(dòng)的方法[5]。面對(duì)復(fù)雜的設(shè)備,獲得物理模型是很困難的,知識(shí)表示方法更適合定性推理,不太適合定量計(jì)算,而且很難獲得完整的知識(shí)。然而,數(shù)據(jù)驅(qū)動(dòng)的預(yù)測(cè)方法,通過(guò)對(duì)軸承性能數(shù)據(jù)的描述,提取有用的信息并預(yù)測(cè)剩余壽命[6]。Si等[7]將數(shù)據(jù)驅(qū)動(dòng)方法的伽馬分布、回歸模型、Wiener過(guò)程和隨機(jī)濾波模型[8]等RUL模型進(jìn)行總結(jié)分析。Pei等[9]提出雙時(shí)間尺度的隨機(jī)退化設(shè)備的非線性退化模型。Zhai等[10]提出基于高階隱半馬爾科夫模型的剩余壽命預(yù)測(cè)模型。上述數(shù)據(jù)驅(qū)動(dòng)的方法大多需要假設(shè)退化模型和參數(shù)估計(jì),而參數(shù)估計(jì)方法在模型選擇上存在局限性,過(guò)分依賴概率密度函數(shù)形式的先驗(yàn)定義,因此不能保證預(yù)測(cè)模型的準(zhǔn)確性和適用性。
本文提出一種軸承核密度估計(jì)的非參數(shù)剩余壽命預(yù)測(cè)模型,該方法不對(duì)數(shù)據(jù)分布附加任何假設(shè),而是從數(shù)據(jù)本身研究數(shù)據(jù)分布的特點(diǎn),避免了大多數(shù)數(shù)據(jù)驅(qū)動(dòng)方法需要模型假設(shè)和參數(shù)估計(jì)的問(wèn)題。該模型在核估計(jì)窗寬的選取上引入局部窗寬因子構(gòu)建自適應(yīng)窗寬模型。模型通過(guò)計(jì)算樣本點(diǎn)的密度來(lái)自適應(yīng)選擇樣本點(diǎn)窗寬,提高了核密度估計(jì)窗寬選擇的可靠性,從而提高了預(yù)測(cè)精度。最后通過(guò)軸承磨損試驗(yàn)驗(yàn)證了所提模型的適應(yīng)性和準(zhǔn)確性。
核密度估計(jì)方法不利用數(shù)據(jù)分布的先驗(yàn)知識(shí),不對(duì)數(shù)據(jù)分布進(jìn)行假設(shè),它是一種用于從數(shù)據(jù)本身估計(jì)未知變量的概率密度函數(shù)的方法[11-12]。其由已知的N個(gè)樣本點(diǎn),通過(guò)選擇任意核函數(shù)及窗寬得到N個(gè)核函數(shù),通過(guò)線性疊加得到核密度的估計(jì)函數(shù)。設(shè)Δx1,Δx2,…,Δx n為n個(gè)獨(dú)立且同分布的退化樣本,f(Δx)為其服從十五概率密度函數(shù),則核密度估計(jì)的概率密度函數(shù)f^(Δx)表示為:
式中:h為窗寬;K(·)為核函數(shù);n為樣本數(shù)。
其中,K(·)和h選用的恰當(dāng)與否決定了核估計(jì)的準(zhǔn)確度高低。核函數(shù)作為影響核密度估計(jì)的一個(gè)因素,一般情況下任何函數(shù)都可作為核函數(shù),常用的有四次核、均勻核、三角核和高斯核。核函數(shù)的選擇雖多,但對(duì)核密度估計(jì)的準(zhǔn)確度作用不大。本文選用廣泛應(yīng)用的高斯核函數(shù)。即:
窗寬h作為影響核密度估計(jì)平滑性和核函數(shù)寬度的主要因素,當(dāng)h較小時(shí),核密度估計(jì)曲線不平滑且曲折,揭示了更多細(xì)節(jié);當(dāng)h較大時(shí),核密度估計(jì)曲線平滑,但會(huì)覆蓋更多的細(xì)節(jié)。因此,選擇合適的窗寬對(duì)核密度估計(jì)是非常重要的。
目前自適應(yīng)窗寬是窗寬選擇的主流方向,其本質(zhì)是隨著樣本點(diǎn)的增加能夠自適應(yīng)的選取窗寬,減少了計(jì)算量。在現(xiàn)有研究階段常用的自適應(yīng)窗寬方法大多采用的是通過(guò)式(3)積分均方誤差求其最小值得到初始最優(yōu)窗寬h n。
核密度估計(jì)模型中的初始最優(yōu)窗寬h n,通過(guò)式(3)積分均方誤差求其最小值點(diǎn)得到:
將高斯核函數(shù)代入式(4)可求出h n為:
式中:σn為n個(gè)初始樣本特征退化增量的方差。
該窗寬方法解決了樣本數(shù)據(jù)實(shí)時(shí)變化時(shí)選擇窗寬和實(shí)際中固定窗寬造成的過(guò)度(不足)擬合問(wèn)題。如果樣本分布是近似正態(tài)的,這種方法是最佳選擇。然而,當(dāng)樣本分布不對(duì)稱或有多個(gè)峰值時(shí),該方法會(huì)導(dǎo)致過(guò)度平滑,精度需要提高。
然而,在實(shí)時(shí)監(jiān)測(cè)軸承的核密度估計(jì)過(guò)程中,為了提高窗寬對(duì)真實(shí)樣本數(shù)據(jù)分布的適應(yīng)性,引入了一個(gè)反映基于最優(yōu)窗寬h n的樣本點(diǎn)分散度的函數(shù)λi來(lái)自適應(yīng)選擇窗寬。λi可通過(guò)式(6)各個(gè)樣本點(diǎn)處的概率密度得到:
將函數(shù)λi與式(5)計(jì)算出窗寬h n相乘可得自適應(yīng)窗寬h i:
從而使得不同樣本的窗寬可以根據(jù)樣本數(shù)據(jù)的稀疏程度進(jìn)行自適應(yīng)調(diào)整,以更好地滿足實(shí)踐中核密度估計(jì)的需要。
因此,將自適應(yīng)窗寬h(Δx i)方法引入核密度估計(jì)的模型中,從而構(gòu)建自適應(yīng)核密度估計(jì)的表達(dá)式為:
由于在實(shí)際應(yīng)用中樣本數(shù)據(jù)都是實(shí)時(shí)更新的,如果每增加一個(gè)樣本都對(duì)其從頭開(kāi)始計(jì)算,那么計(jì)算量會(huì)隨數(shù)據(jù)的增多變得復(fù)雜化。所以,為使核估計(jì)的計(jì)算性能得到提升,通過(guò)用已知的n個(gè)樣本的核估計(jì)推導(dǎo)第n+1個(gè)樣本的核密度估計(jì),來(lái)實(shí)現(xiàn)核密度估計(jì)的實(shí)時(shí)更新。
假設(shè)t n為軸承退化狀態(tài)時(shí)間,可得到[0,t n]時(shí)間內(nèi)所有退化樣本的特征退化隨時(shí)間變化的趨勢(shì)可由圖1所示。為使設(shè)備的剩余壽命預(yù)測(cè)準(zhǔn)確,由核密度估計(jì)可得[0,t n]隨機(jī)退化增量的概率密度,推出[0,t n]上隨機(jī)退化增量累計(jì)特征退化量的,可由n重卷積得到:
圖1 樣本特征退化隨時(shí)間變化的曲線
設(shè)t n+t時(shí)刻,特征退化量達(dá)到(圖1)時(shí)軸承失效。剩余壽命預(yù)測(cè)的實(shí)現(xiàn),要對(duì)當(dāng)前t n時(shí)刻的剩余壽命預(yù)測(cè),通過(guò)初始時(shí)刻到當(dāng)前t n時(shí)刻的退化量(記,推出t n+t時(shí)刻的。設(shè)T為設(shè)備的剩余壽命,則剩余壽命的概率密度分布函數(shù)F T(t)為:
其中,[0,t n+t]特征退化量的概率密度為:
剩余壽命預(yù)測(cè)的概率密度為:
從而能夠推出t n時(shí)刻剩余壽命的概率密度函數(shù)為:
隨著實(shí)時(shí)監(jiān)測(cè)的進(jìn)行,監(jiān)測(cè)的樣本數(shù)量不斷增加,樣本的核密度估計(jì)也不斷更新。當(dāng)使用非實(shí)時(shí)壽命預(yù)測(cè)模型時(shí),基于這些樣本的核密度估計(jì)必須為每一個(gè)新的樣本數(shù)據(jù)重新計(jì)算,這導(dǎo)致歷史樣本不斷被重新計(jì)算,計(jì)算量越來(lái)越大。為避免實(shí)時(shí)監(jiān)測(cè)系統(tǒng)中樣本核密度估計(jì)的重復(fù)計(jì)算問(wèn)題,提出了一種遞推核密度估計(jì)模型的實(shí)時(shí)更新算法,并對(duì)模型的特征退化分布和剩余壽命進(jìn)行了連續(xù)的實(shí)時(shí)更新。
本文使用IEEE PHM2012提供的全壽命軸承數(shù)據(jù)對(duì)該模型進(jìn)行了驗(yàn)證。該數(shù)據(jù)來(lái)自于FEMTO-ST研究中心的PRONOSTIA試驗(yàn)臺(tái)的加速軸承壽命測(cè)試,振動(dòng)信號(hào)的采樣頻率為25.6 kHz,采樣時(shí)間為0.1 s,采樣間隔為10 s,即每次獲得2 560個(gè)數(shù)據(jù)樣本。本文以Bearing 1-5在1 800 r/min和4 000 N載荷下的全壽命振動(dòng)數(shù)據(jù)為例。在軸承故障診斷中,均方根(RMS)在實(shí)踐中被廣泛使用,因?yàn)樗芨玫貙⑤S承的退化狀態(tài)反映出來(lái)。圖2所示給出在時(shí)間變化下軸承的均方根特征退化趨勢(shì)。從圖中可看出均方根值基本上呈現(xiàn)出隨時(shí)間單調(diào)上升的趨勢(shì),可以將軸承的退化趨勢(shì)很好地展現(xiàn)出來(lái)。該軸承在t=2.463×104s時(shí)出現(xiàn)故障,均方根的故障閾值為1.396 mm/s2。
圖2 特征值隨監(jiān)測(cè)時(shí)間的退化趨勢(shì)
利用本文的模型預(yù)測(cè)軸承的剩余壽命,從圖3可以看出,在軸承運(yùn)行時(shí)間不斷的變化下,接受到的樣本數(shù)據(jù)逐漸越來(lái)越多,在核密度估計(jì)的剩余壽命模型不斷的實(shí)時(shí)更新下,軸承的剩余壽命概率密度不斷的增大且逐漸變窄,其方差也明顯不斷減小,可看出預(yù)測(cè)值與實(shí)際值相差不斷減小,從而模型的準(zhǔn)確性不斷提高。
圖3 不同監(jiān)測(cè)時(shí)刻剩余壽命的概率密度
為了進(jìn)一步評(píng)估所提方法的預(yù)測(cè)效果,表1所示為不同監(jiān)測(cè)時(shí)間下實(shí)際剩余壽命和模型預(yù)測(cè)的平均剩余壽命的均方根誤差(Root mean square error,RMSE)比較。從表中可看出,軸承在運(yùn)行過(guò)程的實(shí)時(shí)預(yù)測(cè)下,預(yù)測(cè)值與真實(shí)值之間的RMSE在逐漸的減小,根據(jù)樣本數(shù)據(jù)的增多,剩余壽命的預(yù)測(cè)值在不斷的接近真實(shí)值,且誤差也越來(lái)越小,從而可以驗(yàn)證本文模型對(duì)軸承壽命預(yù)測(cè)的有效性。
表1 不同時(shí)刻的剩余壽命均方根誤差比較
為了能驗(yàn)證本文模型在軸承應(yīng)用上的優(yōu)越性,將本文模型與Wiener過(guò)程的剩余壽命預(yù)測(cè)模型進(jìn)行比較,Wiener過(guò)程多用于對(duì)具有非單調(diào)退化過(guò)程的設(shè)備進(jìn)行建模。在相同條件下對(duì)軸承的退化過(guò)程進(jìn)行壽命預(yù)測(cè),得到圖4所示不同時(shí)刻下本文核密度估計(jì)模型與Wiener過(guò)程模型的剩余壽命預(yù)測(cè)值和真實(shí)值之間的比較。從圖中可看出,本文模型的預(yù)測(cè)結(jié)果相比Wiener過(guò)程模型,更加接近真實(shí)壽命值,隨著時(shí)間的變化預(yù)測(cè)的準(zhǔn)確性不斷提高,從而驗(yàn)證了本模型的適用性和精確性。
圖4 不同時(shí)刻兩模型剩余壽命值比較
本文提出了一種軸承核密度估計(jì)的非參數(shù)剩余壽命預(yù)測(cè)方法,以解決預(yù)測(cè)設(shè)備剩余壽命時(shí)在不同樣本分布下核估計(jì)的窗寬不能準(zhǔn)確選擇的問(wèn)題。在該方法中,通過(guò)引入局部密度因子來(lái)選擇核估計(jì)的窗寬,構(gòu)建了一個(gè)自適應(yīng)窗寬模型。該模型根據(jù)樣本點(diǎn)的密度自適應(yīng)地選擇窗寬值進(jìn)行核密度估計(jì),即較小的窗寬用于樣本點(diǎn)密集區(qū),而較大的窗寬用于樣本點(diǎn)稀疏區(qū)。隨著接收到的實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)的實(shí)時(shí)更新,核密度估計(jì)也自適應(yīng)地遞歸更新,從而避免每增加一個(gè)樣本數(shù)據(jù)就要進(jìn)行一次計(jì)算帶來(lái)計(jì)算量復(fù)雜問(wèn)題。實(shí)例分析表明,隨著樣本數(shù)據(jù)的增加,所提模型的軸承剩余壽命預(yù)測(cè)值越來(lái)越接近實(shí)際值,并于Wiener過(guò)程模型比較,驗(yàn)證了本文模型的準(zhǔn)確性和有效性。