王伊婧心 劉 宇 于仁清 叢林虎 逯 程
(1.海軍航空大學航空基礎(chǔ)學院 煙臺 264001)(2.中國人民解放軍91206部隊 青島 266041)(3.海軍航空大學岸防兵學院 煙臺 264001)
像裝備故障率這類小樣本、非線性時間序列的預測問題一直是相關(guān)學者研究的熱點和難點,尤其是在軍用領(lǐng)域,針對裝備技術(shù)狀態(tài)及故障概率的預測十分重要,準確的預測結(jié)果能夠指導部隊開展科學有效的維修保障工作,保證一定的戰(zhàn)備完好率,從而提高作戰(zhàn)任務(wù)的成功概率。
目前,故障預測問題已成為維修領(lǐng)域的主要研究方向[1],常用的方法有自回歸滑動平均(auto-regressive moving average,ARMA)模型[2~3]、灰色模型[4~6](grey model,GM)、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)[7-8]、馬爾科夫(Markov Model,MM)預測模型[9]等方法,相關(guān)學者針對不同研究對象也取得了一定成果。但是,ARMA模型對于具有波動的時間序列預測效果一般,灰色模型則只適合于近似指數(shù)增長的故障率預測情況,ANN則需要大量的樣本進行訓練,馬爾科夫模型也適用于中長期預測。
針對現(xiàn)有的故障預測數(shù)據(jù)的小樣本、非平穩(wěn)特性,同時為了克服單一方法精度不足的問題,本文提出了一種基于EMD與改進LS-SVM的預測方法,并通過經(jīng)典的波音飛機故障預測算例驗證了該方法較傳統(tǒng)單一方法具有更高的預測精度。
黃鍔等研究的經(jīng)驗模態(tài)分解理論(Empirical Mode Decomposition,EMD)是一種優(yōu)秀的非線性非平穩(wěn)信號分析方法[10],EMD算法通過對復雜信號的自適應多尺度分解,在自適應時頻信號處理方法的應用上逐漸顯示出優(yōu)越性。EMD將時間序列中不同尺度的波動或趨勢逐步分解為一系列具有不同特征尺度的本征模態(tài)函數(shù)—IMF分量。分解結(jié)果突出了信號的局部特征,使信號的處理可以準確把握原始信號的特征及物理意義。
IMF的應用需要如下條件:一是在全時間序列內(nèi),局部極值點的數(shù)目等于零點數(shù)目,或相差不多于1;二是在任意時刻點,其上下包絡(luò)線部分對稱與時間軸。若X為n點時間序列,其EMD的具體計算如下:
1)分別利用三次樣條插值法擬合出與序列X長度相同的上包絡(luò)線U1和下包絡(luò)線L1,二者的平均記為均值包絡(luò)線M1:
2)令H1=X-M1,對H1重復上一步直至其滿足IMF條件,記C1=H1為X的第一個IMF分量。
3)將R1=X-C1作為原始序列,重復前兩步得到X第2~m個IMF分量與一個余量(RF)R,結(jié)束篩選。最終原序列變?yōu)?/p>
EMD分解后的IMF分量實質(zhì)上包含了不同頻率成分,代表了原序列不同時間尺度上的震蕩變化,RF分量則代表了其平均發(fā)展趨勢。
LS-SVM不同于SVM是因為其采用等式約束,同時將風險變?yōu)檎`差的二范數(shù)[11],簡化的一次方程組求解,高效提升了計算效率。LS-SVM應用于函數(shù)估計領(lǐng)域的基本思想如下。
式中,φ(·):Rn→H表示原始空間至高維空間的非線性映射;w∈H表示相關(guān)空間的權(quán)重向量;b∈R為常數(shù)項。非線性映射函數(shù)的主要作用是通過提取輸入空間中的相關(guān)特征,將相應樣本映射成為高維空間中的一個向量,從而對輸入空間中有關(guān)線性不可分的問題進行處理,此時非線性估計函數(shù)就變?yōu)橄鄳呔S空間中的線性估計函數(shù),即可用f(x)對相關(guān)輸出y進行逼近。
依據(jù)結(jié)構(gòu)風險最小化的相關(guān)思想,LS-SVM回歸算法的實質(zhì)即為求解如下優(yōu)化問題:
式中,wTw主要用于控制模型的復雜度;γ>0為正則化參數(shù),主要用于調(diào)整誤差樣本的懲罰大小;ei為實測值與回歸函數(shù)值的誤差。利用拉格朗日函數(shù)對式(4)中的約束優(yōu)化問題進行處理,可得:
式中,αi∈R為拉格朗日乘子。依據(jù)KKT(Karush-Kuhn-Tucker)原則[12],可得相應等式約束如下所示:
對式(6)進行整理,約去w與ei,可得:
則式(7)可表示為
設(shè)Q=Ω+γ-1I,考慮到Q為對稱半正定矩陣,因此Q-1存在,采用最小二乘法對式(9)進行求解,可得:
則LS-SVM回歸函數(shù)可表示為
在LS-SVM回歸算法實現(xiàn)過程中核函數(shù)被定義為K(xi,xj)=φ(xi)T·φ(xj),因而高維空間中的復雜點積運算可通過選取適當?shù)暮撕瘮?shù)進行替代處理,從而避免了映射函數(shù)φ(x)的復雜求解,克服了由于φ(x)未知而導致w難以顯式表達的缺陷。依據(jù)泛函分析中的相關(guān)理論,凡是符合Mercer條件的函數(shù)均可作為核函數(shù),核函數(shù)的構(gòu)造形式?jīng)Q定了特征空間的結(jié)構(gòu)特性,因而選取適當?shù)暮撕瘮?shù)對于模型預測性能的提高具有重要意義。當前關(guān)于如何選取核函數(shù)的相關(guān)文獻較少,常用的核函數(shù)大致可歸納為以下四種。
1)線性核函數(shù):K(xi,xj)=xi·xj
該核函數(shù)中無待定參數(shù),表達形式較為簡單,其在低維空間中具有良好的適應性,但在高維空間中存在計算量過大的問題。
2)多 項 式 核 函 數(shù) :K(xi,xj)=(xi·xj+θ)d,d=1,2,…
該核函數(shù)中θ為可控參數(shù),若空間維數(shù)過高,會由于d值的增長而使得計算量迅速增大,對最終預測結(jié)果造成不利影響。
3)Sigmod核函數(shù):K(xi,xj)=tanh[b(xi·xj)+c]
該核函數(shù)中b和c為待定參數(shù),僅在某些情況下滿足Mercer條件,其與神經(jīng)網(wǎng)絡(luò)中的Sigmoid函數(shù)類似,存在一定的適用范圍,但解決了模型易于陷入局部極小點的問題。
4)高斯徑向基(RBF)核函數(shù):
該核函數(shù)中僅δ為待定參數(shù),分析其表達式可知,各高斯基函數(shù)的中心點均具有對應的支持向量將相關(guān)輸入從低維空間映射至高維空間,可大幅減少計算量。RBF核函數(shù)具有較好的適用性,可有效應用于各類型的分布,并能滿足較高的性能要求。
高斯核函數(shù)是以核函數(shù)的距離方程為基礎(chǔ)的。從源空間映射到高維特征空間,測試點趨于稀疏。只有當核函數(shù)能夠保持快速衰減測試點,并且在保持無限衰減的情況下,才能改變這種情況。高斯核函數(shù)只滿足前者,是一種典型的局部核函數(shù)。確定合適的核函數(shù)對最小二乘支持向量機的預測性能至關(guān)重要。近年來,許多學者提高內(nèi)核函數(shù)的性能通過構(gòu)建混合高斯核函數(shù)和全局內(nèi)核函數(shù)[13~14]。然而,在這個過程中,許多參數(shù)變量,從而導致計算復雜性的增加?;诟咚购撕瘮?shù),一種改進的方差高斯核函數(shù)構(gòu)造來提高性能的回歸模型。
它可以觀察到,在高斯核函數(shù)的標準形式,所有功能元素是按同樣的比例因子,這一特點也使得具有大數(shù)值尺度的特性更加占主導地位,這一局限性也嚴重影響了它中的性能。為克服這一問題,使每個特征元素都以零均值歸一化及其標準差形式為單位:
其中,μi和σi特征向量的平均值和標準偏差。用方程(18)標準形式和重寫成核函數(shù)的形式的結(jié)果,生成一個新的內(nèi)核函數(shù),即
波音757-700飛機的故障率預測問題是該領(lǐng)域的經(jīng)典分析算例,利用文獻[15]的數(shù)據(jù)為研究對象,選取某兩年內(nèi)共24個典型數(shù)據(jù),如圖1所示。
作為本文的驗證方法,通過EMD分解前20個數(shù)據(jù),結(jié)果如圖2所示,最后4個失效率數(shù)據(jù)作為測試結(jié)果。從圖2中可以看出,故障率數(shù)據(jù)被分解為1段RF和3段IMF,每個分量代表原始序列在不同頻率分量上的振蕩變化,每個分量都可以進行預測,用于后續(xù)分析。
圖1 失效率時間序列
圖2 EMD分解結(jié)果
為了比較該方法與現(xiàn)有的方法,表1列出了各方法之間的預測性能比較結(jié)果。其中,選擇高斯核函數(shù)回歸模型,內(nèi)核參數(shù)和正則化參數(shù)取決于留一交叉驗證方法,嵌入維數(shù)是4。
表1 模型預測結(jié)果
與常見的灰色模型的預測結(jié)果和LS-SVM模型,該方法的預測精度明顯提高,預測結(jié)果更準確,表明EMD分解是合理的?;貧w預測模型基于EMD也符合故障率變化的現(xiàn)實,融合結(jié)果更加準確和可靠的。
作為一種非線性非平穩(wěn)時間序列,故障率數(shù)據(jù)的預測問題一直維修領(lǐng)域研究的重點,本文提出了一種基于EMD與改進LS-SVM的預測方法,通過EMD分離故障率時間序列的振蕩變化與非平穩(wěn)特征,分解產(chǎn)生序列的IMF分量和RF分量,同時構(gòu)造了一種高斯方差核函數(shù),將各分量分別利用改進的LS-SVM進行預測,各分量預測值相加之后得到最終故障率預測結(jié)果。最后的實例驗證了本文方法能夠有效提高預測精度,為部隊開展備件訂購與維修活動提供了理論依據(jù)。