逯 程, 徐廷學, 王 虹
(1. 海軍航空大學岸防兵學院, 山東 煙臺 264001; 2. 中央軍委聯(lián)合參謀部第55研究所, 北京 100094)
狀態(tài)預測技術是視情維修(condition based maintenance, CBM)策略的關鍵技術之一,它通過整合裝備當前及歷史狀態(tài)監(jiān)測數(shù)據(jù),判斷其在未來一段時間內的狀態(tài)發(fā)展趨勢,從而為維修保障提供決策信息。
目前,裝備的退化狀態(tài)預測方法主要分為3類[1]:基于經(jīng)驗、基于模型和基于數(shù)據(jù)驅動的預測?;诮?jīng)驗的預測方法通常針對狀態(tài)信息獲取困難的裝備,該方法實現(xiàn)簡單,但是預測結果往往不夠理想;基于模型的預測方法需要對裝備狀態(tài)進行精確的數(shù)學建模,而這一點對于復雜的機電裝備難度較大;而基于數(shù)據(jù)驅動的預測方法[2-4]靈活性較強,適用于各類型裝備的退化狀態(tài)預測,具有很可觀的工程實用價值。當前,人工神經(jīng)網(wǎng)絡(artificial neural network, ANN)、灰色系統(tǒng)理論(grey system theory, GST)和支持向量機(support vector machine, SVM)已被廣泛用于這一領域的研究,并表現(xiàn)出不錯的性能。但它們也存在一些固有缺陷,如ANN在優(yōu)化過程中易陷入局部最優(yōu)值,且性能受到訓練樣本量的限制;GST極易受到數(shù)據(jù)序列波動性的影響,且長期預測精度不佳;SVM模型參數(shù)設置復雜,稀疏性有限,輸出結果沒有概率輸出,忽視了預測的不確定性問題。這些不足極大限制了它們在工程上的實際應用。
相關向量機(relevance vector machine, RVM)是文獻[5-6]于2001年提出的一種基于稀疏Bayesian學習理論的機器學習算法。與SVM相比,其核函數(shù)不受Mercer條件的限制,選取更加靈活;參數(shù)設置簡單,避免了復雜的附加參數(shù);解的稀疏性也遠高于SVM,具有較好的泛化能力;其概率式的輸出也能有效提供更多決策信息,降低預測風險[5-6]。目前,已在壽命預測[7]、可靠性預測[8]及時間序列預測[9]等領域取得了不錯的應用效果,是當前小樣本預測建模問題的研究熱點。
所以本文結合裝備保障實際,在RVM回歸模型的基礎上,提出了一種基于聯(lián)合局域相關向量機(united local relevance vector machine, U-LRVM)的預測方法。通過構建一種方差高斯核函數(shù)來提高核函數(shù)的全局性能和泛化能力;通過借鑒混沌序列局域預測法中鄰近點個數(shù)的選取方法,利用Hannan-Quinn(H-Q)準則對訓練空間預測嵌入維數(shù)進行優(yōu)化,避免了主觀選取的盲目性,完成了改進局域相關向量機(local relevance vector machine, LRVM)模型的構建;針對傳統(tǒng)預測方法僅考慮單一性能指標變化趨勢的不足,利用具有近似退化規(guī)律的同源裝備測試數(shù)據(jù)對LRVM進行了改進,結合Dempster-Shafer (D-S)證據(jù)理論在數(shù)據(jù)融合領域的優(yōu)良性能,對傳統(tǒng)和改進LRVM兩種模型進行了融合,建立了U-LRVM模型,如圖1所示。
圖1 U-LRVM 預測模型Fig.1 Prediction model of U-LRVM
RVM是一種非線性稀疏Bayesian學習理論,其良好的泛化性能和較少的相關向量使其在預測領域取得了較好的應用,其回歸模型原理如下。
ti=y(xi,ω)+εi
(1)
式中,樣本高斯噪聲εi~N(0,σ2)。類似于SVM的表達式,將式(1)用一系列核函數(shù)可以表示為
(2)
式中,ω=[ω0,ω1,…,ωN]T為權參數(shù)向量;K(·,·)為核函數(shù)。因此可以推斷出p(ti|xi)=N(ti|y(xi,ω),σ2),即ti滿足ti~N(y(xi,ω),σ2)。為方便表達,引入超參數(shù)β=σ-2,則整個訓練樣本數(shù)據(jù)組的似然函數(shù)表示為
(3)
式中,t=[t1,t2,…,tN]T;Φ∈RN×(N+1)是設計矩陣,定義為Φ=[φ(x1),φ(x2),…,φ(xN)]T,基函數(shù)向量。
(4)
式中,在超參數(shù)α=[α1,α2,…,αN]中的每個αj都相互獨立且只與對應的權值ωj相關。利用式(3)和式(4),根據(jù)Bayesian公式即可得到ω后驗分布的均值矩陣μ和協(xié)方差矩陣Σ分別為
Σ=(βΦTΦ+A)-1
(5)
μ=βΣΦTt
(6)
式中,Α=diag(α0,α1,…,αN)。若要得到ω的后驗分布,必須對兩個影響參數(shù)β和αj進行優(yōu)化,具體方法為最大化邊緣似然函數(shù)p(t|α,β)。對p(t|α,β)等號兩邊取對數(shù)得到目標函數(shù)后,再根據(jù)目標函數(shù)分別對αj和β求偏導并令導數(shù)為0,得到兩個參數(shù)的迭代計算公式為
(7)
(8)
γj=1-αjΣjj
(9)
式中,μj為μ的第j個元素;Σjj是協(xié)方差矩陣Σ第j個對角元。
y*=μTφ(x*)
(10)
(11)
(12)
若置信度設為1-θ,則
(13)
式(13)即p{y*-σ*zθ/2,y*-σ*zθ/2}=1-θ,所以t*置信度為1-θ的雙側置信區(qū)間為[y*-σ*zθ/2,y*-σ*zθ/2],上位數(shù)zθ/2可以通過標準正態(tài)分布表查找獲取。
通過在SVM基礎上把基于高斯過程中的Bayesian推理應用到核理論上,RVM算法在先驗參數(shù)的結構下利用自相關判定理論(automatic relevance determination, ARD)移除不相關的樣本點,從而實現(xiàn)了模型的稀疏化[10]。雖然與SVM相比,RVM的核函數(shù)由于稀疏、較少的超參數(shù)而計算量大減,且脫離了Mercer條件的限制,但是預先確定的核函數(shù)性能依然會直接影響到RVM回歸預測的精度。
作為一種基于距離方程的核函數(shù),高斯核函數(shù)的測試點在由源空間映射到高維特征空間后往往會變得稀疏。只有當核函數(shù)不僅能在測試點保持較快的衰減,而且在無限遠處也能保持一定的衰減時,上述情況才能得到改變。然而,高斯核函數(shù)只滿足前者,所以它是一種典型的局部核函數(shù)。近年來,很多學者通過構造高斯核函數(shù)與全局性核函數(shù)組成的混合核來提高核函數(shù)的性能[11-16],但在這個過程中又引入了多個參數(shù)變量,大大增加了RVM的計算復雜度。本文在高斯核函數(shù)的基礎上,通過構造一種改進的方差高斯核函數(shù)來提高RVM的性能。
在高斯核函數(shù)的標準形式里,所有的特征元素都利用相同的尺度因子來衡量,這一特性也使得具有大數(shù)值尺度范圍的特征要更占優(yōu)勢,這一局限性也嚴重影響了其在實用中的性能。為克服這一問題,使各特征元素進行零均值歸一化并將其標為單位標準差形式,即
(14)
式中,μi和σi是特征向量的均值與標準差。將式(14)代入標準形式,將得到的結果改寫成核函數(shù)的形式,就產(chǎn)生了一個新的核函數(shù),即
(15)
(16)
這樣構造的核函數(shù)不僅滿足前文提到的兩個條件,而且成功避免了未知參數(shù)的引入,另外在模型數(shù)據(jù)的輸入前也不需要數(shù)據(jù)的歸一化過程。文獻[17]中的研究指出,調整唯一的帶寬參數(shù)b對提高核函數(shù)的性能效果并不明顯,可以視為正態(tài)分布中的標準差σ。
實現(xiàn)時間序列{x1,x2,…,xn}預測的關鍵在于尋找到滑動時間窗口Xt={xt-1,xt-2,…,xt-m}與輸出Yt={Xt}之間的準確映射f:Rm→R,其中,t=m+1,m+2,…,n,m為預測嵌入維數(shù)。因此,參數(shù)m的確定對于預測建模的準確性至關重要。為了克服m選取的主觀盲目性,本文基于混沌時序的局域預測法[18-19]中鄰近點個數(shù)選取的思想,對RVM的訓練樣本空間最優(yōu)嵌入維數(shù)進行了優(yōu)化,該方法適合小數(shù)據(jù)量的情況,具有計算簡單和精度高的特點。
在鄰近點個數(shù)的確定過程中,本文基于H-Q準則[23],過程如下:
對d給定一個寬泛的范圍d∈[dmin,dmax],依次計算每個d值下的H-Q準則值:
(17)
(18)
導彈在進行末制導雷達單元測試后,會得到雷達多個指標的性能測試數(shù)據(jù)。傳統(tǒng)采用RVM對性能參數(shù)進行預測是通過該參數(shù)的歷史測試數(shù)據(jù)預測其未來時刻的狀態(tài)參數(shù)值,但這種預測模型太過單一,預測結果也并不能十分令人信服??紤]到在導彈的實際貯存過程中,每季度正常情況下往往會對同批次的多個導彈同時進行檢測維護,這些同一生產(chǎn)批次導彈來自相同的工業(yè)生產(chǎn)廠家,統(tǒng)一列裝部隊后一直處于相同的貯存環(huán)境下,每次進行導彈貯存檢測時都會有數(shù)枚彈一起參與測試并記錄數(shù)據(jù),也就是說,它們具有同源相近性的特點,本文統(tǒng)一稱其為同源裝備。所以,同源導彈往往具有相同的狀態(tài)退化規(guī)律,即其他導彈的性能參數(shù)變化也能從一定程度上反映待預測導彈的某一性能參數(shù)變化情況。基于以上分析,為充分利用同源導彈的性能退化數(shù)據(jù),提出了一種聯(lián)合相關向量機(united relevance vector machine, U-RVM)的預測模型。
圖2 U-RVM 預測模型Fig.2 Prediction model of U-RVM
證據(jù)融合規(guī)則可以使來自不同信息源的證據(jù)融合成為更準確可靠的信息,也是D-S證據(jù)理論的核心[25]。Dempster證據(jù)組合規(guī)則如下:設Bel1和Bel2是識別框架U上的兩個信度函數(shù),m1和m2分別是其對應的基本概率賦值(basic probability assignment,BPA),焦元分別為A1,…,Ak和B1,…,Br,則有
(19)
在預測問題中,以第3.1節(jié)提到的兩種模型構建識別框架U={f1,f2},若它們進行q次預測則產(chǎn)生證據(jù)集E=(e1,e2,…,eq),mk(fj)為第k(k=1,2,…,q)次預測后證據(jù)ek對P-RVM或C-RVM預測模型的信任程度,即對第j(j=1,2)種模型的BPA值。本文基于模型預測效果的思想設計BPA計算公式,當模型預測偏差較大時,相對應的BPA值也會越小,基于這一原則,具體計算方法為
(20)
mk(U)=0
(21)
(22)
在預測過程中,基于新陳代謝的思想,每次產(chǎn)生的新證據(jù)會與之前的證據(jù)進行動態(tài)融合,有效增強了模型對新信息的適應能力和利用率。
根據(jù)P-RVM和C-RVM的組合模型U-RVM在t+1時刻對性能參數(shù)vi進行預測:
(23)
從式(23)可以看出,權重的分配將是影響U-RVM預測結果的關鍵因素。傳統(tǒng)的基于專家經(jīng)驗的權重分配方式具有很大的主觀盲目性,所以本文利用D-S證據(jù)理論能夠根據(jù)證據(jù)累加來處理不確定性因素的優(yōu)點,通過證據(jù)集的融合處理進行權重分配,具體計算方法為
(24)
式中,ωk,j為第k次預測后第j種模型所分配的權重值;m(fj)為證據(jù)融合后的第j種模型的BPA值。
將改進的LRVM算法與U-RVM算法進行結合,構成了本文設計的U-LRVM算法,具體步驟如下。
步驟1確定某裝備待預測的I種性能指標,給定某性能指標測試序列vi=(vi,1,vi,2,…,vi,N),1≤i≤I,vi,j為j(1≤j≤N)時刻的參數(shù)值。同時確定p個同源測試裝備的性能指標矩陣
步驟2設定預測步數(shù)q。對P-RVM模型,訓練數(shù)據(jù)進行相空間重構得
C-LRVM重構后的訓練數(shù)據(jù)為
步驟5利用式(19)計算本次預測與之前預測的模型融合BPA值。
步驟6對之前的預測步數(shù)k進行判斷。若達到,則利用式(24)計算得到組合預測模型的權重ωk,j;否則返回步驟4繼續(xù)下一步預測。
U-LRVM預測算法的流程圖如圖3所示。
圖3 U-RVM算法流程圖Fig.3 Flow chart of U-RVM algorithm
雷達導引頭是導彈武器系統(tǒng)中最為復雜的關鍵設備之一,其性能狀態(tài)的優(yōu)劣直接影響到導彈的作戰(zhàn)效能能否正常發(fā)揮,因而對其進行狀態(tài)預測是十分必要的。
以某岸導團面向貯存任務的一批同源導彈為基礎,選取某導彈雷達導引頭為預測研究對象。通過對導彈定期按季度進行雷達單元測試,從2009年初至2016年9月,獲得4個關鍵參數(shù)的31組數(shù)據(jù),如表1所示。本文限于篇幅,表中只列出了部分數(shù)據(jù),同源裝備測試數(shù)據(jù)沒有列出。表1中前28組數(shù)據(jù)用于訓練學習,2016年的3組數(shù)據(jù)用于檢驗預測效果。
表1 關鍵指標參數(shù)測試數(shù)據(jù)
確定訓練嵌入維數(shù)m=3后,將訓練預測次數(shù)設定為2,運用前28組數(shù)據(jù)對P-LRVM和C-LRVM進行訓練預測,將預測結果代入式(20)、式(21),得到每次預測時兩種模型的BPA,進一步利用式(19)得到預測結束后二者的融合BPA值,將其代入式(24),得到U-LRVM中P-LRVM和C-LRVM模型的權重分配,如表2所示。
表2 權重的分配
為驗證本文所提預測方法的有效性,針對雷達導引頭的4個關鍵指標分別運用5折交叉驗證的最小二乘支持向量機(least squares-support vector machine,LS-SVM)、RVM和本文提出的U-LRVM方法進行預測,預測結果如圖4~圖7所示。
圖4 參數(shù)v1的預測曲線Fig.4 Prediction curves of parameter v1
圖5 參數(shù)v2的預測曲線Fig.5 Prediction curves of parameter v2
為了更直觀地觀察最后3組數(shù)據(jù)的預測效果,圖4~圖7的橫坐標從第15組數(shù)據(jù)開始選取,可以明顯看出,針對各關鍵指標的預測,RVM的性能都要優(yōu)于LS-SVM,這說明在預測回歸領域,RVM是一種比LS-SVM更為先進的智能學習算法。而通過對RVM進行改進并融合同源裝備的信息后,U-LRVM較傳統(tǒng)RVM取得了更佳的預測效果。為進一步對各方法的預測精度準確地進行分析,采用平均絕對百分比誤差(mean absolute percentage error, MAPE)作為預測性能評價指標,該指標避免了求和時的正負抵消問題,且不受量綱的影響,其結果如表3所示。
圖6 參數(shù)v3的預測曲線Fig.6 Prediction curves of parameter v3
圖7 參數(shù)v4的預測曲線Fig.7 Prediction curves of parameter v4
由表3可知,針對各狀態(tài)參數(shù)的預測,U-LRVM的結果MAPE都比另外兩種方法要低,這說明其預測精度顯著高于另外兩種方法,從而驗證了該預測方法的有效性和優(yōu)越性。本文設計的U-LRVM模型并沒有忽略同源裝備信息,具有較好的動態(tài)融合性,且計算簡便,有很好的工程應用前景。
下面結合預測值的置信區(qū)間討論U-LRVM方法概率式預測的意義。圖8為4個指標的預測值與其置信度為90%和95%的置信區(qū)間。
從圖8中可以看出,指標的測試真實值均落于置信度為95%的區(qū)間內,且預測值與參數(shù)實際變化趨勢也較為一致。針對點預測可能由于不可靠的預測結果而導致欠維修或過維修的嚴重后果,這種概率式的輸出可以有效規(guī)避確定性預測風險,為未來雷達導引頭健康狀態(tài)的評估及后續(xù)的維修保障決策提供更為合理有效的判斷。
圖8 各參數(shù)的預測值及置信區(qū)間Fig.8 Predicted value and the confidence interval of each parameter
通過對雷達導引頭關鍵指標進行準確地預測可以合理計劃和優(yōu)化維修活動,實現(xiàn)導彈的精細化保障目標。在分析當前狀態(tài)預測技術和相關向量機理論發(fā)展的基礎上,本文提出了U-RVM模型的雷達導引頭裝備狀態(tài)預測方法。通過設計一種新的高斯方差核函數(shù)和優(yōu)化預測訓練嵌入維數(shù)來增強RVM的泛化能力和非線性擬合能力,構建了LRVM模型。在此基礎上,通過D-S證據(jù)理論對P-LRVM和C-LRVM模型的預測結果進行了融合,建立了U-LRVM模型。該模型充分利用了具有近似退化特性的同源關聯(lián)裝備豐富的檢測信息,基于客觀預測誤差動態(tài)確定模型權重,有效避免了人為因素的干擾。實例分析結果表明,該預測方法精度更高,計算簡便,且概率式的輸出結果可以為裝備健康狀態(tài)評估提供更為可靠的判斷,其應用前景十分廣闊。
[1] 趙建忠,歐陽中輝,張磊,等.基于多智能體遺傳算法優(yōu)化的航空電子設備狀態(tài)組合預測[J].兵工學報,2016,37(4): 727-734.
ZHAO J Z, OUYANG Z H, ZHANG L, et al. Combined prediction on avionics state opimized by MAGA[J]. Acta Armamentarii, 2016, 37(4): 727-734.
[2] 李穎峰. 改進灰色模型在電力負荷預測中的應用[J]. 電網(wǎng)與清潔能源, 2009, 25(3):10-11.
LI Y F. The application of improved grey model in power system load forecast[J].Power System and Clean Energy,2009,25(3):10-11.
[3] DONG Q L. Application of support vector machine regression method in prediction of ship’s price index[J]. Ship & Ocean Engineering, 2009, 38(2): 104-106.
[4] 朱建平. 神經(jīng)網(wǎng)絡在電力負荷預測中的應用研究[J]. 科技資訊, 2015, 13(23): 32-34.
ZHU J P. Research on application of neural network in power load forecasting[J]. Science and Technology Information, 2015, 13 (23): 32-34.
[5] TIPPING M E. Sparse Bayesian learning and the relevance vector machine[J]. Journal of Machine Learning Research,2001,1: 211-244.
[6] SAMUI P, DIXON B. Application of support vector machine and relevance vector machine to determine evaporative losses in reservoirs[J].Hydrological Processes,2012,26(9):1361-1369.
[7] 雷亞國, 陳吳, 李乃鵬,等. 自適應多核組合相關向量機預測方法及其在機械設備剩余壽命預測中的應用[J]. 機械工程學報, 2016, 52(1):87-93.
LEI Y G, CHEN W, LI N P, et al. Adaptive multi kernel combined correlation vector machine prediction method and its application in prediction of residual life of mechanical equipment[J]. Journal of Mechanical Engineering, 2016, 52(1): 87-93.
[8] 馮鵬飛, 朱永生, 王培功,等. 基于相關向量機模型的設備運行可靠性預測[J]. 振動與沖擊, 2017, 36(12):146-149.
FENG P F, ZHU Y S, WANG P G, et al. Reliability prediction of equipment based on correlation vector machine model [J]. Vibration and Shock, 2017, 36(12): 146-149.
[9] 范庚,馬登武,吳明輝,等.電子系統(tǒng)狀態(tài)時間序列預測的優(yōu)化相關向量機方法[J].系統(tǒng)工程與電子技術,2013,35(9):2011-2015.
FAN G, MA D W, WU M H, et al. Optimized correlation vector machine method for prediction of state time series of electronic systems[J].Systems Engineering and Electronics,2013,35(9): 2011-2015.
[10] 周建寶. 基于 RVM 的鋰離子電池剩余壽命預測方法研究[D]. 哈爾濱: 哈爾濱工業(yè)大學, 2013.
ZHOU J B. Research on prediction method of remaining life of lithium ion battery based on RVM[D]. Harbin: Harbin Institute of Technology, 2013.
[11] YU J. A nonlinear kernel Gaussian mixture model based inferential monitoring approach for fault detection and diagnosis of chemical processes[J]. Chemical Engineering Science, 2012, 68(1): 506-519.
[12] WEI L, WEI B, WANG B. Text classification using support vector machine with mixture of kernel[J]. Journal of Software Engineering and Applications, 2013, 5(12): 55-58.
[13] MIAO S, XIE K, YANG H, et al. A mixture kernel density model for wind speed probability distribution estimation[J]. Energy Conversion and Management, 2016, 126: 1066-1083.
[14] LIU K H, LIN Y Y, CHEN C S. Linear spectral mixture analysis via multiple-kernel learning for hyperspectral image classification[J]. IEEE Trans.on Geoscience and Remote Sensing, 2015, 53(4): 2254-2269.
[15] YU J, CHEN K, MORI J, et al. A Gaussian mixture copula model based localized Gaussian process regression approach for long-term wind speed prediction[J].Energy,2013,61(6):673-686.
[16] OHISHI Y, MOCHIHASHI D, KAMEOKA H, et al. Mixture of Gaussian process experts for predicting sung melodic contour with expressive dynamic fluctuations[C]∥Proc.of the IEEE International Conference on Acoustics, Speech and Signal Processing, 2014: 3714-3718.
[17] REMAKI L, CHERIET M. KCS-new kernel family with compact support in scale space: formulation and impact[J]. IEEE Trans.on Image Processing, 2000, 9(6): 970-981.
[18] LI H C, ZHANG J S. Local prediction of chaotic time series based on support vector machine[J]. Chinese Physics Letters, 2005, 22(11): 2776-2779.
[19] 杜杰,曹一家,劉志堅,等.混沌時間序列的局域高階Volterra濾波器多步預測模型[J].物理學報,2009,58(9):5997-6005.
DU J, CAO Y J, LIU Z J, et al. A multi-step prediction model of local high order Volterra filters with chaotic time series[J]. Acta Physica Sinica, 2009, 58(9): 5997-6005.
[20] MENG Q F, CHEN Y H, FENG Y H. Small-time scale network traffic prediction based on a local support vector machine regression model[J]. Chinese Physics B, 2009, 18(6): 2194-2199.
[21] BING Q, GONG B, YANG Z, et al. Short-term traffic flow local prediction based on combined kernel function relevance vector machine model[J]. Mathematical Problems in Engineering, 2015, 154703: 1-9.
[22] MENG Q F, CHEN Y H, FENG Y H, et al. Nonlinear prediction of small scale network traffic based on local relevance vector machine regression model[J]. Acta Physica Sinica, 2013,62(15):150-189.
[23] HANNAN E J, QUINN B G. The determination of the order of an autoregression[J].Journal of the Royal Statistical Society, Series B (Methodological), 1979,41(2): 190-195.
[24] 孟慶芳, 彭玉華, 曲懷敬, 等. 基于信息準則的局域預測法鄰近點的選取方法[J]. 物理學報, 2008, 57(3): 1423-1430.
MENG Q F, PENG Y H, QU H J, et al. Local information criterion prediction selection method based on the adjacent point[J]. Acta Physisc Sinica, 2008, 57 (3): 1423-1430.
[25] 蘇曉燕. 關聯(lián)證據(jù)融合研究[D]. 上海:上海交通大學, 2014.
SU X Y. Study on correlation evidence fusion[D]. Shanghai: Shanghai Jiaotong University, 2014.