Combined Prediction Based on EMD for Instrument Stability
程雙江 李世平 鄔肖敏
(第二炮兵工程大學(xué),陜西 西安 710025)
基于EMD的儀器穩(wěn)定度組合預(yù)測
Combined Prediction Based on EMD for Instrument Stability
程雙江李世平鄔肖敏
(第二炮兵工程大學(xué),陜西 西安710025)
摘要:為更好地把握儀器的性能變化規(guī)律,規(guī)避其可能帶來的各種風(fēng)險,將預(yù)測理論應(yīng)用到儀器穩(wěn)定度預(yù)測中,建立了一種基于EMD-SVM的穩(wěn)定度組合預(yù)測模型。首先利用EMD方法對穩(wěn)定度數(shù)據(jù)進(jìn)行分解,然后對分解得到的數(shù)據(jù)選擇一種預(yù)測模型進(jìn)行預(yù)測,最后再把所有這些分解數(shù)據(jù)的預(yù)測結(jié)果輸入到SVM中進(jìn)行組合預(yù)測。通過與移動平均模型、自回歸積分滑動平均(ARIMA)模型和線性組合預(yù)測模型的預(yù)測結(jié)果相比較,驗證了該方法的有效性。
第一作者程雙江(1989-),男,現(xiàn)為第二炮兵工程大學(xué)儀器與科學(xué)技術(shù)專業(yè)在讀碩士研究生;主要從事預(yù)測方面的研究。
關(guān)鍵詞:儀器穩(wěn)定度經(jīng)驗?zāi)B(tài)分解(EMD)支持向量機(SVM)組合預(yù)測預(yù)測精度
Abstract:In order to better grasp the regular pattern of the performance variation of the instruments, and to evade various risks may occur, the prediction theory is applied in the prediction of instrument stability, and the combined prediction model based on EMD-SVM is built. Firstly, the data of stability are decomposed by adopting EMD method; then a prediction model is selected from the data obtained by decomposition for predicting; finally all the predicted results of decomposed data are put into SVM for combined prediction. The comparison of the predictive results from moving average model, autoregressive integrated moving average (ARIMA) model and linear combination forecasting model, proves the effectiveness of this method.
Keywords:InstrumentStabilityEmpirical mode decomposition(EMD)Support vetor machine(SVM)Combined predictionPrediction accuracy
0引言
儀器作為人類認(rèn)識世界必不可少的工具,如今已被廣泛應(yīng)用于我們生活的各個領(lǐng)域。但是儀器在給社會帶來巨大利益的同時,其自身也會出現(xiàn)一系列的問題,如果不注意這些問題,帶來的損失同樣不可估量。因此,依據(jù)儀器性能指標(biāo)參數(shù)的歷史數(shù)據(jù),對其未來可能的發(fā)展趨勢作出預(yù)測就顯得格外重要。對于如今的高精度智能儀器而言,穩(wěn)定度指標(biāo)已經(jīng)逐步成為用戶最關(guān)心的話題,因此本文對儀器穩(wěn)定度數(shù)據(jù)進(jìn)行研究,具備更大的工程與現(xiàn)實意義。
目前,關(guān)于預(yù)測的研究很多[1-3],但主要還是組合預(yù)測,比如基于神經(jīng)網(wǎng)絡(luò)的組合預(yù)測、基于支持向量機(support vector machine,SVM)的組合預(yù)測等。其中,SVM在解決小樣本、過擬合和維數(shù)災(zāi)變等問題中具有不可比擬的優(yōu)勢[4-6],因此本文選擇了基于SVM的組合預(yù)測模型對穩(wěn)定度數(shù)據(jù)進(jìn)行預(yù)測。首先利用經(jīng)驗?zāi)B(tài)分解(empirical mode decapmosition,EMD)方法對穩(wěn)定度數(shù)據(jù)進(jìn)行分解,然后對分解得到的3種不同類型的數(shù)據(jù)分別采用多項式模型、BP神經(jīng)網(wǎng)絡(luò)模型和自回歸積分滑動平均(autoregressive integrated moving average,ARIMA)模型進(jìn)行單獨預(yù)測,最后再將單獨預(yù)測的結(jié)果輸入到SVM中進(jìn)行組合預(yù)測,最終建立了基于EMD-SVM的組合預(yù)測模型。
1EMD方法和SVM簡介
EMD是將非平穩(wěn)、非線性信號分解成一系列表征信號特征時間尺度的IMF,使得每個IMF是單分量的幅值或頻率調(diào)制信號。簡單來說,就是將原始信號中不同尺度的波動或趨勢項逐級分解,產(chǎn)生一系列具有不同特征尺度的數(shù)據(jù)序列,每一個序列就是一個IMF。
相比于小波分解等其他信號分解方法而言,EMD在信號分解過程中分解的基函數(shù)是不確定的。EMD依據(jù)的是信號本身的局部信息特征進(jìn)行自適應(yīng)分解,不需要預(yù)先設(shè)定基函數(shù),也無需信號的任何先驗知識。因此,EMD具有更好的自適應(yīng)性,在處理非線性、非平穩(wěn)信號方面具備更大優(yōu)勢[7-8]。對信號x進(jìn)行EMD分解的具體步驟如圖1所示,其實質(zhì)就是一個篩選過程,通過一個停止準(zhǔn)則對IMF進(jìn)行不間斷的篩選。
圖1 EMD流程圖
支持向量機(SVM)是基于統(tǒng)計學(xué)習(xí)理論發(fā)展起來的一種新型機器學(xué)習(xí)方法,它建立在統(tǒng)計學(xué)習(xí)理論的VC維和結(jié)構(gòu)風(fēng)險最小化的理論基礎(chǔ)之上。由于SVM在一定程度上克服了“維數(shù)災(zāi)難”和“過學(xué)習(xí)”等困難,并且在解決小樣本問題上具有不可比擬的優(yōu)勢,因此目前SVM已被廣泛應(yīng)用于模式識別、函數(shù)逼近、數(shù)據(jù)挖掘和非線性系統(tǒng)控制等領(lǐng)域中[9-11]。
SVM預(yù)測的本質(zhì)是通過非線性變換,將非線性問題映射到高維特征空間中,從而轉(zhuǎn)換為線性問題進(jìn)行求解。
SVM預(yù)測可表示為如下二次規(guī)劃問題。
(1)
約束條件:
(2)
式中:n為樣本總數(shù);ξi,ξi*為松弛因子;C為懲罰因子。
考慮到直接對此式進(jìn)行求解存在一定的困難,為此引入拉格朗日因子,將其轉(zhuǎn)化為凸二次規(guī)劃問題求解。
(3)
那么SVM函數(shù)就可以表示為:
(4)
引入核函數(shù)K(xi,xj),將其轉(zhuǎn)化到高維特征空間中,用K(xi,xj)代替ψ(xi)ψ(xj),則式(4)可以轉(zhuǎn)化為式(5)進(jìn)行求解。
(5)
這樣就實現(xiàn)了數(shù)據(jù)從低維到高維之間的數(shù)據(jù)轉(zhuǎn)換(非線性映射),達(dá)到樣本學(xué)習(xí)的目的。
2基于EMD-SVM的組合預(yù)測原理
假設(shè)EMD分解后得到的信號為IMF1、IMF2和RES,那么基于EMD-SVM的原理圖如圖2所示。
圖2 EMD-SVM組合預(yù)測原理圖
組合預(yù)測方法是建立在多種單一預(yù)測模型基礎(chǔ)之上的。組合預(yù)測的理論已經(jīng)證明,多種單一模型的組合在一定的條件下能更有效地改善模型的擬合能力,提高預(yù)測精度[12]。而要想提高最終的組合預(yù)測模型的預(yù)測精度,單一模型的預(yù)測好壞是前提,因此必須首先選擇恰當(dāng)?shù)膯我荒P瓦M(jìn)行預(yù)測。
要建立基于EMD-SVM的組合預(yù)測模型,首先需要采用EMD方法對原始穩(wěn)定度數(shù)據(jù)進(jìn)行分解,得到相對較為簡單的分解數(shù)據(jù),比如說趨勢項、周期項、隨機項等;其次再針對這些分解得到的數(shù)據(jù)分別選用精度較高的預(yù)測方法;最后再將這些分解信號的單一模型預(yù)測結(jié)果輸入到SVM中進(jìn)行非線性組合,實現(xiàn)基于EMD-SVM的組合預(yù)測。
如圖2所示,假設(shè)經(jīng)過EMD分解后得到的信號有3個,那么就分別采用一種預(yù)測方法進(jìn)行針對性的預(yù)測,得到的預(yù)測結(jié)果分別為y1、y2、y3。非線性組合的預(yù)測結(jié)果可以表示為:
y=F(y1,y2,y3)
(6)
式中:F為SVM組合預(yù)測函數(shù)。
這樣就基本實現(xiàn)了針對儀器穩(wěn)定度數(shù)據(jù)這類非線性、非平穩(wěn)時間序列的分解,單一預(yù)測到組合預(yù)測的整體過程。
3基于EMD-SVM的儀器穩(wěn)定度預(yù)測
計量標(biāo)準(zhǔn)儀器不僅需要作為檢定其他儀器設(shè)備的依據(jù),作為中間環(huán)節(jié),還需要將測量結(jié)果在允許的范圍內(nèi)溯源到國家計量基準(zhǔn)。因此,對計量標(biāo)準(zhǔn)儀器進(jìn)行預(yù)測研究具備更大的工程與現(xiàn)實意義。同時,鑒于高穩(wěn)時頻晶振的穩(wěn)定度指標(biāo)在使用的過程中尤為重要,本文的仿真試驗采用的是某計量站高穩(wěn)時頻晶振計量標(biāo)準(zhǔn)儀器的穩(wěn)定度數(shù)據(jù)。
數(shù)據(jù)來源于該儀器每年一次的上級單位檢定數(shù)據(jù)(作為第一季度數(shù)據(jù)),以及兩次檢定期間該計量站計量員利用更高精度的計量標(biāo)準(zhǔn)每季度進(jìn)行一次的檢定數(shù)據(jù)(第一季度除外)。從2002年到2012年總共44個數(shù)據(jù)點,以2002~2011年的40個數(shù)據(jù)點進(jìn)行穩(wěn)定度擬合,建模預(yù)測2012年4個季度的穩(wěn)定度值,然后進(jìn)行結(jié)果比對分析,如表1所示。
表1 高穩(wěn)時頻晶振2002~2012年穩(wěn)定度值
首先進(jìn)行EMD分解,分解結(jié)果如圖3所示。EMD分解得到了IMF1、IMF2和RES三個分量,其中IMF1和IMF2為IMF分量,RES為剩余分量。經(jīng)過計算得到分解造成的各點的累計誤差和為-1.77×10-15,相比于預(yù)測誤差可以忽略不計。從圖3可以看出,IMF1變化規(guī)律較為復(fù)雜,因此預(yù)測起來也相對比較困難,需要著重考慮。最終通過比較選擇了效果較好的ARIMA模型進(jìn)行預(yù)測。IMF2為近似周期項,預(yù)測較為簡單,本文采用的是BP網(wǎng)絡(luò)對其進(jìn)行預(yù)測。RES可以認(rèn)為是趨勢項,預(yù)測更為簡單,直接選用傳統(tǒng)的多項式模型進(jìn)行預(yù)測。
圖3 EMD分解結(jié)果
首先對IMF1進(jìn)行預(yù)測,然后再依次對IMF2和RES進(jìn)行預(yù)測。對IMF1進(jìn)行預(yù)測時,由于變化規(guī)律比較復(fù)雜,采用ARIMA模型進(jìn)行預(yù)測。首先需要進(jìn)行去平穩(wěn)化差分處理,然后再進(jìn)行模型的定階,模型的定階通過AIC準(zhǔn)則確定,最終設(shè)定的模型參數(shù)(p,d,q)為(1,1,3),用前40個數(shù)據(jù)點進(jìn)行擬合,最終得到的擬合曲線如圖4所示。從圖4可以看出,ARIMA模型對IMF1擬合效果相對較好。
圖4 IMF2擬合
對IMF2和RES進(jìn)行建模,采用BP網(wǎng)絡(luò)模型和多項式模型得到的擬合曲線分別如圖5和圖6所示。從圖5和圖6可以看出,擬合精度更高。
圖5 IMF2擬合曲線
圖6 RES擬合曲線
采用ARIMA模型、BP網(wǎng)絡(luò)模型和多項式模型分別實現(xiàn)了IMF1、IMF2和RES的建模擬合。將建立的模型用于后4個點數(shù)據(jù)預(yù)測,與EMD分解后得到的IMF1、IMF2和RES后4個數(shù)據(jù)點的實際值進(jìn)行比較,結(jié)果如表2所示。
表2 單一模型后4個數(shù)據(jù)點預(yù)測結(jié)果
從表2可以看出,單一模型預(yù)測效果較好,僅僅對IMF1進(jìn)行預(yù)測時預(yù)測誤差相對稍大,因此可以將3種單一模型預(yù)測結(jié)果作為輸入,利用RBF核函數(shù)SVM進(jìn)行非線性組合預(yù)測,采用遺傳算法(genetic algorithm,GA)對SVM參數(shù)進(jìn)行尋優(yōu),得到的最優(yōu)懲罰因子C和核函數(shù)參數(shù)δ分別為88.35和11.47,那么最終建立的基于SVM的非線性組合預(yù)測結(jié)果如圖7所示。圖7中,前40個為擬合數(shù)據(jù),后4個為預(yù)測數(shù)據(jù)。
圖7 基于EMD-SVM的組合預(yù)測
從圖7可以看出,EMD方法預(yù)測效果較好,精度較高。為了更直觀地觀測其預(yù)測效果,將2012年后4個季度的穩(wěn)定度預(yù)測值以具體數(shù)值展現(xiàn)。同時,為了驗證該EMD-SVM預(yù)測模型的有效性,分別與單一的移動平均模型、ARIMA模型和線性組合預(yù)測模型的預(yù)測結(jié)果進(jìn)行了比較,結(jié)果如表3所示。
表3 幾種模型預(yù)測結(jié)果
以平均相對誤差作為衡量標(biāo)準(zhǔn),經(jīng)過計算,4種模型的平均預(yù)測相對誤差分別為26.5%、2.94%、1.97%和1.4%??梢钥闯?,組合預(yù)測模型相對與單一預(yù)測模型而言,預(yù)測精度得到了大幅提升,而基于EMD-SVM的非線性組合預(yù)測模型相比線性組合預(yù)測模型,精度更高。因此,可以認(rèn)為對高穩(wěn)時頻晶振儀器穩(wěn)定度數(shù)據(jù)進(jìn)行預(yù)測時,采用EMD-SVM的非線性組合預(yù)測模型效果較好。
4結(jié)束語
基于儀器設(shè)備在現(xiàn)實生活中發(fā)揮的巨大作用,為了規(guī)避其可能帶來的風(fēng)險,本文就儀器穩(wěn)定度數(shù)據(jù)展開分析,結(jié)合歷史數(shù)據(jù)對其可能出現(xiàn)的規(guī)律進(jìn)行預(yù)測,
實現(xiàn)了基于EMD-SVM的儀器穩(wěn)定度非線性組合預(yù)測。仿真結(jié)果表明,該方法預(yù)測效果較好、精度較高。對儀器穩(wěn)定度數(shù)據(jù)的預(yù)測,對于指導(dǎo)企業(yè)生產(chǎn)、避免各類事故發(fā)生等具有重大的現(xiàn)實意義,但還有待于進(jìn)一步的研究探索。
參考文獻(xiàn)
[1] 高寧,崔希民,高彩云.灰時序GM-AR模型在建筑物沉降變形預(yù)測中的應(yīng)用[J].測繪科學(xué),2013,38(1):139-141.
[2] 華靜,艾莉,程加堂.神經(jīng)網(wǎng)絡(luò)組合模型在大壩位移預(yù)測中的應(yīng)用[J].科學(xué)技術(shù)與工程,2013,2(4):1091-1093.
[3] 周偉萍,王豐效.灰色DNGM(1,1)預(yù)測模型及其優(yōu)化[J].計算機工程與應(yīng)用,2013,49(10):28-31.
[4] 甘旭升,端木京順,叢偉,等.基于ARIMA與SVM的飛行事故組合預(yù)測方法[J].中國安全科學(xué)學(xué)報,2011,21(7):79-81.
[5] 陳濤.基于DE-SVM非線性組合預(yù)測模型的研究[J].計算機工程與應(yīng)用,2011,47(13):33-36.
[6] 朱莎,劉曉.小波分析和支持向量機組合法預(yù)測應(yīng)急血液需求研究[J].中國安全科學(xué)學(xué)報,2013,23(5):166-170.
[7] 余偉凱.EMD時頻分析方法的理論研究與應(yīng)用[D].秦皇島:燕山大學(xué),2006.
[8] 王婷.EMD算法研究及其在信號去噪中的應(yīng)用[D].哈爾濱:哈爾濱工程大學(xué),2010.
[9] 張偉,李泓儀,蘭書梅,等.GA-SVM對上證綜指走勢的預(yù)測研究[J].東北師范大學(xué)學(xué)報,2012,44(1):55-59.
[10]顧亞祥,丁世飛.支持向量機研究進(jìn)展[J].計算機科學(xué),2011,38(2):14-17.
[11]張捍東,張莉,湯敏.云模型優(yōu)化LSSVR的短期電力負(fù)荷預(yù)測[J].自動化儀表,2013,34(11):1-5.
[12]陳華友.組合預(yù)測方法有效性理論及其應(yīng)用[M].北京:科學(xué)出版社,2008.
中圖分類號:TH71
文獻(xiàn)標(biāo)志碼:A
DOI:10.16086/j.cnki.issn1000-0380.201501007
修改稿收到日期:2014-06-11。