張敏龍 王濤 王旭平 常紅偉 王放
摘要:針對滑動窗自適應核主元分析法(KPCA)在處理參數敏感和緩慢劣化問題時存在的“過適應”現象,容易產生漏報的問題,提出了一種分步動態(tài)自回歸KPCA算法。首先,借鑒動態(tài)數據矩陣思想,分步建立初始模型;然后,在滑動窗自適應KPCA的基礎上,引入指數加權法則處理實時數據、更新模型;最后,分析算法復雜度,并給出具體實現步驟。利用模擬數據分析分解系數和加權因子對算法的影響,結果表明,與滑動窗自適應KPCA相比,所提方法在參數選擇恰當的情況下,模型效率提高了近90%,誤報次數幾乎降為0,還能通過調整加權因子取值來控制算法的適應能力,以解決多樣化的動態(tài)問題。將算法應用于壓縮機喘振和軸承故障實驗數據分析,驗證了所提算法處理參數敏感和緩慢劣化問題的能力。
關鍵詞:核主元分析;滑動窗;分步動態(tài)策略;指數加權;故障診斷
中圖分類號:TP277 文獻標志碼:A
Abstract:There are overfitting phenomenon and prone omissions when moving window adaptive Kernel Principal Component Analysis (KPCA) is utilized to deal with sensitive parameters or slow degradation problem. In order to solve the problem, a step dynamic autoregression KPCA was proposed. Firstly, the initial model was established step by step drawing on dynamic data matrix. Then, the exponentially weighting rule was introduced to process realtime data and update the model based on the moving window adaptive KPCA. Finally, the algorithm complexity was analyzed and specific steps were given. The simulation data was utilized to analyze the impact of decomposition coefficient and weighting factor. The results show that, compared with the moving window adaptive KPCA, the proposed algorithm efficiency was improved by nearly 90% and the number of false positives was almost 0 in the case of appropriate parameter selection; and it could also control the adaptive ability to solve a variety of dynamic problems by adjusting the value of weighting factor. The algorithm was applied to the experimental data analysis of compressor surge and bearing fault, the result verified its ability to deal with the problem of sensitive parameter and slow degradation.
Key words:Kernel Principal Component Analysis (KPCA); moving window; step dynamic strategy; exponentially weighting; fault diagnosis
0 引言
Schlkopf等[1]提出的核主元分析法(Kernel Principal Component Analysis, KPCA)是一種非線性數據處理方法,目前已經在入侵檢測、圖像處理、過程監(jiān)控、故障診斷等領域得到了成功應用[2-5]。但傳統(tǒng)KPCA建立在靜態(tài)模型的基礎上,存在模型訓練完成后不能改變的缺陷,應用于動態(tài)時變系統(tǒng)中可能會出現大量誤報、漏報問題。
為此,近年來研究者們相繼提出了一些動態(tài)KPCA方法。文獻[6]結合滑動窗機制提出了一種自適應動態(tài)KPCA方法,使模型能夠適應時變系統(tǒng)的參數漂移,并成功應用于航空發(fā)動機的故障動態(tài)監(jiān)測中。該方法實時性好、自適應性強、模型更新周期可控,適用于跟蹤設備正常狀態(tài)的漂移,同時能夠減少誤報的發(fā)生。但該方法刻板地使用實時數據替換原始數據,缺少對適應性的控制,在推廣到處理設備參數敏感和緩慢劣化問題時會出現“過適應”,影響算法效果,存在漏報的可能。
針對上述問題,本文借鑒文獻[7]的動態(tài)數據矩陣思想,在滑動窗自適應KPCA的基礎上,引入文獻[8]的指數加權法則,提出一種分步動態(tài)自回歸核主元分析法(Step Dynamic AutoRegression KPCA,SDAR_KPCA)。該方法首先將訓練樣本分解擴展,分兩步提取數據的相關關系,減小核矩陣規(guī)模和計算復雜度;然后根據動態(tài)數據,加權更新核矩陣,調節(jié)加權因子以適應不同類型動態(tài)系統(tǒng)的要求,降低誤報、漏報概率;最后利用模擬數據驗證算法的快速性和自回歸性,并將算法應用于壓縮機喘振過程信號和IMS(Intelligent Maintenance System)軸承故障實驗數據的分析。
1 分步動態(tài)自回歸核主元分析法
1.1 算法基本思想
文獻[7]指出,對于動態(tài)系統(tǒng),實時觀測數據與過去時刻觀測數據是緊密聯系的,利用靜態(tài)KPCA模型難以獲取數據之間的相關關系,并針對這一問題提出分步動態(tài)策略:首先對數據樣本在時間方向上進行擴充,構造數據增廣矩陣,然后利用核主元分析提取數據的空間相關關系,最后利用主元分析(Principal Component Analysis,PCA)提取數據的時間相關關系,分兩步獲取動態(tài)數據之間的相關性。
滑動窗機制利用實時采集的正常樣本替換相同數量的原始樣本,重新生成正常樣本集,建立新模型進行檢測,以達到控制模型更新頻率和適應實時數據變化的目的。對滑動窗數據使用分步動態(tài)策略,記滑動窗寬度為ω,滑動步長為s,當前窗口數據為{xi}ωi=1∈Rm,定義分解系數為D,利用當前窗口樣本數據構建增廣矩陣X(D):
按列分解矩陣X(D),再先后進行KPCA和PCA分析,建立模型?;瑒哟懊看我圆介Ls向前滑動,依次在各窗口更新模型。然而滑動窗機制刻板地使用實時數據替換原始數據,沒有考慮原始數據信息,在模型多次更新后,可能會出現偏離現象,增大誤報、漏報幾率。更糟糕的是,在處理對象參數敏感或設備緩慢劣化問題時,滑動窗自適應KPCA對動態(tài)數據變化適應過度,會出現類似于“過學習”的現象,以至于無法準確辨別這兩類問題的發(fā)生。
其中γ∈[0,1]表示加權因子。γ的大小在模型更新時刻畫了算法對不同時刻數據樣本的重視程度,也反映了對實時樣本的適應能力??梢愿鶕煌瑔栴}要求,選取合適的γ,以滿足相應的診斷目的。
1)γ越大,則原始樣本具有較大權重,表示算法越重視原始樣本,對實時樣本的適應能力越弱。特別地,當γ=1時,表示未對核矩陣進行更新,也就是不更新模型樣本數據,沒有適應能力,相當于靜態(tài)KPCA。對于參數敏感的問題,適合選擇較大的γ,當動態(tài)系統(tǒng)參數一旦發(fā)生漂移,就能夠被及時察覺。
2)γ越小,則新樣本具有較大權重,表示算法越重視實時樣本,對實時樣本的適應能力越強。特別地,當γ=0時,表示核矩陣直接更新,沒有使用原始數據進行加權,相當于滑動窗自適應KPCA。對于設備緩慢劣化的問題,應盡量選擇較小的γ,使算法具有較強的適應能力,在一定范圍內適應設備參數的漂移,γ的具體取值視設備狀態(tài)變化特點而定。
1.2 算法步驟
1)離線訓練。
步驟1
收集正常樣本集X,用于初始KPCA模型的建立。設定分解系數D,滑動窗寬度ω,滑動步長s,加權因子γ,累計數k置零。計算窗口數據的均值和標準差,并進行標準化處理。
步驟2
2 仿真與應用分析
2.1 仿真分析
設備運行時往往會發(fā)生狀態(tài)漂移,根據設備類型、工作環(huán)境、應用場合等不同,會將不同程度的狀態(tài)漂移情況視為故障。為方便描述,本文使用一維模擬數據進行仿真分析,該數據以正態(tài)分布的隨機信號為基礎,通過調整均值和標準差,模擬設備從正常狀態(tài)到出現漂移直至劣化的過程,如圖1所示,把漂移過程的任何位置都認為是可能的故障起始點。
由表1可以看出,SDAR_KPCA的離線訓練用時與滑動窗自適應KPCA相比并無明顯優(yōu)勢,在分解系數D小于80后,訓練時間甚至比滑動窗自適應KPCA還長。但從在線檢測更新時間上看,使用較大的分解系數時后,本文算法耗時遠小于滑動窗自適應KPCA,而且D越大,更新時解算的核矩陣規(guī)模就越小,耗時也就越短,說明SDAR_KPCA算法能夠提高模型更新效率。
圖2自上而下分別是SDAR_KPCA在D取95、90、80時以及滑動窗自適應KPCA的SPE統(tǒng)計量監(jiān)控結果。由圖2可見,SDAR_KPCA算法在D取90或80時,和滑動窗自適應KPCA一樣,統(tǒng)計量能適應數據的漂移;但當SDAR_KPCA分解系數D取95時,SPE的監(jiān)控結果很不理想,這是由于分解后每個子矩陣的訓練樣本數過少,導致不能從統(tǒng)計意義上構成協(xié)方差矩陣,進而影響了模型的監(jiān)測效果, 因此,選取分解系數D時要綜合考慮快速性和準確性的影響,在不影響準確性的情況下,讓D盡量接近滑動窗寬度ω的值。
2.1.2 自回歸性驗證
固定分解系數D=90,然后令SDAR_KPCA取不同加權因子γ進行在線監(jiān)測。圖3(a)~(c)分別是γ取0.2、0.8和1時的SPE監(jiān)控結果,表2記錄了部分γ取值的SPE超限位置以及狀態(tài)漂移前的誤報次數。
從圖3和表2可以看出,γ取值越小,SPE統(tǒng)計量的超限位置越靠后,算法對狀態(tài)漂移的適應能力越強,在γ接近于0時,統(tǒng)計量甚至不會越限。隨著γ取值不斷增大,SPE超限位置前移,特別是γ接近于1時,數據狀態(tài)一發(fā)生漂移,統(tǒng)計量就會越限。說明SDAR_KPCA模型能夠保留原始數據信息,具有自回歸性,而且可由γ的大小控制模型的適應能力,使之對不同問題具有適用性。
另外,當γ取值過大時,狀態(tài)漂移前就出現了少量誤報問題,這是由于模型不更新或更新時新樣本的權值太小所引起的,此時SDAR_KPCA的性能退化至與靜態(tài)KPCA相當。
2.2 應用分析
下面,利用SDAR_KPCA分別對兩種不同類型的實際故障數據進行分析。
1)壓縮機喘振過程信號分析。
分析250kW單級離心壓縮機從正常到喘振的發(fā)展過程,實驗轉速為13570rpm,采樣頻率為150Hz,采樣點數為2048,調節(jié)節(jié)流閥讓壓縮機發(fā)生喘振,得到進口總壓和出口靜壓信號如圖4所示[10]。
喘振現象對離心壓縮機危害巨大,必須對喘振先兆作出及時準確辨別,一旦發(fā)生參數漂移就能立即報警,屬于參數敏感問題,所以選擇較大的γ。將壓力信號合成二維數據,選取滑動窗寬度ω=200,分解系數D=180,滑動步長s=10,核參數σ=5m/2=2.24,主元控制限為0.85,統(tǒng)計量控制限的置信度為99%,圖5顯示了加權因子γ=0.9時SPE的監(jiān)控結果。
圖5表明,在壓縮機平穩(wěn)運行時,SPE未出現超限情況,在壓縮機進出口壓力參數發(fā)生漂移瞬間,SDAR_KPCA模型及時給出了報警信息,實現了喘振先兆的準確識別。但是,報警后出現了大量“漏檢”點,這是由于沒有進行特征提取,而樣本點的壓力信息恰好與正常狀態(tài)相符引起的。
2)IMS軸承故障實驗數據分析。
數據來自美國辛辛那提大學IMS中心的軸承故障實驗[11],實驗中4個滾動軸承同軸安裝,1#、4#軸承固定在實驗臺上,2#、3#軸承通過彈簧機構施加6000lb恒定徑向負載,轉速保持2000rpm,并在每個軸承上設置兩個PCB 353B33型振動傳感器,分別測量軸承水平和垂直振動信號。
實驗從2004年2月12日10:32:29持續(xù)到2月19日06:22:39,每隔10min利用NI DAQ 6062E信號采集平臺記錄各軸承的垂直振動信號,采樣頻率為20kHz,采樣點數為20480,共有984段4維信號數據。計算每段數據的時域統(tǒng)計指標作為原始特征,具體同上節(jié)模擬數據的10類指標,共得984點40維特征。選取滑動窗寬度ω=100,分解系數D=90,滑動步長s=10,核參數σ=5m/2=10,主元控制限為0.85,統(tǒng)計量控制限的置信度為99%,圖6為加權因子γ分別取0.8和0.2時SPE的監(jiān)控結果。
當γ=0.8時,SPE在第703點處超出控制限,對該段原始信號進行包絡分析,發(fā)現1#軸承的狀態(tài)開始出現漂移,但仍處于正常工作范圍。當γ=0.2時,統(tǒng)計量在最后幾個特征點處才發(fā)生越限,此時的包絡譜表明1#軸承的外圈處于故障狀態(tài),最后停機檢查發(fā)現1#軸承外圈存在裂紋。實驗記錄了軸承外圈緩慢劣化的過程,通過設置較小的加權因子γ如0.2,SDAR_KPCA模型能夠準確判斷出故障的發(fā)生。而設置較大的γ如0.8,則可以識別出狀態(tài)漂移的起始位置, 因此,可以設置雙層甚至多層SDAR_KPCA模型,形成層級報警器,可以得到更精確的診斷結論。
3 結語
本文借鑒分步動態(tài)策略,在滑動窗自適應KPCA中引入指數加權法則,提出了SDAR_KPCA算法,利用模擬數據驗證了算法效果,并將其成功應用于壓縮機喘振故障和IMS軸承故障診斷,主要結論如下:
1)SDAR_KPCA降低了算法復雜度,提高了模型更新效率,在保證準確性的前提下,讓分解系數盡量接近滑動窗寬度的值,可以實現動態(tài)數據的快速診斷。
2)SDAR_KPCA實現了模型的自回歸更新,根據實際問題選擇合適的加權因子,調節(jié)原始數據和動態(tài)數據的權重,能夠得到良好的診斷結果。
3)通過設置不同加權因子建立雙層甚至多層SDAR_KPCA模型,能形成層級報警器,從而達到更詳實診斷的目的。
參考文獻:
[1]SCHLKOPF B, SMOLA A, MLLER K R. Nonlinear component analysis as a kernel eigenvalue problem [J]. Neural Computation, 1998, 10(5): 1299-1319.
[2]余文利,余建軍,方建文.一種新的基于KPCA和改進εSVM的入侵檢測模型[J].計算機工程與應用,2015,51(11): 93-98. (YU W L, YU J J, FANG J W. Novel intrusion detection model based on KPCA and improved εSVM [J]. Computer Engineering and Applications, 2015, 51(11): 93-98.)
[3]LIN C, PENG F, WANG BH, et al. Research on PCA and KPCA selffusion based MSTARSAR automatic target recognition algorithm [J]. Journal of Electronic Science and Technology, 2012, 10(4): 352-357.
[4]JIANG Q C, YAN X F. Statistical monitoring of chemical processes based on sensitive kernel principal components [J]. Chinese Journal of Chemical Engineering, 2013, 21(6): 633-643.
[5]張恒,趙榮珍.故障特征選擇與特征信息融合的加權KPCA方法研究[J].振動與沖擊,2014,33(9):89-93,121. (ZHANG H, ZHAO R Z. Weighted KPCA based on fault feature selection and feature information fusion [J]. Journal of Vibration and Shock, 2014, 33(9): 89-93, 121.)
[6]胡金海,李應紅,楊帆,等.一種基于自適應核主元分析的故障檢測方法[J].控制工程,2007,14(S1):80-83. (HU J H, LI Y H, YANG F, et al. A fault detection method based on kernel principal component analysis [J].Control Engineering of China, 2007, 14(S1): 80-83.)
[7]CHOI S W, LEE I B. Nonlinear dynamic process monitoring based on dynamic kernel PCA [J]. Chemical Engineering Science, 2004, 59(24): 5897-5908.
[8]WOLD S. Exponentially weighted moving principal component analysis and projection to latent structures [J]. Chemometrics and Intelligent Laboratory Systems, 1994, 23(1): 149-161.【Proceedings of the 3rd Scandinavian Symposium on Chemometrics (SSC3)】
[9]姜萬錄,吳勝強,劉思遠.指數加權動態(tài)核主元分析法及其在故障診斷中應用[J].機械工程學報,2011,47(3):63-68. (JIANG W L, WU S Q, LIU S Y. Exponentially weighted dynamic kernel principal component analysis algorithm and its application in fault diagnosis [J].Journal of Mechanical Engineering, 2011, 47(3): 63-68.)
[10]張慶. 基于核方法的機械設備動態(tài)監(jiān)測診斷模型與關鍵技術研究[D]. 西安:西安交通大學, 2007. (ZHANG Q. Research on the dynamical model and its key techniques for condition monitoring and fault diagnosis of mechanical equipments based on kernel methods [D]. Xian: Xian Jiaotong University, 2007.)
[11]LEE J, QIU H, YU G, et al. ‘Bearing Data Set, IMS, University of Cincinnati. NASA Ames Prognostics Data Repository, NASA Ames, Moffett Field, CA [EB/OL]. [2015-07-20]. http://ti.arc.nasa.gov/projects/data_prognostics/.
[12]QIU H, LEE J, LIN J, et al. Wavelet filterbased weak signature detection method and its application on rolling element bearing prognostics [J]. Journal of Sound and Vibration, 2006, 289(4/5): 1066-1090.