石懷濤, 宋文麗, 張 珂, 譚 帥
基于改進核主元分析的故障檢測
石懷濤1,宋文麗1,張珂1,譚帥2
(1.沈陽建筑大學機械工程學院,沈陽110168;
2.華東理工大學化工過程先進控制和優(yōu)化技術教育部重點實驗室,上海200237)
針對電主軸系統(tǒng)特點,提出基于改進核主元分析(KPCA)的故障檢測方法,引入混合核函數(shù)的定義,將多項式核和徑向基核的混合核方法與主元分析方法(PCA)相結合,解決采用單一核函數(shù)診斷故障時的高誤診率問題.首先對數(shù)據(jù)進行預處理,然后使用混合核函數(shù)對數(shù)據(jù)矩陣進行映射,映射到高維特征空間,使非線性數(shù)據(jù)變量變?yōu)榫€性數(shù)據(jù)變量,并使用PCA提取變量數(shù)據(jù)的高維空間相關特征確定主元個數(shù),最后根據(jù)混合非線性主元特征計算出的T 2和Q統(tǒng)計量,實現(xiàn)在線故障檢測.該方法改進傳統(tǒng)核函數(shù)的選取方法,充分考慮工業(yè)過程中的非線性,更精確地描述工業(yè)過程特性,可以準確、有效地檢測出電主軸系統(tǒng)故障.對田納西-伊斯曼(TE)過程以及電主軸系統(tǒng)的應用實例證明該方法的可行性.
混合核函數(shù);核主元分析;故障診斷;電主軸
Kreaycti wcaorbdilsit:y amnid xe fdeas kiebrilnietly o ffun tchteio inm;prkoevrendel me ptrhioncdip.al component analysis(KPCA);fault diagnosis;motorized spindle
隨著宇航、航天、汽車和模具加工等行業(yè)的飛速發(fā)展和技術進步,作為國防、航空、航天、能源、核、汽車、船舶、微電子等尖端及特殊制造領域所需高檔加工母機的核心部件——高性能高速電主軸系統(tǒng)的應用越來越多.電主軸系統(tǒng)經常因各種不同形式的故障而影響正常工作,一旦發(fā)生高速主軸故障,必然導致整個電主軸系統(tǒng)運行不正常,造成重大的經濟損失.為保證高速主軸系統(tǒng)安全可靠運行,需對電主軸系統(tǒng)的異常狀況或故障進行診斷.目前,對電主軸系統(tǒng)故障診斷技術的研究主要分為4個方向:故障機理及故障模型研究、診斷系統(tǒng)架構研究、診斷技術研究和系統(tǒng)集成技術研究.由于電主軸系統(tǒng)是個高度耦合的非線性系統(tǒng)[1],采集的數(shù)據(jù)具有非線性、非平穩(wěn)性、多量綱和部分非高斯性.因此提出基于改進核主元分析方法對電主軸進行檢測.
主元分析方法(Principal Component Analysis,PCA)是一種根據(jù)數(shù)據(jù)協(xié)方差進行建模的降維技術,可通過線性變換將高維空間數(shù)據(jù)變換到低維空間,消除變量間的相關性[2-4],即在信息損失最少的前提下將多個指標轉化為少數(shù)幾個綜合指標,從而簡化問題的復雜性.PCA故障檢測方法在推導過程中假設某時刻觀測值相對于前面時刻觀測值是統(tǒng)計獨立的,即各過程變量不存在序列相關性,并且是一種線性降維技術.工業(yè)過程本質是非線性的,難以滿足假設的復雜過程,在用PCA進行故障檢測和診斷時,常出現(xiàn)誤報和漏報現(xiàn)象,因此采用PCA方法建立統(tǒng)計模型難以描述數(shù)據(jù)真實的變化.
Dong等[5]研究一種基于主曲線和神經網(wǎng)絡的非線性PCA,雖然基于神經網(wǎng)絡的非線性PCA較線性PCA能在較小的維度獲得更多的變化,但神經網(wǎng)絡訓練復雜,計算效率低,很難保證泛化能力.核函數(shù)主元分析(KPCA)是一種非線性主元分析,由Schlkopf等[6]在研究支持矢量分類算法時提出.該方法利用核函數(shù)將非線性數(shù)據(jù)映射到高維線性空間,對高維空間中的映射數(shù)據(jù)作線性主元分析,得到數(shù)據(jù)的非線性主元,從而提取非線性特征.KPCA方法廣泛應用于特征抽?。?]、人臉識別[8]、圖像處理[9]和故障診斷等領域.
基于KPCA方法對某樣本進行特征抽取時,需計算該樣本與所有訓練樣本間的核函數(shù);訓練樣本集越大,相應計算量越大,效率越低[10];很多實際模式分類[11]任務要求系統(tǒng)具有較高的效率.核函數(shù)及其參數(shù)的選取對核方法的影響很大,如何科學地選擇最適合的核函數(shù)及其參數(shù)是目前亟需解決的問題.常用的核函數(shù)主要有高斯徑向基核函數(shù)、多項式核函數(shù)、Sigmoid核函數(shù)以及B樣條核函數(shù)等.
本文對多項式核函數(shù)和高斯徑向基進行凸組合,綜合兩種核函數(shù)的優(yōu)點,構造出更加靈活的混合核函數(shù).該方法將多項式核和徑向基核的混合核方法與PCA相結合,首先對數(shù)據(jù)進行預處理,然后使用混合核函數(shù)對數(shù)據(jù)矩陣進行映射,映射到高維特征空間,使非線性數(shù)據(jù)變量變?yōu)榫€性數(shù)據(jù)變量,并使用PCA提取變量數(shù)據(jù)的高維空間相關特征確定主元個數(shù),最后根據(jù)混合非線性主元特征計算出的T2和Q統(tǒng)計量,實現(xiàn)在線故障檢測.
KPCA能有效消除數(shù)據(jù)之間的冗余和空間相關性,提取包含主要數(shù)據(jù)信息的非線性特征主元[12].KPCA通過非線性映射函數(shù)Φ:RM→F,將輸入空間xk映射到特征空間F:Φ(xk),k=1,2,…,N中,然后在特征空間進行主元分析.假設Φ(xk)已去均值,即∑Nk=1Φ(xk)=0,則F空間上的協(xié)方差矩陣為
對應的特征方程為
特征值λ≥0,且v∈F是λ對應的特征向量;〈x,y〉表示x與y之間的點積.因此λv=CFv等價于
且存在系數(shù)αi(i=1,2,…,N),使得
結合式(2)~(4),可得
通過引入核函數(shù)k(x,y)=〈Φ(x),Φ(y)〉,可避免隱函數(shù)的非線性映射以及在特征空間兩者點積的復雜計算[13].常用的核函數(shù)包括多項式核函數(shù)、高斯核函數(shù)等.化簡可得
式中,α=[α1,α2,…,αN]T.對矩陣K中心化,K-= K-1NK-K 1N+1NK 1N,1N是所有元素都為1/N 的N維方陣,因此,式(6)可表示為
測試向量X的主元t計算如下:
式中:tk為通過非線性映射Φ求得的非線性主元.
核函數(shù)可以分成2類:①全局核函數(shù),具有外推、預測能力,相距很遠的數(shù)據(jù)點也可以影響到核函數(shù),如多項式核函數(shù);②局部核函數(shù),具有學習、插值能力,只有相距很近的數(shù)據(jù)點才能影響到核函數(shù)值,如高斯徑向基核函數(shù).針對不同的應用,可以設計不同的核函數(shù).通過式(8)、(9),可知核方法性能的優(yōu)良直接受到核函數(shù)及相關參數(shù)選擇的影響.
本文根據(jù)Mercer定理,對多項式核函數(shù)和高斯徑向基進行凸組合,綜合2種核函數(shù)的優(yōu)點,構造出更加靈活的混合核函數(shù)[4].
式中:ρ為混合核函數(shù)權系數(shù),ρ∈[0,1];d為多項式核函數(shù)的階次,為整數(shù),d∈[1,3];σ為高斯徑向基核函數(shù)參數(shù),σ∈[800,1 200].
因此,混合核函數(shù)有3個核參數(shù)需要確定.使用3種KPCA方法對田納西-伊斯曼(Tennessee Eastman,TE)數(shù)據(jù)進行仿真,發(fā)現(xiàn)當d=2,σ=1 000時,故障檢測率最高.由于多項式核函數(shù)KPCA的故障檢測率高于基于徑向基核的KPCA,故使ρ=0.7.當核函數(shù)及其參數(shù)確定后,將原始數(shù)據(jù)通過核函數(shù)映射到高維特征空間,之后進行主成分分析.使用故障檢測率作為優(yōu)化目標的適應度函數(shù)式中:nI為正常數(shù)據(jù)個數(shù);n為樣本個數(shù);fI的取值范圍為(0,1].混合核KPCA故障檢測流程見圖1.
為驗證改進KPCA故障檢測方法的有效性,將此方法應用于TE過程故障和電主軸故障的檢測,并與傳統(tǒng)的單核KPCA故障檢測方法進行對比.
3.1TE過程故障
TE過程是由Downs等[15]提出的一種標準測試(Benchmark)過程,目的是為評價過程控制和監(jiān)控方法提供1個現(xiàn)實的工業(yè)過程.TE過程包括41個測量變量和12個控制變量,并人為設定21種故障工況.本文以TE過程故障中的故障11為例,分析混合核KPCA的檢測效果.訓練數(shù)據(jù)包含480組數(shù)據(jù),測試數(shù)據(jù)包含960組數(shù)據(jù),每組觀測值包含52個過程變量.訓練數(shù)據(jù)為正常工作狀態(tài)下的數(shù)據(jù),測試數(shù)據(jù)為正常工作狀態(tài)下在第161個采樣點時引入故障11的數(shù)據(jù).仿真結果見圖2~4.
圖2 改進KPCA對TE過程的故障11的故障檢測Fig.2 The improved KPCA for fault detection for Fault 11 of TE
圖3 多項式KPCA對TE過程的故障11的故障檢測Fig.3 The polynomial KPCA for fault detection for Fault 11 of TE
圖4 徑向基核函數(shù)KPCA對TE過程的故障11的故障檢測Fig.4 The RBF KPCA for fault detection for Fault 11 of TE
由圖2~4可知,改進KPCA方法、基于多項式核PCA和徑向基核函數(shù)KPCA的故障檢測方法的Q統(tǒng)計量都能準確檢測出故障;對于統(tǒng)計量,改進KPCA可以準確檢測出故障,但基于多項式核函數(shù)KPCA和徑向基核函數(shù)KPCA的故障檢測率低,無法判斷故障是否發(fā)生,并且基于多項式核函數(shù)KPCA故障檢測方法對故障11的在線檢測時間,久于基于多項式KPCA故障診斷方法.
3.2電主軸故障
電主軸系統(tǒng)是個高度耦合的非線性系統(tǒng)[1],采集的數(shù)據(jù)具有非線性、非平穩(wěn)性、多量綱和部分非高斯性.作為大型加工機械的核心部分,一旦發(fā)生故障可能造成停產,影響生產質量,還可能造成人員傷亡.為保證生產過程的安全性和產品質量的穩(wěn)定性,需對電主軸進行實時檢測和準確診斷.首先根據(jù)電主軸的工作環(huán)境和工作性質,測取并選擇能夠反映電主軸工作情況或狀態(tài)的信號;對測取的信號進行分析處理,抽取能夠反映電主軸振動的有用信息;根據(jù)這些抽取的信息識別電主軸的狀態(tài)以及發(fā)展趨勢,確定是否發(fā)生故障,并對故障進行分析.電主軸的診斷步驟流程見圖5.
圖5 電主軸故障檢測流程Fig.5 Fault diagnosis flow chart of motorized spindle
電主軸系統(tǒng)超過50%的故障以振動信號表現(xiàn)出來,由于振動信號[16]易于獲取并且獲取裝置成本低廉,故本文基于振動信號,采用混合核KPCA方法進行故障診斷.以高速主軸作為對象獲取振動信號,采樣頻率為300 Hz,轉速為9 000 r/min.當電主軸處于正常狀態(tài)時選取400個樣本,每個樣本的長度是1 024點,對每個樣本進行時域特征提取.本文選擇19個特征參數(shù)作為過程變量,包括最大峰值、最小峰值、平均值幅值、方根幅值、峭度指標以及裕度因數(shù)等.正常狀態(tài)下的數(shù)據(jù)用于離線建模.為驗證模型的診斷能力,另取1組帶故障的數(shù)據(jù)作為測試集,測試集有500個樣本,故障發(fā)生在第121個采樣點處.應用改進KPCA方法、多項式KPCA和徑向基核函數(shù)KPCA對電主軸振動信號進行處理.基于3種核函數(shù)PCA方法的故障檢測結果如圖6~8所示.
圖6 改進KPC方法對電主軸故障檢測Fig.6 The improved KPCA for fault detection for motorized spindle fault
圖7 多項式KPCA法對電主軸故障檢測Fig.7 The polynomial KPCA for fault detection for motorized spindle
圖8 徑向基KPCA法對電主軸故障檢測Fig.8 The RBF KPCA for fault detection for motorized spindle
圖6、7能及時檢測出故障,但是圖8的Q統(tǒng)計量卻無法檢測出故障.圖6的故障檢測率為0.648 6,而圖7的故障檢測率為0.589 6,基于改進KPCA的T2和Q統(tǒng)計量相比基于多項式KPCA方法故障檢測率高.因此,本文提出的改進KPCA方法能更好地處理觀測數(shù)據(jù)非線性相關性,具有很好的檢測效果.
采用基于改進KPCA的故障檢測方法,引入混合核函數(shù)的定義,從全局和局部對數(shù)據(jù)進行處理,具有較強的泛化能力.先對數(shù)據(jù)進行預處理,然后使用混合核函數(shù)對數(shù)據(jù)矩陣進行映射,映射到高維特征空間,使非線性數(shù)據(jù)變量變?yōu)榫€性數(shù)據(jù)變量,并使用PCA提取變量數(shù)據(jù)的高維空間相關特征,確定主元個數(shù).此方法能有效消除數(shù)據(jù)之間的冗余和空間相關性,改進傳統(tǒng)的核函數(shù)選取方法,有效提取數(shù)據(jù)變量特征,與基于多項式KPCA和基于徑向基KPCA相比,能準確有效地檢測出電主軸故障.
[1]吳玉厚,田峰,邵萌,等.基于LabVIEW的全陶瓷電主軸振動信號預處理模塊的研究[J].沈陽建筑大學學報,2011,27(6):1177-1182.
[2]HartnettMK,LightbodyG,IrwinGW.Identificationofstatemodelsusingprincipalcomponentsanalysis[J].Chemometrics&IntelligentLabSystems,1999,46(1):181-196.
[3]YoonS,MacGregorJF.Principal-componentanalysisofmultiscaledataforprocessmonitoringandfault diagnosis[J].AicheJ,2004,50(2):2891-2903.
[4]袁哲,石懷濤.基于分步動態(tài)核主元分析的故障診斷方法[J].沈陽建筑大學學報,2013,29(6):1092-1097.
[5]DongD,McAvoyTJ.Nonlinearprincipalcomponentanalysis:basednoprincipalcurresandneural network[J].Computers&ChemEng,1996,20(1):65-78.
[6]SchlkopfB,SmolaA,MullerKR.Nonlinearcomponentanalysisasakerneleigenvalueproblem[J]. NeuralComput,1998,10(5):1299-1319.
[7]萬家強,王越,劉羽.改進KPCA對分類數(shù)據(jù)的特征提取[J].計算機工程與設計,2010,31(18):4085-4092.
[8]趙劍華.基于組合核函數(shù)KPCA的人臉識別研究[J].計算機工程與設計,2014,35(2):631-635.
[9]劉鳳連,王玲,溫顯斌,等.基于圖像處理技術與支持向量機的魚齡識別[J].光電子·激光,2010,21 (11):1730-1733.
[10]MikaS,RtschG,WestonJ,etal.Fisherdiscriminateanalysiswithkernels[C]//HuYH,LarsenJ,WilsonE,etal.NeuralNetworksSignalProcIX. 1999:41-48.
[11]劉忠寶,趙文娟.基于MATLAB仿真的模式分類實驗研究[J].實驗技術與管理,2013,30(3):92-95.
[12]LeeJM,YooCK,ChoiSW,etal.Nonlinear processmonitoringusingkernelprincipalcomponent analysis[J].ChemEngSci,2004,59(1):223-234.
[13]MullerKR,MikaS,RatschG,etal.Anintroductiontokernel-basedlearningalgorithms[J].IEEE TransNeuralNetworks,2001,12(2):181-201.
[14]汪洪橋,孫富春,蔡艷寧,等.多核學習方法[J].自動化學報,2010,36(8):1037-1050.
[15]DownsJJ,VogelEF.Aplant-wideindustrial processcontrolproblem[J].Computers&Chem Eng,1993,17(3):245-255.
[16]李兆飛,柴毅,李華鋒.多重分形去趨勢波動分析的振動信號故障診斷[J].華中科技大學學報,2012, 40(12):5-9.
(編輯呂丹)
Fault Detection Based on lmproved Kernel Principal Component Analysis
SHI Huaitao1,SONGWenli1,ZHANG Ke1,TAN Shuai2
(1.School of Mechanical Engineering,Shenyang Jianzhu University,Shenyang 110168,China;2.Key Laboratory of Advanced Control for Chemical Processes and Optimization Technique for Ministry of Education,East China University of Science,Shanghai 200237,China)
According to the characteristics of electron spindle,a fault detection approach based on improved kernel principal component analysis(KPCA)was proposed,definition of mixed kernel function was introduced by combing RBF kernel and polynomial kernel with PCA,which was aimed at solving the higher misdiagnosis rate problem of single kernel function.Firstly,the data matrix was preprocessed,then,mapping the input sample data into a kernel feature space by mixtures of kernels,and then linear PCA in the nonlinearly mapped feature space was performed to find the principal component feature vectors for diagnosis.The fault could be detected on-line by monitoring T2and squared prediction error(Q)which were calculated by mixtures nonlinear relative PCs.The proposed method could extract effectively nonlinear feature of industrial process by improving traditional selection method of kernel function,and fully consider the nonlinear feature of industrial process so that industrial process characteristics could be described accurately.The fault motorized spindle could be detected precisely by the improved method. Tennessee Eastman(TE)process and motorized spindle working process were applied to validate thedegree of accumulative damage in IGBT.
TP 391
A
1671-7333(2015)03-0227-05
10.3969/j.issn.1671-7333.2015.03.004
2015-01-15
國家自然科學基金資助項目(51375317,61403072);遼寧省教育廳一般項目(L2013236);華東理工大學探索研究專項基金(22A201514050)
石懷濤(1982-),男,副教授,博士,主要研究方向為復雜工業(yè)過程故障診斷.E-mail:fd1870404@163.com