謝彥紅, 劉文靜, 李 元
(沈陽化工大學(xué) 數(shù)理系, 遼寧 沈陽 110142)
隨著工業(yè)結(jié)構(gòu)的日益復(fù)雜化,對運行系統(tǒng)的安全性和可靠性的要求也日益提高[1-3],對設(shè)備和系統(tǒng)進(jìn)行及時有效的監(jiān)控,是提高設(shè)備工作效率和可靠性的有效方法[4-7].目前,以主元分析(principal component analysis,PCA)[8-9]、偏最小二乘(partial least squares,PLS)[10-11]為代表的經(jīng)典統(tǒng)計方法在使用時仍然存在局限性.PCA只利用了信號的二階統(tǒng)計信息,在數(shù)據(jù)不滿足完全高斯分布時其檢測效果并不理想.獨立主元分析(independent component analysis,ICA)[12-13]方法雖然使用了高階統(tǒng)計量信息,但研究仍然還停留在線性問題上,對線性、非線性混合方面的問題研究還不成熟.Tax[14-15]等人提出了支持向量數(shù)據(jù)描述(SVDD)方法,該算法可以很好地處理過程混合信息,而且又對非線性問題具有較高的處理能力.雖然SVDD方法有許多優(yōu)點,但是當(dāng)樣本數(shù)據(jù)較大時,由于核函數(shù)的原因?qū)?dǎo)致計算的復(fù)雜性明顯增加.為了克服這個缺點,提高數(shù)據(jù)檢測效率,降低檢測時間,將從降低數(shù)據(jù)維數(shù)和減少樣本個數(shù)兩個方面考慮.本文綜合考慮了主元空間及殘差空間的特征信息,提出一種對主元空間及殘差空間先后建模的故障檢測方法,提高檢測效率的同時又有效地防止漏檢情況的發(fā)生.
支持?jǐn)?shù)據(jù)向量描述[16-17](support vector data description,SVDD)的基本思想是數(shù)據(jù)集X={xi,i=1,2,…,N},通過某種非線性函數(shù)Φ:X→F將原始空間的數(shù)據(jù)投射到高維特征空間{Φ(xi),i=1,…,N},在高維特征空間中找到一個幾乎包含所有數(shù)據(jù)樣本的最小體積超球體,a是超球體的球心,R是超球體的半徑.考慮到測量誤差或者噪音等干擾引起的離群點影響,引入松弛變量ζi;C是懲罰參數(shù).此問題可描述為:
(1)
上述問題可以轉(zhuǎn)化為解決相應(yīng)的對偶問題:
(2)
其中a是拉格朗日因子.
用核函數(shù)K(xi,xj)代替內(nèi)積〈Φ(xi)·Φ(xj)〉可以將低維空間的數(shù)據(jù)向高維空間進(jìn)行投射:
(3)
利用規(guī)劃問題求解,可以求出ai,如果0 (4) 對于新的樣本xnew,其到超球體球心的距離可表示為: Dnew= (5) 如果Dnew 從以上SVDD的算法可以看出:支持向量數(shù)據(jù)描述的算法將會轉(zhuǎn)變?yōu)橐粋€最優(yōu)規(guī)劃的問題,在求解過程中需用到核函數(shù)來進(jìn)行數(shù)據(jù)計算,算法的復(fù)雜度明顯增大,隨著樣本個數(shù)的增加,算法的計算量也會呈指數(shù)增長,這樣一來,當(dāng)需要計算的數(shù)據(jù)很龐大時就會產(chǎn)生維數(shù)災(zāi)難.而且由支持向量機(jī)理可知:只有“支持向量”才會對數(shù)據(jù)的分類起作用,但是支持向量在數(shù)據(jù)很龐大時所占的比重較小.因此,需要花費大量時間去優(yōu)化非支持向量,浪費大量的有用計算時間. 主元分析(principal component analysis,PCA)是多元統(tǒng)計過程常用的方法,是將數(shù)據(jù)的主要信息方向作為新的數(shù)據(jù)空間的坐標(biāo)方向,從而達(dá)到數(shù)據(jù)從高維空間向低維空間的變換. (1) 初始化:設(shè)數(shù)據(jù)樣本X={x1,x2,…,xM},其中每個樣本xi的維數(shù)為n. (2) 預(yù)處理:對數(shù)據(jù)樣本集X={x1,x2,…,xM}中的每個樣本xi∈X進(jìn)行中心標(biāo)準(zhǔn)化處理,從而得到新的樣本集X′. (3) 計算協(xié)方差矩陣.根據(jù)式(6)計算經(jīng)過預(yù)處理的樣本集的協(xié)方差矩陣C (6) (4) 計算特征值和特征向量.求上述協(xié)方差矩陣的所有特征值λi,當(dāng)λi≠0時,計算其對應(yīng)的特征向量pi. (5) 計算累計貢獻(xiàn)率并求解各特征值λi的累計貢獻(xiàn)率a: (7) 其中:z表示值不為0的特征值的個數(shù).選取貢獻(xiàn)率大的特征值所對應(yīng)的特征向量組成優(yōu)化特征向量集合為P. (6)主元空間及殘差空間的表示如下: (8) 2.2.1 建模描述 首先,在采集的原始數(shù)據(jù)基礎(chǔ)上,通過主元分析進(jìn)行特征提取,獲得維數(shù)簡約的樣本數(shù)據(jù);其次,將主元空間和殘差空間得分矩陣分別運用SVDD算法確定闕值R1及R2. 2.2.2 檢測模型描述 ① 采集故障數(shù)據(jù):數(shù)據(jù)發(fā)生故障時在不同的設(shè)備中會有不同的表現(xiàn),在機(jī)器設(shè)備中,可以將震動信號作為發(fā)生故障的信號;在發(fā)動機(jī)設(shè)備中,可以通過振動的頻信號作為特征信號. ② 應(yīng)用PCA方法對采集的數(shù)據(jù)進(jìn)行降維,降低數(shù)據(jù)的復(fù)雜度. ③ 利用SVDD算法對主元空間進(jìn)行故障檢測:對主元空間得分矩陣?yán)肧VDD算法進(jìn)行故障檢測,計算其到超球球心的距離D1,如果得到的距離D1大于半徑R1,則為故障樣本,否則轉(zhuǎn)入步驟④. ④ 利用SVDD算法對殘差空間進(jìn)行故障檢測:對殘差空間得分矩陣?yán)肧VDD算法進(jìn)行故障檢測,計算其到超球球心的的距離D2,如果得到的距離D2大于半徑R2,則為故障樣本,如果得到的距離D2小于半徑R2,則為正常樣本. 建模及檢測流程如圖1所示. 圖1 建模及檢測流程Fig.1 Modeling and testing flow chart 首先進(jìn)行一個數(shù)值仿真的實驗,然后又對TE過程數(shù)據(jù)進(jìn)行實驗,驗證了該方法的有效性. 過程數(shù)據(jù)產(chǎn)生如式(9)所示: x1=x2+e x2=x+e (9) 其中:x服從N(0,1)分布,e為噪聲,服從N(0,1)分布. 產(chǎn)生700個訓(xùn)練數(shù)據(jù),53個測試數(shù)據(jù)(50個校驗數(shù)據(jù)及3個故障數(shù)據(jù)).選取第一個變量作為主元,第二個變量作為殘差主元.圖2為SVDD與PCA-SVDD方法的檢測結(jié)果. 圖2 PCA-SVDD及SVDD檢測結(jié)果Fig.2 PCA-SVDD and SVDD test results 由圖2可以看出:PCA-SVDD的誤報數(shù)比SVDD明顯減少.由支持向量機(jī)理可知,只有支持向量對分類起決定的作用,在沒有降維的情況下,支持向量所占的比重小,不能進(jìn)行很好的分類;PCA-SVDD通過主元提取獲得更多的支持向量,支持向量所占的比重增大,可以更好地分類,從而降低了誤報.另外從檢測時間上來看,PCA-SVDD提取出數(shù)據(jù)的特征,獲得維數(shù)簡約的樣本數(shù)據(jù),在計算時間上也比SVDD方法的用時短.圖3為SVDD及PCA-SVDD各個樣本所用時間折線圖,可以更加直觀地看出兩種方法各個樣本的用時,證明了PCA-SVDD具有縮短檢測時間的優(yōu)勢. 圖3 SVDD及PCA-SVDD時間折線圖Fig.3 SVDD and PCA-SVDD time line chart Tennessee Eastman過程中共包含有41個測量變量和12個控制變量,其中41個測量變量又可以劃分為22個過程測量變量以及19個成分測量變量.在應(yīng)用過程驗證監(jiān)控方法性能時,一般選擇22個連續(xù)過程測量變量和12個控制變量作為監(jiān)控變量,仿真數(shù)據(jù)集包含了正常工況和21種不同的故障,每種狀態(tài)分別包括480組訓(xùn)練數(shù)據(jù)和960組測試數(shù)據(jù),在所有的過程監(jiān)測測試數(shù)據(jù)中,故障均從第161組數(shù)據(jù)開始引入故障.現(xiàn)對幾種典型的故障進(jìn)行檢測,即故障1(階躍型)、故障2(階躍型)、故障8(隨機(jī)型)、故障13(慢偏移型).圖4為故障1的檢測結(jié)果,圖5為4組故障的檢測效率及所用時間柱狀圖,表1為 4種故障的故障檢測率及所用時間的統(tǒng)計. 表1 4種故障的檢測結(jié)果Table 1 4 the fault detection results 選取前3個變量作為主元,第4至第6個變量作為殘差主元.由圖4可以看出PCA-SVDD方法的檢測效果要優(yōu)于SVDD.這是因為SVDD方法所獲得的支持向量的個數(shù)少,支持向量所占的比重小,不能進(jìn)行很好地分類;PCA-SVDD方 法通過主元提取獲得更多的支持向量,支持向量所占的比重增大,這樣可以更好地分類.利用PCA-SVDD的故障檢測方法可以有效地提取數(shù)據(jù)的特征,獲得維數(shù)簡約的樣本數(shù)據(jù),在計算時間上也比SVDD方法的用時短.從表1可以看出:PCA-SVDD方法的兩項指標(biāo)的檢測效果明顯優(yōu)于SVDD方法. 圖4 故障1檢測結(jié)果Fig.4 The results of fault detection 1 圖5 故障檢測率及所用時間Fig.5 The fault detection rate and time histograms used 針對傳統(tǒng)SVDD算法對大樣本集操作時的檢測時間長、檢測效率低等不足,提出了一種PCA和SVDD結(jié)合的故障檢測方法,該方法有兩個優(yōu)勢:一是利用SVDD算法對主元空間得分及殘差空間得分進(jìn)行檢測,與傳統(tǒng)的SVDD算法對所有數(shù)據(jù)都進(jìn)行檢測相比,降低了檢測時間;二是,相較于傳統(tǒng)的SVDD算法,PCA-SVDD將PCA有效提取數(shù)據(jù)特征的優(yōu)勢與SVDD可以有效地處理非高斯非線性數(shù)據(jù)的優(yōu)勢相結(jié)合,在突出有效特征信息的同時又獲得更多的支持向量,使支持向量所占的比重增大,有利于SVDD更好地進(jìn)行分類,避免了漏檢率,從而提高了故障檢測率. : [1] 趙曉君,鄭倩.基于PCA-KNN聚類的通用在線故障診斷算法設(shè)計[J].計算機(jī)測量與控制,2015,23(8):2762-2765. [2] KARIMI H R,ZAPATEIRO M,LUO N.A Linear Matrix Inequality Approach to Robust Fault Detection Filter Design of Linear Systems with Mixed Time-Varying Delays and Non-linear Perturbations[J].Journalof The Franklin Institute.2010,347(6):957-973. [3] 孫蓉,劉勝,張玉芳.基于參數(shù)估計的一類非線性系統(tǒng)故障診斷算法[J].控制與決策,2014,29(3):506-510. [4] 王國剛,史澤林,劉云鵬.多分辨率迭代切距離及其在目標(biāo)識別中的應(yīng)用[J].紅外與激光工程,2012,41(5):1369-1373. [5] 周東華,李鋼,李元.數(shù)據(jù)驅(qū)動的工業(yè)過程故障診斷技術(shù)——基于主元分析與偏最小二乘的方法[M].北京:科學(xué)出版社,2011:1-14. [6] 郭金玉,趙璐璐,李元.基于統(tǒng)計特征的不等長間歇過程故障診斷研究[J].計算機(jī)應(yīng)用研究,2014,31(1):128-130. [7] 楊正永,王昕,王振雷.一種非線性過程監(jiān)控方法[J].計算機(jī)與應(yīng)用化學(xué),2013,30(10):1131-1134. [8] CHANG Y Q,LU Y S,WANG F L,et al.Sub-Stage PCA Modelling and Monitoring Method for Uneven-Length Batch Processes[J].The Canadian Journal of Chemical Engineering,2012,90(1):144-152. [9] WISE B M,RICKER N L,VELTKAMP D F,et al.A Theoretical Basis for The Use of Principal Component Models for Monitoring Multivariate Processes[J].Process Control & Quality,1990,1(1):41-51. [10] KRESTA J V,MACGREGOR J F,MARLIN T E.Multivariate Statistical Monitoring of Process Operating Performance[J].The Canadian Journal of Chemical Engineering,1991,69(1):35-47. [11] 苑天琪,胡靜,文成林.T-PLS下相關(guān)系數(shù)矩陣對質(zhì)量影響的研究[J].杭州電子科技大學(xué)學(xué)報,2013,33(6):120-123. [12] GE Z Q,SONG Z H.Process Monitoring Based on Independent Component Analysis-Principal Component Analysis(ICA-PCA)and Similarity Factors[J].Industrial and Engineering Chemistry Research,2007,46(7):2054-2063. [13] 徐瑩,鄧曉剛,鐘娜.基于ICA混合模型的多工況過程故障診斷方法[J].化工學(xué)報,2016,67(9):3793-3803. [14] TAX D M J,DUIN R P W.Support Vector Data Description[J].Machine Learning,2004,54(1):45-66. [15] 謝彥紅,孫呈敖,李元.基于滑動窗口SVDD的間歇過程故障監(jiān)測[J].信息與控制,2015,44(5):531-537. [16] 張少捷,王振雷,錢鋒.基于LTSA的FS-SVDD方法及其在化工過程監(jiān)控中的應(yīng)用[J].化工學(xué)報,2010,61(8):1894-1900. [17] 楊正永,王昕,王振雷.基于LTSA-Greedy-SVDD的過程監(jiān)控[J].華東理工大學(xué)學(xué)報(自然科學(xué)版),2014,40(3):342-348.2 基于PCA的SVDD故障檢測
2.1 主元分析(PCA)
2.2 PCA-SVDD建模及檢測
3 仿真實驗
3.1 數(shù)值仿真
3.2 TE過程仿真
4 結(jié) 論