鄭鑫,田學(xué)民,張漢元(中國石油大學(xué)(華東)信息與控制工程學(xué)院,山東 青島 266580)
?
基于動(dòng)態(tài)稀疏保局投影的故障檢測(cè)方法
鄭鑫,田學(xué)民,張漢元
(中國石油大學(xué)(華東)信息與控制工程學(xué)院,山東 青島 266580)
摘要:針對(duì)保局投影(locality preserving projections,LPP)沒有考慮過程數(shù)據(jù)的全局信息和動(dòng)態(tài)性的問題,提出一種新的基于動(dòng)態(tài)稀疏保局投影(dynamic sparse locality preserving projections,DSLPP)的故障檢測(cè)方法。該方法首先將原始數(shù)據(jù)矩陣擴(kuò)展為考慮時(shí)序相關(guān)的增廣矩陣,然后通過求解最優(yōu)稀疏表示(sparse representation,SR)問題,得到能夠表示數(shù)據(jù)全局稀疏重構(gòu)關(guān)系的稀疏系數(shù)矩陣,并將其與LPP算法結(jié)合,構(gòu)建綜合考慮數(shù)據(jù)局部和全局關(guān)系的目標(biāo)函數(shù)進(jìn)行數(shù)據(jù)降維,最后分別在特征空間和殘差空間構(gòu)造T2統(tǒng)計(jì)量和Q統(tǒng)計(jì)量進(jìn)行故障檢測(cè)。TEP的仿真結(jié)果表明,與LPP方法相比,新方法能更迅速檢測(cè)故障發(fā)生并降低過程監(jiān)控漏報(bào)率。
關(guān)鍵詞:故障檢測(cè);保局投影;稀疏表示;特征提?。贿^程監(jiān)控
2015-11-26收到初稿,2015-12-07收到修改稿。
聯(lián)系人:田學(xué)民。第一作者:鄭鑫(1990—),男,碩士研究生。
現(xiàn)代化工生產(chǎn)過程日益趨于大型化、集成化、復(fù)雜化,設(shè)備運(yùn)行過程中產(chǎn)生了大量高維復(fù)雜數(shù)據(jù),為了更好地監(jiān)控過程的運(yùn)行狀態(tài),需要使用有效的降維技術(shù)以及相應(yīng)的過程監(jiān)控方法[1]。傳統(tǒng)的主元分析(PCA)和偏最小二乘(PLS)已經(jīng)在工業(yè)過程中應(yīng)用廣泛[2-4]。針對(duì)數(shù)據(jù)的非線性問題,文獻(xiàn)[5]提出了基于PCA的非線性算法KPCA,取得了良好的效果。近年來的研究表明,流形學(xué)習(xí)能夠有效地發(fā)現(xiàn)隱含在高維數(shù)據(jù)集中的低維特征[6-8],該方法假設(shè)所處理的數(shù)據(jù)采樣于一個(gè)潛在的低維流形上,通過學(xué)習(xí)和發(fā)現(xiàn)嵌入在高維空間中的低維流形特性,可以有效地揭示數(shù)據(jù)的結(jié)構(gòu)特征。保局投影(locality preserving projections,LPP)是一種經(jīng)典的流形學(xué)習(xí)算法[9],在降維時(shí)能夠較好地保持?jǐn)?shù)據(jù)的局部結(jié)構(gòu)信息,Hu等[10]將其應(yīng)用于間歇過程的故障檢測(cè),取得了較好的效果,但是LPP方法忽略了數(shù)據(jù)的全局信息[11],可能導(dǎo)致原始樣本空間中距離較遠(yuǎn)的樣本點(diǎn)的低維投影發(fā)生重疊,從而破壞數(shù)據(jù)的本質(zhì)結(jié)構(gòu)特征。
近年來,稀疏表示(sparse representation,SR)理論成為信號(hào)處理、統(tǒng)計(jì)學(xué)分析和模式識(shí)別領(lǐng)域的研究熱點(diǎn)[12-14]。稀疏表示采用一個(gè)稱之為字典的超完備冗余基本信號(hào)系統(tǒng),對(duì)原始信號(hào)進(jìn)行稀疏線性表示,得到能夠表示原始數(shù)據(jù)全局稀疏重構(gòu)關(guān)系的稀疏系數(shù)矩陣。稀疏系數(shù)矩陣可以反映數(shù)據(jù)的本質(zhì)幾何特性,并包含自然的鑒別信息,稀疏規(guī)則化可自動(dòng)學(xué)習(xí)去掉對(duì)輸出沒有貢獻(xiàn)的變量,完成特征選擇。
本文針對(duì)保局投影應(yīng)用于故障檢測(cè)時(shí)沒有考慮過程數(shù)據(jù)的全局信息和動(dòng)態(tài)性的問題,結(jié)合保局投影和稀疏表示,并進(jìn)一步考慮過程數(shù)據(jù)的動(dòng)態(tài)性,提出了一種基于動(dòng)態(tài)稀疏保局投影(dynamic sparse locality preserving projections,DSLPP)的故障檢測(cè)方法。該方法首先考慮過程數(shù)據(jù)時(shí)序相關(guān)的特點(diǎn),將原始數(shù)據(jù)矩陣擴(kuò)展為時(shí)滯增廣矩陣形式,然后通過求解L1范數(shù)最優(yōu)值問題,得到能夠表示數(shù)據(jù)全局稀疏重構(gòu)關(guān)系的稀疏系數(shù)矩陣,并將其融入到LPP的目標(biāo)函數(shù)中,構(gòu)建綜合考慮數(shù)據(jù)局部和全局關(guān)系的目標(biāo)函數(shù)進(jìn)行數(shù)據(jù)降維,最后分別構(gòu)造T2統(tǒng)計(jì)量和Q統(tǒng)計(jì)量進(jìn)行故障檢測(cè)。TEP的仿真結(jié)果驗(yàn)證了新方法的有效性。
LPP算法通過優(yōu)化如下目標(biāo)函數(shù)獲得投影矩陣,保證低維嵌入坐標(biāo)yi與yj之間的距離最小。
并引入約束
其中,n是樣本數(shù),a為投影向量,L= D? W, D是n× n的對(duì)角陣,對(duì)角線元素,W是關(guān)系矩陣,可通過k近鄰法求得。
則投影向量可通過求解式(4)的廣義特征值問題獲得
最小的d個(gè)廣義特征值所對(duì)應(yīng)的特征向量構(gòu)成了投影矩陣ALPP。
2.1 稀疏表示
其中,ε為誤差容忍度。該目標(biāo)函數(shù)通過線性規(guī)劃求解每一個(gè)xi對(duì)應(yīng)的稀疏系數(shù)向量si,得到稀疏系數(shù)矩陣。
2.2 稀疏保局投影
LPP 算法使原始數(shù)據(jù)之間的近鄰關(guān)系在降維后得以保持,但是該算法沒有考慮原始數(shù)據(jù)的全局信息,從而可能出現(xiàn)降維后低維空間的整體結(jié)構(gòu)特征與原始數(shù)據(jù)空間不一致,影響故障檢測(cè)的效果。為此,在LPP算法的基礎(chǔ)上,通過加入全局稀疏重構(gòu)信息,提出了稀疏保局投影(sparse locality preserving projections,SLPP)降維算法。新算法在高維數(shù)據(jù)降維過程中不僅能夠保持原始數(shù)據(jù)的局部近鄰結(jié)構(gòu),而且能夠保持?jǐn)?shù)據(jù)間的全局稀疏重構(gòu)關(guān)系,更有利于提取過程數(shù)據(jù)的特征,SLPP的目標(biāo)函數(shù)構(gòu)建如式(7)所示。當(dāng)i= j時(shí),目標(biāo)函數(shù)保證原樣本與其對(duì)應(yīng)重構(gòu)樣本在投影后的低維空間依然保持重構(gòu)誤差最?。划?dāng)xi與xj為k近鄰時(shí),目標(biāo)函數(shù)保證投影后的低維空間具有和原始數(shù)據(jù)空間相似的局部結(jié)構(gòu)。
簡(jiǎn)化式(7)所示目標(biāo)函數(shù)
上述最優(yōu)化問題的求解可以最終由以下廣義特征值問題求解
2.3 動(dòng)態(tài)稀疏保局投影
其中,l為滯后步長(zhǎng),根據(jù)經(jīng)驗(yàn)一般取l =1或2。可見,矩陣擴(kuò)展后樣本數(shù)據(jù)減少到n l?,變量維數(shù)擴(kuò)展為m( l + 1)。由于把過去時(shí)刻的變量測(cè)量值也作為當(dāng)前時(shí)刻監(jiān)控?cái)?shù)據(jù),考慮了不同時(shí)刻采樣點(diǎn)之間的關(guān)系,應(yīng)用SLPP算法對(duì)上述增廣矩陣降維,便可以提取原始數(shù)據(jù)的動(dòng)態(tài)特征,更有利于過程的故障檢測(cè)。是歸一化后的數(shù)據(jù)矩陣,考慮時(shí)序相關(guān)的特點(diǎn)將原始數(shù)據(jù)矩陣擴(kuò)展為如下時(shí)滯增廣矩陣形式[16]
3.1 構(gòu)造監(jiān)控統(tǒng)計(jì)量
應(yīng)用DSLPP算法進(jìn)行數(shù)據(jù)降維后,分別對(duì)特征空間和殘差空間建立基于DSLPP的T2統(tǒng)計(jì)量和Q統(tǒng)計(jì)量[17]用于過程監(jiān)控。將DSLPP算法求得的投影矩陣記為(其中m為變量數(shù),d為低維空間維數(shù)),則有
其中,ynew是待檢測(cè)樣本xnew在特征空間的投影,Λ是正常工況數(shù)據(jù)特征空間的協(xié)方差矩陣。其中,為xnew的重構(gòu)向量,
由于T2和Q統(tǒng)計(jì)量的分布未知,本文通過核密度估計(jì)[18]分別獲得兩監(jiān)控統(tǒng)計(jì)量的控制限。
3.2 故障檢測(cè)算法實(shí)現(xiàn)
基于DSLPP算法的故障檢測(cè)過程包括離線建模和在線監(jiān)控兩個(gè)階段,具體實(shí)現(xiàn)步驟描述如下。
離線建模階段:
與此同時(shí),醫(yī)院創(chuàng)新性地將重要的無菌包的使用納入智能耗材柜的管理,無菌包的領(lǐng)取與醫(yī)囑相關(guān)聯(lián),規(guī)范了無菌包的領(lǐng)取行為,實(shí)現(xiàn)無菌包使用的全程可追溯。
(1)采集過程正常運(yùn)行數(shù)據(jù)并進(jìn)行歸一化處理后,構(gòu)造擴(kuò)展矩陣,得到數(shù)據(jù)集?X;(2)使用DSLPP算法對(duì)數(shù)據(jù)集?X進(jìn)行特征提取,得到投影矩陣A;
(3)分別計(jì)算特征空間的T2統(tǒng)計(jì)量和殘差空間的Q統(tǒng)計(jì)量的控制限。
在線監(jiān)控階段:
(1)采集新的監(jiān)控樣本數(shù)據(jù)并進(jìn)行歸一化處理后,構(gòu)造擴(kuò)展矩陣,得到數(shù)據(jù)集;
(3)計(jì)算擴(kuò)展樣本的T2統(tǒng)計(jì)量和Q統(tǒng)計(jì)量,并判斷是否超過相應(yīng)控制限,若超過控制限,表明監(jiān)控過程發(fā)生故障。
算法流程圖如圖1所示。
圖1 DSLPP算法流程圖Fig.1 Flow chart of DSLPP
田納西-伊斯曼過程(Tennessee Eastman process,TEP)[19]包含22個(gè)連續(xù)測(cè)量變量,19個(gè)組分測(cè)量變量和12個(gè)操縱變量,本文中的研究只選取其中的22個(gè)連續(xù)測(cè)量變量和11個(gè)操縱變量用于故障監(jiān)控,由于組分測(cè)量變量在實(shí)際中很難測(cè)量,在這里不予考慮[20]。TEP有21種預(yù)設(shè)定的故障,這些故障中16個(gè)是已知的,5個(gè)是未知的。
采集正常工況下的960個(gè)數(shù)據(jù)作為訓(xùn)練集,同樣采集960個(gè)故障工況下的數(shù)據(jù)作為測(cè)試集,故障于第161個(gè)樣本處加入。選取低維空間維數(shù)d =14,近鄰參數(shù)k =15,t =1,滯后步長(zhǎng)l =1,所有置信限都設(shè)置為95%。為了降低誤報(bào)率,本文定義故障檢測(cè)時(shí)間為:第一次連續(xù)6個(gè)監(jiān)控樣本超過統(tǒng)計(jì)量控制限的時(shí)間。故障漏報(bào)率指故障發(fā)生后未報(bào)警樣本與實(shí)際故障樣本數(shù)目的比值。本文以故障10和故障19為例,分別運(yùn)用LPP、SLPP和DSLPP方法對(duì)其建立統(tǒng)計(jì)量監(jiān)控模型,通過分析相應(yīng)監(jiān)控圖和仿真結(jié)果數(shù)據(jù),比較3種方法的故障檢測(cè)性能。圖2和圖3分別為故障10和故障19的統(tǒng)計(jì)量監(jiān)控圖,定量的故障檢測(cè)結(jié)果見表1。
表1 3種方法TEP故障檢測(cè)結(jié)果Table 1 Fault detection results of TEP with 3 methods
故障10是由流2的C進(jìn)料溫度發(fā)生隨機(jī)變化引起的,圖2為故障10的統(tǒng)計(jì)量監(jiān)控圖比較結(jié)果。結(jié)合表1的故障檢測(cè)結(jié)果可以發(fā)現(xiàn),LPP的T2統(tǒng)計(jì)量在第210個(gè)樣本處發(fā)現(xiàn)故障,但是卻不能持續(xù)檢測(cè)故障,整個(gè)監(jiān)控過程的漏報(bào)率很高;而SLPP的T2統(tǒng)計(jì)量在第182個(gè)樣本處發(fā)現(xiàn)故障,漏報(bào)率僅為10.25%;進(jìn)一步考慮過程數(shù)據(jù)的動(dòng)態(tài)性,DSLPP的T2統(tǒng)計(jì)量在第180個(gè)樣本處發(fā)現(xiàn)故障,漏報(bào)率降低為6.62%。另外,LPP、SLPP和DSLPP 3種方法的Q統(tǒng)計(jì)量分別在第195、185和176個(gè)樣本處檢測(cè)出故障,同樣表明了SLPP和DSLPP方法的優(yōu)越性。以上結(jié)果表明了SLPP方法可以提取原始數(shù)據(jù)更全面的信息,有助于提高過程監(jiān)控方法的故障檢測(cè)速度并降低其故障漏報(bào)率,而考慮過程數(shù)據(jù)動(dòng)態(tài)性的DSLPP算法能進(jìn)一步提高故障檢測(cè)性能。
圖2 故障10的監(jiān)控圖Fig.2 Monitoring charts of fault 10
圖3 故障19的監(jiān)控圖Fig.3 Monitoring charts of fault 19
故障19是一種未知故障,圖3是其統(tǒng)計(jì)量監(jiān)控圖。從T2統(tǒng)計(jì)量的結(jié)果來看,LPP在第343個(gè)樣本處檢測(cè)出故障,漏報(bào)率高達(dá)72.12%;SLPP的故障檢測(cè)效果要好很多,在第238個(gè)樣本處就檢測(cè)出故障,漏報(bào)率為51.12%;DSLPP效果最好,在第171個(gè)樣本處發(fā)現(xiàn)故障,漏報(bào)率進(jìn)一步降低為41.62%。由此亦可以看出新算法檢測(cè)故障的有效性。
表1分別是3種故障檢測(cè)方法在一些典型故障發(fā)生時(shí)的故障檢測(cè)時(shí)間和故障漏報(bào)率。由表中數(shù)據(jù)可知,對(duì)于大多數(shù)故障情況,相比于LPP,SLPP無論在故障檢測(cè)時(shí)間方面還是故障漏報(bào)率方面都有著更出色的表現(xiàn),而進(jìn)一步考慮過程數(shù)據(jù)動(dòng)態(tài)性的DSLPP更有助于提高過程監(jiān)控方法的故障檢測(cè)速度并降低其故障漏報(bào)率。尤其對(duì)于故障10、16、19 和20,新方法可以大幅提高故障檢測(cè)性能。
本文在LPP算法的基礎(chǔ)上,通過加入全局稀疏重構(gòu)信息,并進(jìn)一步考慮過程數(shù)據(jù)的動(dòng)態(tài)性,提出了一種基于動(dòng)態(tài)稀疏保局投影的故障檢測(cè)方法。新方法在高維數(shù)據(jù)降維過程中不僅能夠保持原始數(shù)據(jù)的局部近鄰結(jié)構(gòu),而且能夠保持?jǐn)?shù)據(jù)間的全局稀疏重構(gòu)關(guān)系,更有利于對(duì)原始過程數(shù)據(jù)的特征提取,提高過程監(jiān)控方法的性能。TEP的仿真結(jié)果表明,與LPP方法相比,新方法能更迅速檢測(cè)故障發(fā)生并降低過程監(jiān)控漏報(bào)率。
References
[1] CHIANG L H, BRAATZ R D, RUSSELL E L. Fault Detection and Diagnosis in Industrial Systems [M]. Springer Science & Business Media, 2001.
[2] QIN S J. Survey on data-driven industrial process monitoring and diagnosis [J]. Annual Reviews in Control, 2012, 36 (2): 220-234.
[3] 王海清, 宋執(zhí)環(huán), 王慧. PCA 過程監(jiān)測(cè)方法的故障檢測(cè)行為分析[J]. 化工學(xué)報(bào), 2002, 53 (3): 297-301.
WANG H Q, SONG Z H, WANG H. Fault detection behavior analysis of PCA-based process monitoring approach [J]. Journal of Chemical Industry and Engineering (China), 2002, 53 (3): 297-301.
[4] LI G, QIN S J, ZHOU D. Geometric properties of partial least squares for process monitoring [J]. Automatica, 2010, 46 (1): 204-210.
[5] SCH?LKOPF B, SMOLA A, MüLLER K R. Nonlinear component analysis as a kernel eigenvalue problem [J]. Neural Computation, 1998, 10 (5): 1299-1319.
[6] TENENBAUM J B, SILVA V D, LANGFORD J C. A global geometric framework for nonlinear dimensionality reduction [J]. Science, 2000, 290 (5500): 2319-2323.
[7] ROWEIS S T, SAUL L K. Nonlinear dimensionality reduction by locally linear embedding [J]. Science, 2000, 290 (5500): 2323-2326.
[8] BELKIN M, NIYOGI P. Laplacian eigenmaps for dimensionality reduction and data representation [J]. Neural Computation, 2003, 15 (6): 1373-1396.
[9] HE X F, NIYOGI P. Locality preserving projections[C] //Proceedings of Advances in Neural Information Processing Systems. MIT Press, 2004: 153-160.
[10] HU K, YUAN J. Multivariate statistical process control based on multiway locality preserving projections [J]. Journal of Process Control, 2008, 18 (7): 797-807.
[11] ZHANG M G, GE Z Q, SONG Z H, et al. Global–local structure analysis model and its application for fault detection and identification [J]. Industrial & Engineering Chemistry Research, 2011, 50 (11): 6837-6848.
[12] AHARON M, ELAD M, BRUCKSTEIN A. K-SVD: an algorithm for designing overcomplete dictionaries for sparse representation [J]. IEEE Transactions on Signal Processing, 2006, 54 (11): 4311-4322.
[13] 馬小虎, 譚延琪. 基于鑒別稀疏保持嵌入的人臉識(shí)別算法 [J]. 自動(dòng)化學(xué)報(bào), 2014, 40 (1): 73-82.
MA X H, TAN Y Q. Face recognition based on discriminant sparsity preserving embedding [J]. Acta Automatica Sinica, 2014, 40 (1): 73-82.
[14] QIAO L, CHEN S, TAN X. Sparsity preserving projections with applications to face recognition [J]. Pattern Recognition, 2010, 43 (1): 331-341.
[15] WRIGHT J, YANG A Y, GANESH A, et al. Robust face recognition via sparse representation [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009, 31 (2): 210-227.
[16] KU W, STORER R H, GEORGAKIS C. Disturbance detection and isolation by dynamic principal component analysis [J]. Chemometrics and Intelligent Laboratory Systems, 1995, 30 (1): 179-196.
[17] QIN S J. Statistical process monitoring: basics and beyond [J]. Journal of Chemometrics, 2003, 17 (8/9): 480-502.
[18] CHEN Q, WYNNE R J, GOULDING P, et al. The application of principal component analysis and kernel density estimation to enhance process monitoring [J]. Control Engineering Practice, 2000, 8 (5): 531-543.
[19] DOWNS J J, VOGEL E F. A plant-wide industrial process control problem [J]. Computers & Chemical Engineering, 1993, 17 (3): 245-255.
[20] LEE J M, QIN S J, LEE I B. Fault detection and diagnosis based on modified independent component analysis [J]. AIChE Journal, 2006, 52 (10): 3501-3514.
研究論文
Received date: 2015-11-26.
Foundation item: supported by the National Natural Science Foundation of China (61273160), and the Fundamental Research Funds for the Central Universities (14CX06132A).
Fault detection method based on dynamic sparse locality preserving projections
ZHENG Xin, TIAN Xuemin, ZHANG Hanyuan
(College of Information and Control Engineering, China University of Petroleum (East China), Qingdao 266580, Shandong, China)
Abstract:In order to deal with the problem that locality preserving projections (LPP) does not take into account the global structure and dynamic characteristic of process data, a new fault detection method based on dynamic sparse locality preserving projections (DSLPP) is proposed. In the study, the original data matrix is firstly extended to a time-delay augmented matrix. Then, a sparse coefficient matrix which can represent global sparse reconstructive relationship of data is gotten by solving an optimal problem of sparse representation (SR). The sparse coefficient matrix combines with the objective function of LPP to form a new objective function for dimensionality reduction. The new dimensionality reduction algorithm can not only preserve the local neighbor structure of the original data space, but also have better effect in preserving the global sparse reconstructive relationship. At last, DSLPP-based T2and Q statistics are constructed respectively in the feature space and residual space for fault detection.The simulation results of Tennessee Eastman process demonstrate that the proposed method detects faults more quickly and achieves lower fault missing alarm rate than the LPP method.
Key words:fault detection; locality preserving projections; sparse representation; feature extraction; process monitoring
DOI:10.11949/j.issn.0438-1157.20151769
中圖分類號(hào):TP 277
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):0438—1157(2016)03—0833—06
基金項(xiàng)目:國家自然科學(xué)基金項(xiàng)目(61273160);中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金(14CX06132A)。
Corresponding author:Prof. TIAN Xuemin, tianxm@upc.edu.cn