鄭鑫,田學民,張漢元(中國石油大學(華東)信息與控制工程學院,山東 青島 266580)
?
基于動態(tài)稀疏保局投影的故障檢測方法
鄭鑫,田學民,張漢元
(中國石油大學(華東)信息與控制工程學院,山東 青島 266580)
摘要:針對保局投影(locality preserving projections,LPP)沒有考慮過程數(shù)據(jù)的全局信息和動態(tài)性的問題,提出一種新的基于動態(tài)稀疏保局投影(dynamic sparse locality preserving projections,DSLPP)的故障檢測方法。該方法首先將原始數(shù)據(jù)矩陣擴展為考慮時序相關的增廣矩陣,然后通過求解最優(yōu)稀疏表示(sparse representation,SR)問題,得到能夠表示數(shù)據(jù)全局稀疏重構(gòu)關系的稀疏系數(shù)矩陣,并將其與LPP算法結(jié)合,構(gòu)建綜合考慮數(shù)據(jù)局部和全局關系的目標函數(shù)進行數(shù)據(jù)降維,最后分別在特征空間和殘差空間構(gòu)造T2統(tǒng)計量和Q統(tǒng)計量進行故障檢測。TEP的仿真結(jié)果表明,與LPP方法相比,新方法能更迅速檢測故障發(fā)生并降低過程監(jiān)控漏報率。
關鍵詞:故障檢測;保局投影;稀疏表示;特征提取;過程監(jiān)控
2015-11-26收到初稿,2015-12-07收到修改稿。
聯(lián)系人:田學民。第一作者:鄭鑫(1990—),男,碩士研究生。
現(xiàn)代化工生產(chǎn)過程日益趨于大型化、集成化、復雜化,設備運行過程中產(chǎn)生了大量高維復雜數(shù)據(jù),為了更好地監(jiān)控過程的運行狀態(tài),需要使用有效的降維技術以及相應的過程監(jiān)控方法[1]。傳統(tǒng)的主元分析(PCA)和偏最小二乘(PLS)已經(jīng)在工業(yè)過程中應用廣泛[2-4]。針對數(shù)據(jù)的非線性問題,文獻[5]提出了基于PCA的非線性算法KPCA,取得了良好的效果。近年來的研究表明,流形學習能夠有效地發(fā)現(xiàn)隱含在高維數(shù)據(jù)集中的低維特征[6-8],該方法假設所處理的數(shù)據(jù)采樣于一個潛在的低維流形上,通過學習和發(fā)現(xiàn)嵌入在高維空間中的低維流形特性,可以有效地揭示數(shù)據(jù)的結(jié)構(gòu)特征。保局投影(locality preserving projections,LPP)是一種經(jīng)典的流形學習算法[9],在降維時能夠較好地保持數(shù)據(jù)的局部結(jié)構(gòu)信息,Hu等[10]將其應用于間歇過程的故障檢測,取得了較好的效果,但是LPP方法忽略了數(shù)據(jù)的全局信息[11],可能導致原始樣本空間中距離較遠的樣本點的低維投影發(fā)生重疊,從而破壞數(shù)據(jù)的本質(zhì)結(jié)構(gòu)特征。
近年來,稀疏表示(sparse representation,SR)理論成為信號處理、統(tǒng)計學分析和模式識別領域的研究熱點[12-14]。稀疏表示采用一個稱之為字典的超完備冗余基本信號系統(tǒng),對原始信號進行稀疏線性表示,得到能夠表示原始數(shù)據(jù)全局稀疏重構(gòu)關系的稀疏系數(shù)矩陣。稀疏系數(shù)矩陣可以反映數(shù)據(jù)的本質(zhì)幾何特性,并包含自然的鑒別信息,稀疏規(guī)則化可自動學習去掉對輸出沒有貢獻的變量,完成特征選擇。
本文針對保局投影應用于故障檢測時沒有考慮過程數(shù)據(jù)的全局信息和動態(tài)性的問題,結(jié)合保局投影和稀疏表示,并進一步考慮過程數(shù)據(jù)的動態(tài)性,提出了一種基于動態(tài)稀疏保局投影(dynamic sparse locality preserving projections,DSLPP)的故障檢測方法。該方法首先考慮過程數(shù)據(jù)時序相關的特點,將原始數(shù)據(jù)矩陣擴展為時滯增廣矩陣形式,然后通過求解L1范數(shù)最優(yōu)值問題,得到能夠表示數(shù)據(jù)全局稀疏重構(gòu)關系的稀疏系數(shù)矩陣,并將其融入到LPP的目標函數(shù)中,構(gòu)建綜合考慮數(shù)據(jù)局部和全局關系的目標函數(shù)進行數(shù)據(jù)降維,最后分別構(gòu)造T2統(tǒng)計量和Q統(tǒng)計量進行故障檢測。TEP的仿真結(jié)果驗證了新方法的有效性。
LPP算法通過優(yōu)化如下目標函數(shù)獲得投影矩陣,保證低維嵌入坐標yi與yj之間的距離最小。
并引入約束
其中,n是樣本數(shù),a為投影向量,L= D? W, D是n× n的對角陣,對角線元素,W是關系矩陣,可通過k近鄰法求得。
則投影向量可通過求解式(4)的廣義特征值問題獲得
最小的d個廣義特征值所對應的特征向量構(gòu)成了投影矩陣ALPP。
2.1 稀疏表示
其中,ε為誤差容忍度。該目標函數(shù)通過線性規(guī)劃求解每一個xi對應的稀疏系數(shù)向量si,得到稀疏系數(shù)矩陣。
2.2 稀疏保局投影
LPP 算法使原始數(shù)據(jù)之間的近鄰關系在降維后得以保持,但是該算法沒有考慮原始數(shù)據(jù)的全局信息,從而可能出現(xiàn)降維后低維空間的整體結(jié)構(gòu)特征與原始數(shù)據(jù)空間不一致,影響故障檢測的效果。為此,在LPP算法的基礎上,通過加入全局稀疏重構(gòu)信息,提出了稀疏保局投影(sparse locality preserving projections,SLPP)降維算法。新算法在高維數(shù)據(jù)降維過程中不僅能夠保持原始數(shù)據(jù)的局部近鄰結(jié)構(gòu),而且能夠保持數(shù)據(jù)間的全局稀疏重構(gòu)關系,更有利于提取過程數(shù)據(jù)的特征,SLPP的目標函數(shù)構(gòu)建如式(7)所示。當i= j時,目標函數(shù)保證原樣本與其對應重構(gòu)樣本在投影后的低維空間依然保持重構(gòu)誤差最??;當xi與xj為k近鄰時,目標函數(shù)保證投影后的低維空間具有和原始數(shù)據(jù)空間相似的局部結(jié)構(gòu)。
簡化式(7)所示目標函數(shù)
上述最優(yōu)化問題的求解可以最終由以下廣義特征值問題求解
2.3 動態(tài)稀疏保局投影
其中,l為滯后步長,根據(jù)經(jīng)驗一般取l =1或2??梢?,矩陣擴展后樣本數(shù)據(jù)減少到n l?,變量維數(shù)擴展為m( l + 1)。由于把過去時刻的變量測量值也作為當前時刻監(jiān)控數(shù)據(jù),考慮了不同時刻采樣點之間的關系,應用SLPP算法對上述增廣矩陣降維,便可以提取原始數(shù)據(jù)的動態(tài)特征,更有利于過程的故障檢測。是歸一化后的數(shù)據(jù)矩陣,考慮時序相關的特點將原始數(shù)據(jù)矩陣擴展為如下時滯增廣矩陣形式[16]
3.1 構(gòu)造監(jiān)控統(tǒng)計量
應用DSLPP算法進行數(shù)據(jù)降維后,分別對特征空間和殘差空間建立基于DSLPP的T2統(tǒng)計量和Q統(tǒng)計量[17]用于過程監(jiān)控。將DSLPP算法求得的投影矩陣記為(其中m為變量數(shù),d為低維空間維數(shù)),則有
其中,ynew是待檢測樣本xnew在特征空間的投影,Λ是正常工況數(shù)據(jù)特征空間的協(xié)方差矩陣。其中,為xnew的重構(gòu)向量,
由于T2和Q統(tǒng)計量的分布未知,本文通過核密度估計[18]分別獲得兩監(jiān)控統(tǒng)計量的控制限。
3.2 故障檢測算法實現(xiàn)
基于DSLPP算法的故障檢測過程包括離線建模和在線監(jiān)控兩個階段,具體實現(xiàn)步驟描述如下。
離線建模階段:
與此同時,醫(yī)院創(chuàng)新性地將重要的無菌包的使用納入智能耗材柜的管理,無菌包的領取與醫(yī)囑相關聯(lián),規(guī)范了無菌包的領取行為,實現(xiàn)無菌包使用的全程可追溯。
(1)采集過程正常運行數(shù)據(jù)并進行歸一化處理后,構(gòu)造擴展矩陣,得到數(shù)據(jù)集?X;(2)使用DSLPP算法對數(shù)據(jù)集?X進行特征提取,得到投影矩陣A;
(3)分別計算特征空間的T2統(tǒng)計量和殘差空間的Q統(tǒng)計量的控制限。
在線監(jiān)控階段:
(1)采集新的監(jiān)控樣本數(shù)據(jù)并進行歸一化處理后,構(gòu)造擴展矩陣,得到數(shù)據(jù)集;
(3)計算擴展樣本的T2統(tǒng)計量和Q統(tǒng)計量,并判斷是否超過相應控制限,若超過控制限,表明監(jiān)控過程發(fā)生故障。
算法流程圖如圖1所示。
圖1 DSLPP算法流程圖Fig.1 Flow chart of DSLPP
田納西-伊斯曼過程(Tennessee Eastman process,TEP)[19]包含22個連續(xù)測量變量,19個組分測量變量和12個操縱變量,本文中的研究只選取其中的22個連續(xù)測量變量和11個操縱變量用于故障監(jiān)控,由于組分測量變量在實際中很難測量,在這里不予考慮[20]。TEP有21種預設定的故障,這些故障中16個是已知的,5個是未知的。
采集正常工況下的960個數(shù)據(jù)作為訓練集,同樣采集960個故障工況下的數(shù)據(jù)作為測試集,故障于第161個樣本處加入。選取低維空間維數(shù)d =14,近鄰參數(shù)k =15,t =1,滯后步長l =1,所有置信限都設置為95%。為了降低誤報率,本文定義故障檢測時間為:第一次連續(xù)6個監(jiān)控樣本超過統(tǒng)計量控制限的時間。故障漏報率指故障發(fā)生后未報警樣本與實際故障樣本數(shù)目的比值。本文以故障10和故障19為例,分別運用LPP、SLPP和DSLPP方法對其建立統(tǒng)計量監(jiān)控模型,通過分析相應監(jiān)控圖和仿真結(jié)果數(shù)據(jù),比較3種方法的故障檢測性能。圖2和圖3分別為故障10和故障19的統(tǒng)計量監(jiān)控圖,定量的故障檢測結(jié)果見表1。
表1 3種方法TEP故障檢測結(jié)果Table 1 Fault detection results of TEP with 3 methods
故障10是由流2的C進料溫度發(fā)生隨機變化引起的,圖2為故障10的統(tǒng)計量監(jiān)控圖比較結(jié)果。結(jié)合表1的故障檢測結(jié)果可以發(fā)現(xiàn),LPP的T2統(tǒng)計量在第210個樣本處發(fā)現(xiàn)故障,但是卻不能持續(xù)檢測故障,整個監(jiān)控過程的漏報率很高;而SLPP的T2統(tǒng)計量在第182個樣本處發(fā)現(xiàn)故障,漏報率僅為10.25%;進一步考慮過程數(shù)據(jù)的動態(tài)性,DSLPP的T2統(tǒng)計量在第180個樣本處發(fā)現(xiàn)故障,漏報率降低為6.62%。另外,LPP、SLPP和DSLPP 3種方法的Q統(tǒng)計量分別在第195、185和176個樣本處檢測出故障,同樣表明了SLPP和DSLPP方法的優(yōu)越性。以上結(jié)果表明了SLPP方法可以提取原始數(shù)據(jù)更全面的信息,有助于提高過程監(jiān)控方法的故障檢測速度并降低其故障漏報率,而考慮過程數(shù)據(jù)動態(tài)性的DSLPP算法能進一步提高故障檢測性能。
圖2 故障10的監(jiān)控圖Fig.2 Monitoring charts of fault 10
圖3 故障19的監(jiān)控圖Fig.3 Monitoring charts of fault 19
故障19是一種未知故障,圖3是其統(tǒng)計量監(jiān)控圖。從T2統(tǒng)計量的結(jié)果來看,LPP在第343個樣本處檢測出故障,漏報率高達72.12%;SLPP的故障檢測效果要好很多,在第238個樣本處就檢測出故障,漏報率為51.12%;DSLPP效果最好,在第171個樣本處發(fā)現(xiàn)故障,漏報率進一步降低為41.62%。由此亦可以看出新算法檢測故障的有效性。
表1分別是3種故障檢測方法在一些典型故障發(fā)生時的故障檢測時間和故障漏報率。由表中數(shù)據(jù)可知,對于大多數(shù)故障情況,相比于LPP,SLPP無論在故障檢測時間方面還是故障漏報率方面都有著更出色的表現(xiàn),而進一步考慮過程數(shù)據(jù)動態(tài)性的DSLPP更有助于提高過程監(jiān)控方法的故障檢測速度并降低其故障漏報率。尤其對于故障10、16、19 和20,新方法可以大幅提高故障檢測性能。
本文在LPP算法的基礎上,通過加入全局稀疏重構(gòu)信息,并進一步考慮過程數(shù)據(jù)的動態(tài)性,提出了一種基于動態(tài)稀疏保局投影的故障檢測方法。新方法在高維數(shù)據(jù)降維過程中不僅能夠保持原始數(shù)據(jù)的局部近鄰結(jié)構(gòu),而且能夠保持數(shù)據(jù)間的全局稀疏重構(gòu)關系,更有利于對原始過程數(shù)據(jù)的特征提取,提高過程監(jiān)控方法的性能。TEP的仿真結(jié)果表明,與LPP方法相比,新方法能更迅速檢測故障發(fā)生并降低過程監(jiān)控漏報率。
References
[1] CHIANG L H, BRAATZ R D, RUSSELL E L. Fault Detection and Diagnosis in Industrial Systems [M]. Springer Science & Business Media, 2001.
[2] QIN S J. Survey on data-driven industrial process monitoring and diagnosis [J]. Annual Reviews in Control, 2012, 36 (2): 220-234.
[3] 王海清, 宋執(zhí)環(huán), 王慧. PCA 過程監(jiān)測方法的故障檢測行為分析[J]. 化工學報, 2002, 53 (3): 297-301.
WANG H Q, SONG Z H, WANG H. Fault detection behavior analysis of PCA-based process monitoring approach [J]. Journal of Chemical Industry and Engineering (China), 2002, 53 (3): 297-301.
[4] LI G, QIN S J, ZHOU D. Geometric properties of partial least squares for process monitoring [J]. Automatica, 2010, 46 (1): 204-210.
[5] SCH?LKOPF B, SMOLA A, MüLLER K R. Nonlinear component analysis as a kernel eigenvalue problem [J]. Neural Computation, 1998, 10 (5): 1299-1319.
[6] TENENBAUM J B, SILVA V D, LANGFORD J C. A global geometric framework for nonlinear dimensionality reduction [J]. Science, 2000, 290 (5500): 2319-2323.
[7] ROWEIS S T, SAUL L K. Nonlinear dimensionality reduction by locally linear embedding [J]. Science, 2000, 290 (5500): 2323-2326.
[8] BELKIN M, NIYOGI P. Laplacian eigenmaps for dimensionality reduction and data representation [J]. Neural Computation, 2003, 15 (6): 1373-1396.
[9] HE X F, NIYOGI P. Locality preserving projections[C] //Proceedings of Advances in Neural Information Processing Systems. MIT Press, 2004: 153-160.
[10] HU K, YUAN J. Multivariate statistical process control based on multiway locality preserving projections [J]. Journal of Process Control, 2008, 18 (7): 797-807.
[11] ZHANG M G, GE Z Q, SONG Z H, et al. Global–local structure analysis model and its application for fault detection and identification [J]. Industrial & Engineering Chemistry Research, 2011, 50 (11): 6837-6848.
[12] AHARON M, ELAD M, BRUCKSTEIN A. K-SVD: an algorithm for designing overcomplete dictionaries for sparse representation [J]. IEEE Transactions on Signal Processing, 2006, 54 (11): 4311-4322.
[13] 馬小虎, 譚延琪. 基于鑒別稀疏保持嵌入的人臉識別算法 [J]. 自動化學報, 2014, 40 (1): 73-82.
MA X H, TAN Y Q. Face recognition based on discriminant sparsity preserving embedding [J]. Acta Automatica Sinica, 2014, 40 (1): 73-82.
[14] QIAO L, CHEN S, TAN X. Sparsity preserving projections with applications to face recognition [J]. Pattern Recognition, 2010, 43 (1): 331-341.
[15] WRIGHT J, YANG A Y, GANESH A, et al. Robust face recognition via sparse representation [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009, 31 (2): 210-227.
[16] KU W, STORER R H, GEORGAKIS C. Disturbance detection and isolation by dynamic principal component analysis [J]. Chemometrics and Intelligent Laboratory Systems, 1995, 30 (1): 179-196.
[17] QIN S J. Statistical process monitoring: basics and beyond [J]. Journal of Chemometrics, 2003, 17 (8/9): 480-502.
[18] CHEN Q, WYNNE R J, GOULDING P, et al. The application of principal component analysis and kernel density estimation to enhance process monitoring [J]. Control Engineering Practice, 2000, 8 (5): 531-543.
[19] DOWNS J J, VOGEL E F. A plant-wide industrial process control problem [J]. Computers & Chemical Engineering, 1993, 17 (3): 245-255.
[20] LEE J M, QIN S J, LEE I B. Fault detection and diagnosis based on modified independent component analysis [J]. AIChE Journal, 2006, 52 (10): 3501-3514.
研究論文
Received date: 2015-11-26.
Foundation item: supported by the National Natural Science Foundation of China (61273160), and the Fundamental Research Funds for the Central Universities (14CX06132A).
Fault detection method based on dynamic sparse locality preserving projections
ZHENG Xin, TIAN Xuemin, ZHANG Hanyuan
(College of Information and Control Engineering, China University of Petroleum (East China), Qingdao 266580, Shandong, China)
Abstract:In order to deal with the problem that locality preserving projections (LPP) does not take into account the global structure and dynamic characteristic of process data, a new fault detection method based on dynamic sparse locality preserving projections (DSLPP) is proposed. In the study, the original data matrix is firstly extended to a time-delay augmented matrix. Then, a sparse coefficient matrix which can represent global sparse reconstructive relationship of data is gotten by solving an optimal problem of sparse representation (SR). The sparse coefficient matrix combines with the objective function of LPP to form a new objective function for dimensionality reduction. The new dimensionality reduction algorithm can not only preserve the local neighbor structure of the original data space, but also have better effect in preserving the global sparse reconstructive relationship. At last, DSLPP-based T2and Q statistics are constructed respectively in the feature space and residual space for fault detection.The simulation results of Tennessee Eastman process demonstrate that the proposed method detects faults more quickly and achieves lower fault missing alarm rate than the LPP method.
Key words:fault detection; locality preserving projections; sparse representation; feature extraction; process monitoring
DOI:10.11949/j.issn.0438-1157.20151769
中圖分類號:TP 277
文獻標志碼:A
文章編號:0438—1157(2016)03—0833—06
基金項目:國家自然科學基金項目(61273160);中央高校基本科研業(yè)務費專項資金(14CX06132A)。
Corresponding author:Prof. TIAN Xuemin, tianxm@upc.edu.cn