張 成,鄭百順,郭青秀,馮立偉,李 元
(沈陽化工大學(xué)技術(shù)過程故障診斷與安全性研究中心,遼寧沈陽 110142)
隨著現(xiàn)代工業(yè)的發(fā)展趨勢逐漸轉(zhuǎn)向大型化、復(fù)雜化,工業(yè)系統(tǒng)的安全性和可靠性成為亟待解決的問題.為了有效監(jiān)控過程健康狀態(tài),近年來,深度學(xué)習(xí)算法及基于數(shù)據(jù)驅(qū)動的多元統(tǒng)計方法已經(jīng)被廣泛應(yīng)用于生產(chǎn)過程故障診斷領(lǐng)域[1-4].
基于數(shù)據(jù)驅(qū)動的主元分析(principle component analysis,PCA)是一種經(jīng)典的線性降維算法[5].近年來,以PCA為基礎(chǔ)的各類衍生方法相繼被提出,如動態(tài)PCA(dynamic PCA,DPCA)、貝葉斯融合動態(tài)PCA(integrated dynamic PCA,IDPCA)等[6-7].通?;赑CA的一系列方法所獲得的低維數(shù)據(jù)包含原始數(shù)據(jù)更多有效信息.為了在低維空間中保持原始數(shù)據(jù)的近鄰結(jié)構(gòu),多種經(jīng)典的非線性流形算法被提出,如拉普拉斯特征映射(laplacian eigenmaps,LE)、局部線性嵌入(locally linear embedding,LLE)和等距特征映射(isometric feature mapping,ISOMAP)等[8-10].上述方法能夠有效提取數(shù)據(jù)的流形結(jié)構(gòu),但是它們的非線性性質(zhì)使其計算量較大[11].因此,He等根據(jù)此類缺陷提出了局部保持嵌入(neighborhood preserving embedding,NPE)的算法[11].與PCA相比較,NPE作為一種線性降維算法,能夠在低維空間描述原始數(shù)據(jù)的局部流形結(jié)構(gòu),對異常值的敏感度低于PCA且適合實際應(yīng)用[11].然而,NPE與PCA同樣應(yīng)用T2和SPE統(tǒng)計量監(jiān)控樣本狀態(tài),文獻(xiàn)[12]指出對于多模態(tài)和非線性過程,上述統(tǒng)計量不能有效完成狀態(tài)監(jiān)控.因此,NPE在監(jiān)控多模態(tài)過程故障時不夠完善[13].
針對上述方法的局限性,He等提出的K近鄰(K nearest neighbor,KNN)方法被應(yīng)用到多模態(tài)過程故障檢測中[12].KNN通過尋找數(shù)據(jù)近鄰特征,有效降低了非線性和多模態(tài)特征對故障檢測的影響,提高過程故障檢測率.然而,KNN方法受方差差異明顯的多模態(tài)影響會導(dǎo)致故障漏報[14-15].為了提高KNN方法的故障檢測率,多種改進(jìn)KNN方法被提出,但是此類方法都面臨耗時長且計算復(fù)雜度高的問題[16-17].
針對方差差異顯著的多模態(tài)間歇過程故障檢測問題,本文提出局部保持嵌入-K近鄰比率密度(neighborhood preserving embedding-K nearest neighbor ratio density,NPE-KRD)規(guī)則的故障檢測方法.首先,利用NPE計算負(fù)載矩陣將高維數(shù)據(jù)投影到低維空間;其次,在低維空間計算每個數(shù)據(jù)點的K近鄰比率密度;最后,根據(jù)樣本的K近鄰比率密度統(tǒng)計值進(jìn)行故障檢測.NPE-KRD不但繼承NPE保持原始數(shù)據(jù)局部幾何結(jié)構(gòu)的優(yōu)勢,而且通過KRD方法能夠有效處理以上多模態(tài)過程的故障檢測問題.
假設(shè)原始數(shù)據(jù)集X含有m個樣本,n個變量.NPE通過計算負(fù)載矩陣A,將高維空間中的m個樣本點投影到低維空間,得到新的數(shù)據(jù)集Ym×d,其中d為數(shù)據(jù)降維后變量數(shù).
第1步 通過優(yōu)化式(1),計算權(quán)重矩陣W:
其中:xi為原始樣本點為樣本xi的第j個近鄰,wij為樣本點xi與其近鄰的關(guān)系權(quán)重.
第2步 通過式(2)使樣本的局部近鄰結(jié)構(gòu)得到保持,得到投影矩陣A:
其中yi=xia為樣本投影后的點.通過拉格朗日函數(shù)法可將最優(yōu)化求解問題轉(zhuǎn)化為廣義特征矩陣中特征值問題,如式(3)所示:
式(3)中l(wèi)個最小特征值所對應(yīng)的特征向量構(gòu)成投影矩陣,即A=(a1,a2,a3,…,al),樣本x*投影后可表示為
NPE在過程監(jiān)控中使用T2和SPE統(tǒng)計量,如式(5)和式(6)所示:
其中Λ是Y 的協(xié)方差矩陣,并根據(jù)核密度估計法確定T2和SPE統(tǒng)計量控制限[18].
KNN方法通過計算樣本與其前K個近鄰的距離平方和對過程進(jìn)行監(jiān)控.文獻(xiàn)[12]指出KNN在處理方差差異較大的多模態(tài)過程存在一定缺陷.為了有效監(jiān)控方差差異顯著的多模態(tài)過程,本節(jié)提出了一種K近鄰比率密度(K nearest neighbor ratio density,KRD)的方案.
目前,Rodriguez 提出一種計算局部密度的方法[19],具體過程如下:
首先,計算樣本點xi與樣本點xj之間的距離如式(7)所示:
然后,計算樣本點的密度?i,如式(8)所示:
其中:1≤j≤m,j/=i,dc為可按百分比參數(shù)求得的截止距離[20].
為了有效監(jiān)控多模態(tài)過程,建立樣本的統(tǒng)計量R,如式(9)所示:
由于各模態(tài)數(shù)據(jù)點的密度不同,當(dāng)正常樣本的?i較小時,ω也相應(yīng)較小.當(dāng)正常樣本的?i較大時,ω也相應(yīng)較大.通過計算每個樣本的統(tǒng)計指標(biāo)R,使得各模態(tài)中樣本點對統(tǒng)計量的貢獻(xiàn)度為同一水平且統(tǒng)計值在1附近波動,實現(xiàn)故障樣本與正常樣本分離的目的.與KNN方法相比較,KRD不僅可以降低多模態(tài)方差差異對故障檢測的影響,同時還能夠有效監(jiān)控過程密集模態(tài)的健康狀態(tài).
在多模態(tài)故障檢測過程中,當(dāng)樣本維數(shù)較高時,KRD方法會出現(xiàn)與KNN方法同樣的計算量大的問題.因此,先利用NPE方法進(jìn)行維數(shù)約簡,接下來在低維空間使用KRD進(jìn)行故障檢測.其故障檢測過程分為離線建模和在線檢測,如下所示:
離線建模具體步驟:
1) 利用Z-SCORE標(biāo)準(zhǔn)化方法處理得到的數(shù)據(jù)集X;
2) 利用式(3)計算A,經(jīng)過式(4)得到降維后的數(shù)據(jù)集Y;
3) 通過式(9)計算樣本yi的KRD統(tǒng)計值R;
4) 根據(jù)核密度估計法得到控制限Rα.
在線檢測具體步驟:
1) 對測試樣本x*進(jìn)行標(biāo)準(zhǔn)化;
2) 利用式(4)將x*投影到低維子空間中,得到樣本點y*;
3) 由式(9)得出y*的KRD統(tǒng)計值R*;
4) 若R*小于Rα,則x*為正常樣本;否則,x*為故障樣本.
一旦過程發(fā)生故障,需要診斷故障發(fā)生原因,進(jìn)而對故障進(jìn)行準(zhǔn)確定位.相對于正常數(shù)據(jù),故障數(shù)據(jù)的分布軌跡與其存在本質(zhì)上的差異,即當(dāng)樣本密度小于正常樣本密度時,判定此樣本為故障樣本.原因在于樣本的某些變量發(fā)生變化使之與正常樣本偏離.實質(zhì)上就是故障樣本到其第K近鄰的距離大于正常樣本到其第K近鄰的距離.在故障診斷過程中,變量的貢獻(xiàn)大是故障生成的主要原因.NPE-KRD診斷過程如下:
首先,在低維空間內(nèi)計算樣本與其第K近鄰樣本的距離,如式(10)所示:
然后,計算變量xj對Π的貢獻(xiàn),如式(11)所示:
本節(jié)應(yīng)用數(shù)值例子對NPE-KRD方法進(jìn)行說明,模型如下:
其中每個模態(tài)均包括4個變量,主要變量為x,y,各模態(tài)其余2個變量和e都是微小白噪聲.對模型中的兩個模態(tài)各生成250個樣本組成訓(xùn)練集合,同時各生成50個樣本組成校驗集合,并在密集模態(tài)1中通過對變量y增加擾動生成100個故障樣本.數(shù)據(jù)分布特征如圖1所示,由圖1可知兩個模態(tài)數(shù)據(jù)具有不同的分散程度,密集數(shù)據(jù)源于模態(tài)1,稀疏數(shù)據(jù)源于模態(tài)2.
PCA,DPCA,NPE,KNN,KRD和NPE-KRD方法被應(yīng)用到本節(jié)對該例進(jìn)行故障檢測.PCA,NPE及NPE-KRD的主元個數(shù)(principal components,PCs)選取為2,DPCA的PCs選取為3,時滯參數(shù)為2.本節(jié)例子近鄰數(shù)K選取為3.KRD和NPE-KRD中的dc設(shè)定為1.42和0.91.
由圖2-4 可知,PCA 和NPE 故障檢測率為零,DPCA故障檢測率接近于零,主要原因是NPE,PCA和DPCA在故障檢測中都假設(shè)數(shù)據(jù)得分服從多元高斯分布,如圖5可知PCA得分分布曲線偏離直線軌跡,因此,本例多模態(tài)數(shù)據(jù)得分不滿足假設(shè)條件.由圖6可知,KNN未能有效地在數(shù)據(jù)中提取出全部故障,主要原因是KNN方法在處理方差異顯著的多模態(tài)過程時存在缺陷.KRD 和NPE-KRD 故障檢測結(jié)果如圖7 和圖8所示,可看出兩種方法的故障檢測率相近.相對而言,NPE-KRD方法檢測效率更高,如圖9所示.
圖2 PCA檢測結(jié)果Fig.2 Fault detection results using PCA
圖3 DPCA檢測結(jié)果Fig.3 Fault detection results using DPCA
圖4 NPE檢測結(jié)果Fig.4 Fault detection results using NPE
圖5 得分變量關(guān)系圖Fig.5 Relation of score variables
圖6 KNN檢測結(jié)果Fig.6 Fault detection results using KNN
圖7 KRD檢測結(jié)果Fig.7 Fault detection results using KRD
圖8 NPE-KRD檢測結(jié)果Fig.8 Fault detection results using NPE-KRD
圖9 KRD與NPE-KRD檢測累計耗時Fig.9 Cumulative time of KRD and NPE-KRD
最后,對本例進(jìn)行故障診斷,結(jié)果如圖10所示.由圖可知在所有變量中變量2的貢獻(xiàn)占比較高,因此可判定故障是由變量2發(fā)生異常變化所引起.本節(jié)中數(shù)值例子在變量y(即第2變量)上增加擾動生成故障,結(jié)果驗證了診斷策略的有效性.
圖10 變量貢獻(xiàn)圖Fig.10 Contribution charts of monitored variables
本節(jié)所應(yīng)用的半導(dǎo)體數(shù)據(jù)源于美國德州儀器公司的半導(dǎo)體生產(chǎn)過程[21],數(shù)據(jù)集包含3個實驗過程的108個正常批次、21個故障批次.前34個批次源于第一工況,35到71批次源于第二工況,余下批次源于第三工況.依據(jù)文獻(xiàn)[22],將正常樣本分為訓(xùn)練集和校驗集,其中訓(xùn)練集包含101個樣本,校驗集包含6個樣本.應(yīng)用PCA,DPCA,NPE,KNN,KRD以及NPE-KRD對該過程進(jìn)行監(jiān)控,參數(shù)設(shè)置如表1所示,檢測率見表2.
表1 參數(shù)確定Table 1 Parameter determinations
表2 故障檢測率Table 2 Fault detection rates
由于半導(dǎo)體數(shù)據(jù)具有多模態(tài)特征,而PCA和NPE適用于單模態(tài)故障檢測,因此檢測率較低;此外,3種工況分散程度不同引起KNN具有較低故障檢測率.DPCA方法可以有效提取過程動態(tài)特征,因而,在半導(dǎo)體工業(yè)過程具有較好的故障檢測效果.但是本例中的多模態(tài)特征仍然制約該方法的監(jiān)控效果.
相比于KRD方法,NPE-KRD具有更好的故障檢測性能,檢測率達(dá)到100%,如圖11-12.主要原因是本文方法利用NPE削弱了離群點的對故障檢測的作用,從而提高了故障檢測率.
圖11 KRD檢測結(jié)果Fig.11 Fault detection results using KRD
圖12 NPE-KRD檢測結(jié)果Fig.12 Fault detection results using NPE-KRD
本節(jié)分別對故障1、故障4和故障10進(jìn)行診斷,其結(jié)果如圖13-15所示.針對故障1,可看出變量13具有較大的貢獻(xiàn),因此變量13是故障發(fā)生的主要原因.由文獻(xiàn)[23]知故障1的故障類型為TCP+50,變量13對應(yīng)變量名為TCP impedance,符合半導(dǎo)體數(shù)據(jù)故障設(shè)置.同理,故障4和10的異常變量為26和13,分別為變量Chamber Pressure的方差和TCP tuner的均值.診斷結(jié)果與文獻(xiàn)[23]所述一致.
圖13 故障1的變量貢獻(xiàn)圖Fig.13 Contribution charts of variables for fault 1
圖14 故障4的變量貢獻(xiàn)圖Fig.14 Contribution charts of variables for fault 4
圖15 故障10的變量貢獻(xiàn)圖Fig.15 Contribution charts of variables for fault 10
針對多模態(tài)質(zhì)量監(jiān)控問題,本文提出了一種基于NPE-KRD的故障檢測方法.NPE-KRD不僅降低了故障檢測過程的計算復(fù)雜度,還提高過程的故障檢測率.相比傳統(tǒng)的NPE,KNN等方法,本文方法更適合完成模態(tài)方差差異顯著的過程監(jiān)控.數(shù)值例子及半導(dǎo)體工業(yè)過程的仿真實驗驗證了本文方法的有效性.