, , , ,
(華東理工大學化工過程先進控制和優(yōu)化技術教育部重點實驗室,上海 200237)
IFA和FA聯(lián)合方法在化工過程監(jiān)控中的應用
丁英濤,程輝,王振雷,梅華,趙亮
(華東理工大學化工過程先進控制和優(yōu)化技術教育部重點實驗室,上海200237)
工業(yè)過程數(shù)據(jù)具有高斯和非高斯混合分布的特點。獨立因子分析(IFA)采用一維高斯混合模型擬合任意的因子分布,因此可以處理高斯和非高斯混合的問題。雖然在給定因子數(shù)的前提下變分IFA算法可以有效地縮短建模時間,但是獨立因子數(shù)的選擇仍然需要較長的計算時間。此外,若IFA的因子數(shù)選擇不當,會造成部分因子的信息遺留在觀察變量的殘差中,導致GSPE監(jiān)控指標的監(jiān)控性能變差。為了解決IFA在實際應用中存在的問題,本文結(jié)合了IFA和FA方法。首先使用FA輔助IFA選取獨立因子數(shù),以進一步減小IFA建模時間;其次使用FA對IFA的殘差進行再處理,以解決由于獨立因子數(shù)選擇不當造成的問題。最后將該方法應用于田納西-伊斯曼(TE)過程和乙烯裂解爐過程的監(jiān)控中,實驗結(jié)果驗證了該聯(lián)合方法的有效性。
因子分析; 獨立因子分析; 改進的綜合監(jiān)控指標; 噪聲空間指標; 非高斯
近年來,現(xiàn)代工業(yè)過程日益大型化和復雜化,企業(yè)對生產(chǎn)過程的安全、產(chǎn)品的質(zhì)量以及生產(chǎn)效率的提高等方面的要求日益嚴格,因此工業(yè)過程監(jiān)控技術越來越受到工業(yè)界和學術界的重視。同時,伴隨著傳感器技術和計算機技術的快速發(fā)展,大量的工業(yè)過程數(shù)據(jù)被記錄下來,因此基于數(shù)據(jù)驅(qū)動的多元統(tǒng)計過程監(jiān)控MSPM技術越來越受到關注[1-3]。
本文使用FA改善IFA在工業(yè)過程中的應用性能。首先,使用FA輔助IFA選取合適的獨立因子數(shù)以減小建模時間;其次,使用FA處理IFA的殘差,以提取殘差中的剩余因子信息,并使用FA的改進的綜合指標(MST)對化工過程進行監(jiān)控。
IFA和FA聯(lián)合方法包含兩步:(1)使用FA輔助IFA選取獨立因子數(shù),并使用變分IFA建立獨立因子模型,接著使用LMS估計器重構(gòu)獨立因子,最后得到觀測變量的殘差。(2)使用FA對觀測變量的殘差進行建模,并使用FA的MST監(jiān)控指標判斷是否有故障發(fā)生。將IFA和FA聯(lián)合方法應用到納西-伊斯曼(TE)過程和乙烯裂解爐的過程監(jiān)控中,結(jié)果證明了該方法的有效性。
1.1IF模型中因子變量的概率模型
獨立因子(IF)模型使用較少的因子和線性函數(shù)來表達觀測變量x,以達到適宜地解釋原觀測變量x的相關性、降低數(shù)據(jù)的維度和保留大部分信息的目的。IF模型中因子之間相互獨立。
IF模型定義如下:
x=Hf+u
(1)
在IF模型中,第i個因子fi的概率密度使用ni個一維的高斯函數(shù)混合而成,qi=1,2,…,ni,其第qi個高斯函數(shù)對應的均值為μi,qi、方差為vi,qi、混合權(quán)重為wi,qi。故因子fi的概率密度為
(2)
其中:θi={wi,qi,μi,qi,vi,qi},且第i個因子分量的混合權(quán)重的和為1,即∑qiwi,qi=1;G為高斯函數(shù)。
IF模型中因子之間相互獨立,故因子f的聯(lián)合概率密度為
(3)
1.2觀測變量概率模型
為了建立觀測變量的概率模型,需要為因子變量fi選取ni個個體隱藏狀態(tài),并為個體隱藏狀態(tài)qi選取對應的均值μi,qi、方差vi,qi和混合權(quán)重wi,qi。由式(4)~ 式(6)可求得集體狀態(tài)q每一組狀態(tài)對應的參數(shù)wq、μq和Vq。即可得到獨立因子f關于q的條件概率密度為
p(f|q)=G(f-μq,Vq)
(7)
觀測數(shù)據(jù)向量x的概率密度為
(8)
p(x|q)=G(x-Hμq,HVqHT+Λ)
(9)
其中,W為獨立因子模型的參數(shù)集合。
1.3EM算法求解IF模型的參數(shù)
使用EM算法求解IF概率模型的參數(shù),可選取似然函數(shù)E[lgp(x,f,q|W)]為目標函數(shù)。EM算法分為E步和M步。
(1) E步。計算似然函數(shù)的期望值,即
F(W′,W)=-E[lgp(x,f,q|W)]+FH(W′)
(10)
其中:W′是上一次迭代求得的參數(shù)集合值;FH(W′)為獨立因子后驗的負熵且與W無關。
(2) M步。最小化F(W′,W)求得新的參數(shù)集合
(11)
其中,W′是上一次迭代求得的參數(shù)集合值。
由EM算法推導出IF模型的參數(shù)集合W=(H,Λ,wq,μq,Vq)有如下學習規(guī)則:
(12)
Λ=ExxT-Ex〈fT|x〉HT
(13)
(14)
(15)
wi,qi=Ep(qi|x)
(16)
重復迭代式(12)~ 式(16)直至收斂。
1.4因子變量估計器
在重構(gòu)獨立因子之前需解決精確IFA (Exact IFA)的不可計算問題。變分IFA (Varitional IFA)使用變分近似算法可有效地解決不可計算問題,故本文采用變分IFA算法。
獲得IF模型參數(shù)后,就可以利用觀測數(shù)據(jù)重構(gòu)因子變量。文獻[11]中給出最小均方差(LMS)和最大后延概率(MAP)兩種估計器,這兩種估計器都是關于觀測數(shù)據(jù)的非線性函數(shù),滿足不同的最優(yōu)準則。當因子變量服從非高斯分布時,對于變分IFA算法,LMS估計器的性能優(yōu)于MAP估計器。故本文采用LMS估計器重構(gòu)因子變量,LMS估計器為
(17)
2.1因子數(shù)的選取
由于獨立因子數(shù)的選擇關系著最終的監(jiān)控效果,因此本文采用FA改善IFA算法的性能。一方面,FA建立的因子模型的因子數(shù)是IF模型的獨立因子數(shù)選擇的一個重要參數(shù),該參數(shù)可用于縮小IFA獨立因子數(shù)的選取范圍;另一方面,若選擇的因子數(shù)不當,FA可對IFA得到的殘差進行再處理并提取出遺留的因子信息,進而改善監(jiān)控指標性能。
若使用文獻[12]給出的采樣數(shù)據(jù)信息解釋率收斂法選取合適的獨立因子數(shù),即逐步增加因子數(shù),并建立相應的IF模型,然后通過式(18)選取最佳的IF模型和因子數(shù),這樣會使得IFA算法建立多個IF模型,計算量很大。IFA算法獨立因子數(shù)的選取判斷公式[12]如下:
(18)
從采樣數(shù)據(jù)信息解釋率的角度看,FA算法僅提取出觀測數(shù)據(jù)中的高斯信息,而IFA可以提取出觀測數(shù)據(jù)中的高斯和非高斯信息,因此IFA提取出的獨立因子數(shù)k將不小于FA提取出的因子數(shù)kF,即kF≤k。此外,獨立因子數(shù)的選取應滿足Lederman條件[12]。因此最佳的獨立因子數(shù)k應滿足如下條件:
(19)
2.2監(jiān)控指標的建立
由于IF模型中因子服從任意分布,因此IFA算法無法使用FA的監(jiān)控指標。文獻[12]借鑒ICA的GI2和GSPE兩個監(jiān)控指標,定義了IFA的GI2和GSPE兩個監(jiān)控指標。
獨立因子空間的GI2監(jiān)控指標為
(20)
(21)
所以噪聲空間的監(jiān)控指標GSPE為
(22)
其中GI2和GSPE監(jiān)控指標的監(jiān)控限可使用核密度估計(KDE)求得[13]。
以上GSPE監(jiān)控指標是基于歐氏距離定義的,若發(fā)生微小的故障,將導致噪聲向量某些方向上的微小變化,求得噪聲向量歐氏距離后,微小的變化會被忽略,從而導致微小故障無法有效監(jiān)測,使得監(jiān)控效果不佳。而馬氏距離可以放大微小誤差,并且可以消除變量之間的相關性。故本文基于馬氏距離改進的噪聲空間監(jiān)控指標定義如下:
(23)
改進的GSPE監(jiān)控指標的監(jiān)控限可使用KDE求得。表1中列出了文獻[12]的GSPE和改進的GSPE (Modified GSPE)監(jiān)測結(jié)果,證明了改進的GESP的有效性,并自此開始以GSPE表示為改進的GSPE監(jiān)控指標。
表1 TE過程故障5、11、16、20使用GSPE和Modified GSPE 監(jiān)控指標的漏報率和誤報率
對于IFA算法,觀測數(shù)據(jù)的大部分信息得到解釋以后,獨立因子數(shù)的增加不再引起解釋信息的進一步增加,然而獨立因子數(shù)選取較小時會影響信息解釋率,并會造成部分信息流失到噪聲空間[10],從而影響了GSPE監(jiān)控指標的監(jiān)控性能。
由于使用FA算法對獨立因子模型的殘差進行處理,所以IFA-FA算法對獨立因子數(shù)的選擇具有一定的魯棒性,因此可用式(19)得到范圍內(nèi)選取獨立因子數(shù)。
FA的ST監(jiān)控指標定義如下[14]:
(24)
其中:A∈Rm×k為因子負載矩陣;Φ為噪聲方差。
閔可夫斯基距離定義如下:
(25)
對于閔氏距離,若兩個點之間某一方向的距離較大時,距離公式將會放大該方向的作用,因此可利用該特點加大故障數(shù)據(jù)和非故障數(shù)據(jù)之間的距離,進而提高對故障的敏銳度。然而閔氏距離易受到量綱的影響,故在使用閔氏距離前需要對數(shù)據(jù)進行標準化處理。由式(24)可得
(26)
(27)
其監(jiān)控限可使用KDE求得。
2.3基于IFA-FA聯(lián)合算法故障檢測步驟
IFA-FA聯(lián)合算法包括離線建模和在線監(jiān)測。
離線建模:
(1) 對采集的正常工況的數(shù)據(jù)x∈Rm×n均值中心化和標準化處理。
(2) 使用式(19)得到獨立因子數(shù)的取值范圍,從中選取獨立因子數(shù)。
(3) 使用選定獨立因子數(shù)的IFA對數(shù)據(jù)進行學習建模,并得到IF模型的參數(shù)集合WIF。
(8) 使用式(27)和KDE方法得到MST監(jiān)控指標的監(jiān)控限。
在線監(jiān)控:
(1) 獲取實時數(shù)據(jù),并對數(shù)據(jù)進行均值中心化和標準化處理。
(2) 使用IF模型參數(shù)集WIF,使用式(17)得到因子得分。
(4) 基于式(27)計算MST的值,使用該值與其監(jiān)控限進行比較以判斷是否發(fā)生故障。
3.1TE過程模型
TE過程是一個基于現(xiàn)實工業(yè)過程的仿真模型,為過程控制和監(jiān)控算法提供了可以研究和評價的平臺[15]。TE過程包含5個主要模塊,8種主要的物質(zhì)成分包括4種反應物、2種生成物、1種副產(chǎn)品和1種惰性成分。TE過程包括41個測量變量和12個控制變量[15-16]。圖1為TE過程的流程圖[17]。
圖1 TE過程流程圖Fig.1 Flow chart of TE process
3.2基于IFA-FA聯(lián)合算法的TE過程仿真
仿真實驗中,選取52維900組的正常數(shù)據(jù),并對其進行標準化處理,選取獨立因子數(shù),然后使用IFA算法重構(gòu)獨立因子變量,并利用混合矩陣和獨立因子變量得到觀測變量對應的殘差,最后利用殘差估計出相應監(jiān)控限。在線監(jiān)控時,分別選用21個測試集數(shù)據(jù),這些測試集數(shù)據(jù)前160組為正常數(shù)據(jù),在第161組數(shù)據(jù)時引入不同類型的故障[18]。采用本文方法得到相應的監(jiān)控指標值,并與監(jiān)控限比較以判斷其是否超限。
獨立因子數(shù)的選取對于IFA算法至關重要。對于TE過程,通過式(19)可以得到獨立因子數(shù)的范圍為22~40,表2列出了故障11、16和19在選取不同獨立因子數(shù)時的故障檢測結(jié)果。如表2所示,獨立因子數(shù)為22~40時具有相近的故障監(jiān)測效果,證明了IFA-FA對獨立因子數(shù)的選擇具有魯棒性。本文使用FA算法輔助IFA算法選定因子數(shù)為33,建模時間約為10 min。若使用信息解釋率收斂法選定最佳因子數(shù)并建立模型,建模時間約為120 min。
經(jīng)過多次實驗仿真,IFA-FA聯(lián)合算法的故障監(jiān)測結(jié)果和其他算法的比較結(jié)果見表3。
表2 選取不同獨立因子數(shù)時IFA-FA算法的MST監(jiān)控指標對TE過程的故障11,16和19監(jiān)測結(jié)果
由表3可知,本文提出的方法對多種類型故障具有較好的監(jiān)測結(jié)果。需要指出,各種基于數(shù)據(jù)的驅(qū)動方法對于故障3、9和15都有較高的漏報率,所以本文沒有考慮這3種故障。故障11是反應器冷卻水入口溫度發(fā)生隨機變化而導致的,該故障會使得反應器冷卻水流產(chǎn)生波動,而其他的50個變量基本保持在設定點不變,傳統(tǒng)的FA算法有較高的漏檢率[19]。對于故障11,使用本文的IFA和FA聯(lián)合算法的MST監(jiān)控指標效果明顯較好,相比于其他的監(jiān)控指標,MST監(jiān)控指標的漏報率降低了10%,而IFA算法的GSPE監(jiān)控指標的監(jiān)控效果略有改善,如圖2所示。通過TE過程仿真實驗,可以看出本文提出的IFA-FA算法可以有效地解決高斯和非高斯的混合問題,并提高了故障的監(jiān)測率。表4列出了IFA-FA與其他算法[8-9,20-21]的監(jiān)測結(jié)果,進一步證明了本文方法的有效性和優(yōu)越性。
圖2 TE過程故障11的監(jiān)測結(jié)果對比Fig.2 Comparison of monitoring fault 11 of the TE process
表4 IFA-FA和其他算法用于TE過程時故障5、10、11、16、19、20和21的漏報率
為了驗證本文方法和監(jiān)控指標的可應用性,以某企業(yè)的SL-II大型乙烯裂解爐為研究對象。乙烯裂解爐的具體結(jié)構(gòu)見圖3,裂解原料(石腦油、乙烷等)在裂解爐中經(jīng)過高溫爐管發(fā)生裂解反應,裂解為乙烯、丙烯等基本化工原料。
本文使用的數(shù)據(jù)為從現(xiàn)場采集的工業(yè)數(shù)據(jù),并選取對裂解效果影響最大的33個變量進行監(jiān)控,前150個數(shù)據(jù)為正常數(shù)據(jù),后150個為故障數(shù)據(jù)。
裂解爐運行中常見故障有3種[22]:爐管輻射段出口壓力隨機波動、爐管橫跨段溫度階躍變化、爐管出口溫度傳感器增益變化。當乙烯裂解爐工作在安全平穩(wěn)的工況下時,監(jiān)控指標應低于其控制限。使用IFA-FA聯(lián)合算法和MST監(jiān)控指標對故障1、2、3進行監(jiān)控,其監(jiān)控結(jié)果分別如表5和圖4所示。
表5中的故障1、2、3分別對應著3種不同的故障類型,即隨機故障、階躍故障、增益故障。如表5所示,IFA-FA聯(lián)合算法的MST監(jiān)控指標的監(jiān)控效果要好于FA的ST監(jiān)控指標和ICA-SVDD的D2監(jiān)控指標,并且IFA的GSPE監(jiān)控指標對于故障1、2、3的監(jiān)控效果明顯要弱于IFA-FA的MST監(jiān)控指標。本文方法對3種類型故障都有較低的漏檢率和誤檢率。而且由圖4可知,MST對故障有較好的監(jiān)控效果。從而證明了該方法的可行性。
圖3 乙烯裂解爐結(jié)構(gòu)圖Fig.3 Structure of ethylene cracking furnace
表5 乙烯裂解爐工作過程故障1、2、3檢測的漏報率和誤報率
圖4 乙烯裂解爐正常、故障1、故障2、故障3的監(jiān)控結(jié)果Fig.4 Monitoring results of the ethylene cracking furnace of normal model,fault 1,fault 2 and fault 3
為了更好地解決非高斯和高斯混合分布問題,提高對工業(yè)過程進行有效的過程監(jiān)控。本文提出了IFA-FA聯(lián)合算法和相應的MST監(jiān)控指標。通過TE過程仿真結(jié)果驗證了該方法的可行性和有效性,并通過對乙烯裂解爐的仿真證明了該方法運用到實際過程的可行性。但是IFA-FA算法僅僅使用了殘差矩陣去監(jiān)控化工過程,沒有利用獨立因子變量中的信息。
[1] JIANG Q,WANG B,YAN X.Multiblock independent component analysis integrated with Hellinger distance and Bayesian inference for non-Gaussian plant-wide process monitoring[J].Industrial & Engineering Chemistry Research,2015,54(9):2497-2508.
[2] HUANG Jian,YAN Xuefeng.Dynamic process fault detection and diagnosis based on dynamic principal component analysis,dynamic independent component analysis and Bayesian inference[J].Chemometrics and Intelligent Laboratory Systems,2015,148:115-127.
[3] HUANG Jian,YAN Xuefeng.Double-step block division plant-wide fault detection and diagnosis based on variable distributions and relevant features[J].Journal of Chemometrics,2015,29(11):587-605.
[4] LI W,YUE H H,VALLE-CERVANTES S,etal.Recursive PCA for adaptive process monitoring[J].Journal of Process Control,2000,10(5):471-486.
[5] 趙忠蓋,劉飛.動態(tài)因子分析模型及其在過程監(jiān)控中的應用[J],化工學報,2009,60 (1):183-186.
[7] LEE J M,YOO C K,LEE I B.Statistical process monitoring with independent component analysis[J].Journal of Process Control,2004,14(5):467-485.
[8] 劉雪琴,謝磊,張建明,等.基于ICA-SVDD的統(tǒng)計過程監(jiān)控及其在化工過程中的應用[C]//2006全國石油化工生產(chǎn)安全與控制學術交流會.北京:中國化工學會,2006:21-25.
[9] GE Zhiqiang,SONG Zhihuan.Process monitoring based on independent component analysis-principal component analysis (ICA-PCA) and similarity factors [J].Industrial & Engineering Chemistry Research,2007,46(7):2054-2063.
[10] 尹雪巖,劉飛.基于DIFA的動態(tài)非高斯過程監(jiān)控方法及應用[J].化工學報,2011,62(5):1345-1351.
[11] ATTIAS H.Independent factor analysis[J].Neural Computation,1999,4(11):803-851.
[12] 尹雪巖,劉飛.獨立因子分析方法在過程監(jiān)控中的應用[J].計算機與應用化學,2010,27 (10):1353-1356.
[13] LI X,YANG Y,ZHANG W.Statistical process monitoring via generalized non-negative matrix projection[J].Chemometrics and Intelligent Laboratory Systems,2013,121:15-25.
[14] 趙忠蓋,劉飛.因子分析及其在過程監(jiān)控中的應用[J].化工學報,2007,58 (4):970-974.
[15] SHEN Y,DING S X,HAGHANI A,etal.A comparison study of basic data-driven fault diagnosis and process monitoring methods on the benchmark Tennessee Eastman process[J]. Journal of Process Control,2012,22(9):1567-1581.
[16] DOWNS J J,VOGEL E F.A plant-wide industrial process control problem[J].Computers & Chemical Engineering,1993,17(3):245-255.
[17] JIANG Q,YAN X.Probabilistic weighted NPE-SVDD for chemical process monitoring[J].Control Engineering Practice,2014,28:74-89.
[18] BATHELT A,RICKER N L,JELALI M.Revision of the Tennessee Eastman process model[J].International Symposium on Advanced Control of Chemical Processes,2015,48(8):309-314.
[19] 江偉,王昕,王振雷.基于LTSA和MICA與PCA聯(lián)合指標的過程監(jiān)控方法及應用[J].化工學報,2015,66 (12):4895-4903.
[20] JIANG Q,YAN X.Non-Gaussian chemical process monitoring with adaptively weighted independent component analysis and its applications[J].Journal of Process Control,2013,23(9):1320-1331.
[21] JIANG Q,YAN X,LV Z,etal.Independent component analysis-based non-Gaussian process monitoring with preselecting optimal components and support vector data description[J].International Journal of Production Research,2014,52(11):3273-3286.
[22] 楊正永,王昕,王振雷.基于LTSA和聯(lián)合指標的非高斯過程監(jiān)控方法及應用[J].化工學報,2015,66(4):1370-1379.
ACombinedMethodofIndependentFactorAnalysisandFactorAnalysisforChemicalProcessMonitoring
DINGYing-tao,CHENGHui,WANGZhen-lei,MEIHua,ZHAOLiang
(KeyLaboratoryofAdvancedControlandOptimizationforChemicalProcesses,MinistryofEducation,EastChinaUniversityofScienceandTechnology,Shanghai200237,China)
Many industrial process variables have the characteristics of non-Gaussian and Gaussian mixture distribution.Independent factor analysis (IFA) algorithm utilizes one dimension Gaussian mixture model to approximate any factor distribution such that it can address the problem of the Gaussian and non-Gaussian mixture.Although the variational IFA with given factors can reduce the modeling-time,it still takes a lot of time to determine an optimal number.Especially,an inappropriate number may make the information of partial factors be remained in the residuals of the observed variables,which will result in the poor monitoring performance on the GSPE index.Aiming at the above problem in the application of IFA,this paper proposes a combined method of IFA and FA.Firstly,FA algorithm is used in determining the independent factor number so as to reduce the modelling time of IFA.And then,FA is further utilized to re-process the residual of IFA so that the remained partial factors’ information in residual can be fully employed.Finally,the monitoring experiment in the Tennessee-Eastman (TE) process and the ethylene cracking furnace verifies the validity of the proposed method.
factor analysis; independent factor analysis; modified synthesis target; noise subspace index; non-Gaussia
TP277
A
1006-3080(2017)05-0684-08
10.14135/j.cnki.1006-3080.2017.05.013
2016-11-21
國家自然科學基金(61134007,21376077,21303102);上海市研發(fā)平臺建設項目(13DZ2295300);上海市自然科學基金 (16ZR1407300)
丁英濤(1989-),男,碩士生,研究方向為基于數(shù)據(jù)的故障診斷。E-mail:dingyingtao1@163.com
程 輝,E-mail:huihyva@ecust.edu.cn