黃 健,楊 旭,陳先中
(工業(yè)過程知識自動化教育部重點實驗室,北京科技大學(xué) 自動化學(xué)院,北京100083)
現(xiàn)代流程工業(yè)過程規(guī)模日益擴大,過程監(jiān)測是保證過程生產(chǎn)安全、產(chǎn)品質(zhì)量的關(guān)鍵。集散控制系統(tǒng)和計算機技術(shù)的蓬勃發(fā)展,推動了基于多元統(tǒng)計過程監(jiān)測方法的發(fā)展[1-6]。傳統(tǒng)多元統(tǒng)計方法假設(shè)過程采樣之間是時序獨立的,多元統(tǒng)計算法在特征提取時只能提取過程的穩(wěn)態(tài)特征。在現(xiàn)代工業(yè)過程中,變量之間、操作單元之間有實際意義的耦合關(guān)系,因此過程數(shù)據(jù)會表現(xiàn)出時間上的動態(tài)性。動態(tài)主成分分析(principal component analysis,PCA)、動態(tài)獨立成分分析等算法通過擴展矩陣方法來處理過程動態(tài)性問題[7-11]。近年來,慢特征分析(slow feature analysis,SFA)算法被引入過程監(jiān)測領(lǐng)域[12],SFA算法根據(jù)特征的變化提取動態(tài)特征,適用于動態(tài)過程監(jiān)測。Guo等[13]提出概率SFA算法;Shang等[14]明確指出動態(tài)性是表征過程變化的重要指標(biāo);Zhang等[15]將核SFA 算法用于非線性間歇過程;張漢元等[16]結(jié)合核慢特征判別分析和支持向量數(shù)據(jù)描述算法,改善過程的非線性特性。上述改進的SFA故障檢測算法在特征選擇與觀測統(tǒng)計量構(gòu)造方面,通過離線挑選部分重要特征構(gòu)造統(tǒng)計量,沒有充分利用在線監(jiān)測數(shù)據(jù)的故障信息,可能造成故障信息無法有效表達。Ge 等[17]提出從全局監(jiān)測性能出發(fā)的基于故障樣本的獨立元監(jiān)測方法。Jiang 等[18]提出基于在線挑選敏感主成分的敏感PCA 算法。Huang 等[12]提出基于慢特征分析的在線特征重排和特征提取監(jiān)測策略。這些算法是基于在線特征選擇策略的過程監(jiān)測算法,然而此類在線策略的研究仍不完善,在處理過程動態(tài)性方面以及特征選擇的魯棒性方面仍需要改進。因此,如何采用在線特征提取策略進行動態(tài)特征選擇,加強故障信息在監(jiān)測模型的表達,提高監(jiān)測模型的監(jiān)測效果值得深入研究。為解決這一問題,本文提出基于選擇在線故障相關(guān)特征的SFA 故障檢測算法,經(jīng)過SFA特征提取,在線選擇超過閾值的特征為故障相關(guān)特征,并構(gòu)造監(jiān)測統(tǒng)計量進行故障檢測。
SFA 可以提取過程中不同動態(tài)水平的特征,根據(jù)特征變化的緩慢程度排列。在實際動態(tài)工業(yè)過程中,故障可能發(fā)生在任何的動態(tài)特征中,因此經(jīng)過SFA 進行動態(tài)特征提取,下一步需要選擇重要特征對數(shù)據(jù)降維。由于SFA 是一種線性特征提取方法,通常認(rèn)為權(quán)重矩陣W中具有較大L2范數(shù)的行對應(yīng)的慢特征能夠捕捉到過程的變化。對于第i個慢特征,其權(quán)重向量的L2范數(shù)li表示為
式中:ijW為權(quán)重矩陣W的(ith,jth)個元素。將慢特征按照li從大到小排序,選擇權(quán)重向量前k個慢特征為離線重要特征,表示為
基于權(quán)重矩陣L2范數(shù)的特征選擇策略是一種離線特征選擇策略,離線方法只能預(yù)先選定若干個特征。而實際過程中,不同的故障可能表征在不同的特征中,離線方法沒有利用到實時的故障信息,選中的特征可能不全是故障相關(guān)特征,造成信息冗余,監(jiān)測模型的有效性低。因此,應(yīng)充分利用在線監(jiān)測樣本信息,選擇故障相關(guān)特征對數(shù)據(jù)降維,構(gòu)造監(jiān)測統(tǒng)計量。
記d個故障相關(guān)慢特征為d s,構(gòu)造基于故障相關(guān)特征統(tǒng)計量為
在正常數(shù)據(jù)提取的慢特征中挑選出當(dāng)前樣本的故障相關(guān)特征,由KDE 估計出當(dāng)前監(jiān)測樣本的控制限。若所有在線慢特征統(tǒng)計量都沒有超過平均閾值,則此選擇故障相關(guān)慢特征分析(fault-related SFA,F(xiàn)RSFA)算法退化為SFA 算法,采用離線特征選擇策略進行降維。
傳統(tǒng)方法在建立監(jiān)測統(tǒng)計量時,通常分別構(gòu)造特征空間和殘差空間兩個統(tǒng)計量,特征空間和殘差空間的統(tǒng)計量互為補充。本文提出在線選擇故障相關(guān)特征的降維策略,經(jīng)過特征選擇,故障信息被集中在慢特征空間,殘差空間幾乎不包含故障信息,本文只建立慢特征空間的2S統(tǒng)計量。
基于選擇故障相關(guān)特征的SFA 故障檢測算法的詳細步驟如下。
離線建模:
第1步:收集正常工況下的數(shù)據(jù),并對數(shù)據(jù)進行0均值和單位方差標(biāo)準(zhǔn)化;
第2步:采用SFA 算法提取過程數(shù)據(jù)的動態(tài)特征,并獲取權(quán)重矩陣W;
第3步:根據(jù)權(quán)重向量的L2范數(shù)選擇部分重要的慢特征;
第4步:根據(jù)選擇的慢特征構(gòu)造監(jiān)測統(tǒng)計量,并采用KDE 算法估計統(tǒng)計量的閾值。
在線監(jiān)測:
第1步:確定滑動窗口寬度h,獲取當(dāng)前窗口內(nèi)的監(jiān)測樣本,并根據(jù)離線建模第1步對監(jiān)測樣本進行標(biāo)準(zhǔn)化;
第2步:根據(jù)離線建模第2 步的權(quán)重矩陣,計算監(jiān)測樣本的慢特征統(tǒng)計量s2test,并在窗口內(nèi)求平均值;
第3步:對比每個慢特征統(tǒng)計量和離線建模第4步得到的平均閾值,挑選出超過平均閾值的慢特征為故障相關(guān)特征;
第4步:建立故障相關(guān)特征統(tǒng)計量;
第5步:返回離線建模第4步,根據(jù)當(dāng)前挑選的慢特征建立正常數(shù)據(jù)的統(tǒng)計量,并估計過程的控制限;
第6步:對比監(jiān)測統(tǒng)計量和控制限,判斷當(dāng)前監(jiān)測樣本是否為故障。
TE 過程對于研究過程監(jiān)測方法提供了很大幫助,已經(jīng)被學(xué)術(shù)界廣泛認(rèn)可[22-23]。TE 過程有4 個反應(yīng),共生成2 種有效產(chǎn)物。這個過程有5個主要的單元操作:反應(yīng)器、冷凝器、分離器、循環(huán)壓縮機和氣提塔。本文中的研究選取22 個連續(xù)測量變量和11個操縱變量用于故障檢測,TE 過程仿真模型預(yù)設(shè)定21個故障。過程正常數(shù)據(jù)包含500 個樣本。對于每個故障,故障數(shù)據(jù)包含960個樣本,其中前160個樣本是正常數(shù)據(jù),161至960個樣本為故障數(shù)據(jù)。
本文對比PCA、SFA、FRSFA 3種算法的監(jiān)測效果,選取滑動窗口h= 10,置信水平α= 0.99。根據(jù)TE 過程的離線數(shù)據(jù),經(jīng)過計算離線重要特征的數(shù)量k=21。表1給出了21個故障的故障檢測率。
表1 PCA、SFA、FRSFA 故障檢測率Table 1 Fault detection ratesof PCA,SFA and FRSFA
對于故障1、2、4、6、7、8及14這類故障幅值較大的故障,3種方法幾乎都能達到100%故障檢測率。對于故障5、12、13、17、18及19,F(xiàn)RSFA 的故障檢測率能夠與其它2種算法中最好的監(jiān)測效果持平。提出的FRSFA 算法在檢測故障10、11、15、16、20 及21時比其它2種算法有明顯優(yōu)勢。故障3、9及15是公認(rèn)的幾乎無法檢測的故障,3種算法都不能檢測出故障3和9,本文提出的FRSFA 算法對故障15的檢測率達到了0.34,顯著高于其他2種算法。本文提出的FRSFA 算法充分提取過程的動態(tài)特征,根據(jù)在線樣本選擇故障相關(guān)信息,排除故障無關(guān)特征對監(jiān)測結(jié)果的影響,相比于PCA 和SFA 算法,監(jiān)測模型的有效性提高。為了進一步說明提出算法在選擇故障相關(guān)特征方面的優(yōu)勢,以故障11為例,圖1、2分別給出了根據(jù)L2范數(shù)排序的、根據(jù)在線特征大小排序的所有特征圖。
圖1 根據(jù)權(quán)重向量L 2 范數(shù)排序的所有慢特征Fig.1 All SFsin the order of L2 norm of the weight vector
圖1是將特征按照權(quán)重向量的L2范數(shù)排序的所有慢特征圖,具有顯著故障信息的特征(特征10、12、23、28)和較多故障信息的特征(特征1、7、11、24)在圖中用圈標(biāo)出,由于TE 過程離線特征個數(shù)k=21,仍然有3個表征故障信息的特征沒有被挑選,導(dǎo)致特征空間的重要信息不足。因此,此特征選擇方式有局限性,會導(dǎo)致監(jiān)測效果不佳。圖2 是根據(jù)在線特征的大小進行排序的慢特征圖??梢钥闯觯瑹o論是顯著表征故障的特征(特征1、2、3、4)還是較為顯著表征故障的特征(特征6、7、9、10)都排在前位,進行特征選擇時,這些特征超過了平均閾值,被挑選到特征空間,充分利用了過程的故障信息,提高了模型的有效性。
圖2 根據(jù)在線特征大小排序的所有慢特征Fig.2 All SFsin the order of their values
故障11是反應(yīng)器冷卻水進口溫度的隨機變化,圖3(a)~(c)分別給出了PCA、SFA 和FRSFA 的監(jiān)測效果。PCA 算法的2T統(tǒng)計量的監(jiān)測效果比SPE統(tǒng)計量差,兩個統(tǒng)計量的檢測率分別為0.41和0.64,只能檢測出其中一部分故障樣本。SFA 的故障檢測率也只有0.52 和0.75,相比于PCA,SFA 的效果有少量提高。本文的FRSFA 算法能夠檢測出大部分故障,故障檢測率達到了0.85,顯著改善了傳統(tǒng)PCA 和SFA算法的監(jiān)測效果。PCA 算法沒有考慮到過程動態(tài)信息,且特征選擇沒有充分利用在線信息;SFA 算法雖然有效地提取了過程的動態(tài)特征,但是沒有選擇故障相關(guān)特征,造成監(jiān)測模型冗余、有效性低。本文提出的算法在特征提取和特征選擇方面充分考慮了動態(tài)過程的故障信息,集中故障相關(guān)特征監(jiān)測,取得了優(yōu)異的監(jiān)測效果。
SFA 算法在進行降維時采用離線特征選擇策略,沒有充分利用在線樣本的故障信息,導(dǎo)致特征空間信息冗余,監(jiān)測模型的有效性降低。本文提出基于在線故障相關(guān)特征選擇SFA 過程監(jiān)測策略,首先計算出每個慢特征的閾值,將其作為挑選的基準(zhǔn);然后通過對比在線特征與閾值的大小,確定超過平均閾值的特征作為故障相關(guān)特征;最后采用核密度估計實時估計當(dāng)前樣本的控制限。采用SFA 算法提取過程的本質(zhì)動態(tài)特征,克服了傳統(tǒng)靜態(tài)算法在動態(tài)過程監(jiān)測方面的不足,提出的在線故障特征選擇策略排除了故障無關(guān)特征對監(jiān)測效果的影響,提高了監(jiān)測模型的有效性。在TE過程進行仿真實驗,相比于PCA 和SFA 算法,提出的FRSFA 算法監(jiān)測性能更優(yōu)。
SFA 算法能夠提取出過程的動態(tài)特征,取得優(yōu)異的監(jiān)測效果。然而,本文研究的SFA 算法是一種線性特征提取算法,沒有考慮到復(fù)雜工程的非線性特點,基于SFA 算法的改進算法還有很大的發(fā)展空間。同時,工業(yè)過程規(guī)模大、變量關(guān)系復(fù)雜,如何挖掘更多的工業(yè)過程信息,仍然值得研究。