劉美枝,楊 磊
(山西大同大學(xué)物理與電子科學(xué)學(xué)院,山西大同 037009)
自動化裝備系統(tǒng)的復(fù)雜程度越來越高,傳統(tǒng)的依靠過程機理來監(jiān)測故障的方法愈發(fā)困難。數(shù)據(jù)驅(qū)動的故障監(jiān)測不需要過程機理,只需要過程數(shù)據(jù)就可以快速監(jiān)測故障,而過程數(shù)據(jù)和產(chǎn)品質(zhì)量數(shù)據(jù)很容易采集和存儲,所以數(shù)據(jù)驅(qū)動的故障監(jiān)測方法得到了廣泛的應(yīng)用。多元統(tǒng)計分析是一種典型的數(shù)據(jù)驅(qū)動方法,主要包括主成分分析(PCA)[1-2]、偏最小二乘(PLS)[3-5]、獨立元分析(ICA)[6-7]及慢特征分析(SFA)[8-9]等。它通過監(jiān)測過程數(shù)據(jù)的統(tǒng)計量來檢測運行條件的狀態(tài)。PCA 是應(yīng)用最廣的一種故障監(jiān)測算法,通過監(jiān)測過程數(shù)據(jù)的異常變化來判斷系統(tǒng)的狀態(tài),但是PCA 算法沒有考慮過程數(shù)據(jù)與質(zhì)量數(shù)據(jù)之間的相關(guān)性,而PLS 在建立系統(tǒng)模型時,不僅能夠保留過程數(shù)據(jù)的大部分信息,而且可以使過程數(shù)據(jù)和質(zhì)量數(shù)據(jù)具有最大相關(guān)性。
在實際工業(yè)過程中,過程數(shù)據(jù)的采集中存在大量隨機噪聲,如何解決噪聲對系統(tǒng)的干擾成為一個必須解決的問題,目前已有一些前處理方法,如正交分解法[10],在建模之前預(yù)先去除與質(zhì)量數(shù)據(jù)正交的部分;遺忘因子法[11],通過遺忘因子來調(diào)整新老數(shù)據(jù)的權(quán)值,在線更新模型;分塊建模法[12],結(jié)合機理知識,將過程數(shù)據(jù)進行分塊建模。文章提出一種新的預(yù)處理方法,考慮到異常點會嚴重干擾模型的準確性,為了提高模型的抗干擾能力,在建模前先剔除訓(xùn)練數(shù)據(jù)中的異常點。
給定過程數(shù)據(jù)表示n個樣本,每個樣本m個變量,質(zhì)量數(shù)據(jù)表示n個樣本,每個樣本l個變量。在建模之前,需要對數(shù)據(jù)進行標準化預(yù)處理,使每個變量為零均值、單位方差的數(shù)據(jù),進而消除變量量綱對模型的影響。標準化過程如下:
其中,A表示潛變量個數(shù),P和Q是針對X和Y的載荷矩陣。通常在過程監(jiān)測中,采用非線性迭代方法來求P、Q和T,具體步驟如下:
1)將X、Y數(shù)據(jù)的各列進行零均值單位方差標準化處理、令i=1,X1=X;
2)設(shè)ui等于Y的任一列;
3)X的各列在ui上進行回歸得到負載向量wi=
對于給定樣本數(shù)據(jù),可以通過模型計算樣本的統(tǒng)計量T2和SPE,進而鑒別系統(tǒng)的運行狀態(tài),T2統(tǒng)計量用來監(jiān)控主元空間的變化,衡量樣本距離主元子空間距離原點的距離,SPE統(tǒng)計量用來監(jiān)控殘差空間~X的變化,衡量正常過程變量之間相關(guān)性改變的程度。其計算公式如下:
T2統(tǒng)計量和SPE統(tǒng)計量的值越高,表示樣本主元空間的變化越大或者變量之間的相關(guān)性改變越大,該樣本越有可能是故障樣本。對于給定置信水平,T2和SPE統(tǒng)計量的控制限:
在實際工業(yè)生產(chǎn)過程中,采集過程數(shù)據(jù)時存在環(huán)境干擾或儀器儀表的測量誤差,測量值出現(xiàn)波動、噪聲,使得采集數(shù)據(jù)中存在異常點,為了消除這些異常點對模型的影響,文章在建立模型之前,先將異常點剔除,將剩余的樣本作為訓(xùn)練集建立模型,進而保證建模數(shù)據(jù)的準確性,提高模型監(jiān)測準確率,系統(tǒng)整體流程如圖1所示。
圖1 系統(tǒng)整體流程圖
異常點一般包括遠離數(shù)據(jù)中心,或者變量之間的相關(guān)性出現(xiàn)顯著變化,這些變化相應(yīng)的會導(dǎo)致統(tǒng)計量T2和SPE的異常,鑒于此,直接使用T2統(tǒng)計量和SPE統(tǒng)計量來挑選異常點是一種簡單而有效的方法。對于給定標準化后的過程數(shù)據(jù)X和質(zhì)量數(shù)據(jù)Y,建立PLS 模型,并計算每個訓(xùn)練樣本的T2統(tǒng)計量的SPE統(tǒng)計量,統(tǒng)計量的值越大說明樣本離主元子空間原點距離越遠或者變量之間相關(guān)性變化越大,將統(tǒng)計量較高的采樣點當作異常點予以剔除,減小其對模型的影響。
具體過程如下:
步驟1:用數(shù)據(jù)X和Y建立PLS模型:
得到負載矩陣P、Q和權(quán)重矩陣R。
步驟2:用交叉驗證法計算得主元個數(shù)A。
步驟3:按照公式(4)~(5)計算每個樣本點得T2統(tǒng)計量和SPE統(tǒng)計量。
步驟4:選擇T2統(tǒng)計量較大的α個樣本和SPE統(tǒng)計量較大的β個樣本作為異常點,予以剔除。
對于給定正常工況下標準化過程數(shù)據(jù)X和Y,建立PLS 模型,按照上一節(jié)步驟剔除異常點,剩余的n1個樣本點X1和Y1組成訓(xùn)練集,再次建立PLS模型。
模型訓(xùn)練過程:
步驟1:用數(shù)據(jù)X1和Y1建立PLS模型:
得到負載矩陣P1、Q1和權(quán)重矩陣R1。
步驟2:計算訓(xùn)練集樣本的SPE統(tǒng)計量:
步驟3:計算統(tǒng)計量的控制限。
故障檢測過程:
對于一個新樣本xnew∈Rm,按照下列步驟判斷其是否為故障樣本。
步驟1:由模型訓(xùn)練過程得到的參數(shù)R1,求得新樣本的得分向量:
步驟2:計算新樣本的統(tǒng)計量:
本節(jié)使用田納西伊斯曼(TE)過程驗證算法的故障監(jiān)測性能。TE過程是基于實際工業(yè)過程的仿真實例,被廣泛作為連續(xù)過程的監(jiān)測、診斷的研究平臺,該工業(yè)過程有4 種反應(yīng)物(A、C、D、E)和兩種生成物(G和H),此外還包括一種惰性物質(zhì)B及副產(chǎn)物F。整個過程由5個主要操作單元組成,即反應(yīng)器、冷凝器、氣液分離塔、循環(huán)壓縮機和汽提塔。整個過程有41個測量變量(包括22 個連續(xù)變量和19 個成分變量)和12 個操縱變量[13-14]。數(shù)據(jù)集種包含1 個正常工況下的數(shù)據(jù)和21 種不同故障工況下的數(shù)據(jù),其中正常工況數(shù)據(jù)共500 個樣本,每種工況數(shù)據(jù)共960 個樣本(前160 個為正常樣本,后800 個為故障樣本),具體故障描述見表2。
表2 TE過程故障描述
本實驗中,選擇數(shù)據(jù)集中的22 個測量變量XMEAS(1-22)和11個操縱變量XMV(1-11)作為過程變量X,選擇過程變量XMEAS(35)作為質(zhì)量變量Y,由交叉驗證可得主元個數(shù)A=15。
圖2 為正常工況數(shù)據(jù)的統(tǒng)計量,從圖中可以看出,部分樣本點的統(tǒng)計量較高,可以作為異常點應(yīng)該予以剔除。
圖2 剔除異常點前數(shù)據(jù)統(tǒng)計量
圖3 是將T2統(tǒng)計量較高的前10%以及SPE統(tǒng)計量較高的前10%的異常點剔除后訓(xùn)練集的統(tǒng)計量,相比圖2可以看出所有數(shù)據(jù)都保持在控制限以下,消除了毛刺,用這些剩余數(shù)據(jù)來建模更精確。
圖3 剔除異常點后數(shù)據(jù)統(tǒng)計量
為了驗證算有的有效性,以故障4 和故障11 作為測試集,用正常工況下的500個樣本作為訓(xùn)練集建立PLS 模型,其監(jiān)測結(jié)果如圖4 所示,由圖可見,T2統(tǒng)計量可以監(jiān)測到大部分故障,故障4 和故障11 的檢測率分別為100%和79.25%;但是SPE統(tǒng)計量卻只能監(jiān)測到一部分,故障4 和故障11 的T2統(tǒng)計量檢測率分別為100%和79.25%,SPE統(tǒng)計量監(jiān)測率為62.38%和50.75%。用剔除異常點剩余的404 個樣本作為訓(xùn)練集建立PLS 模型,其監(jiān)測結(jié)果如圖5 所示,由圖可見,T2統(tǒng)計量和SPE統(tǒng)計量可以監(jiān)測到絕大部分故障樣本,故障4 和故障11 的T2統(tǒng)計量的檢測率分別為100% 和82.38%,SPE統(tǒng)計量監(jiān)測率為99.50% 和71.13%。
圖4 用全部正常工況數(shù)據(jù)建模的監(jiān)測效
圖5 用剔除異常樣本點數(shù)據(jù)建模的監(jiān)測效果
由此可知,剔除異常點后,統(tǒng)計量均有不同幅度的提升,尤其是SPE統(tǒng)計量,故障4 和故障11 的SPE統(tǒng)計量分別提高37.12%和20.38%。用剔除異常點的數(shù)據(jù)建模,可以更精準地描述系統(tǒng)特性,有助于提升監(jiān)測性能。
考慮到工業(yè)過程中采集數(shù)據(jù)時存在地環(huán)境干擾和傳感器誤差,而這些帶噪聲和誤差的異常樣本會對模型產(chǎn)生干擾,使得模型不準確,進而影響工業(yè)過程故障監(jiān)測。異常樣本點的數(shù)據(jù)會發(fā)生便宜或變量之間的相關(guān)性會發(fā)生改變,所以可以使用T2統(tǒng)計量和SPE統(tǒng)計量來檢測異常樣本點。本文在建模之前先對異常樣本進行剔除,將剩余的樣本作為訓(xùn)練樣本建立模型,進而對工業(yè)過程進行監(jiān)控。用田納西伊斯曼過程對本文算法進行驗證,試驗結(jié)果表明,剔除異常點后,可以有效提升故障檢測率。