張靜靜 方 彬 秦 蘭 劉佳微 張博健
(河北建筑工程學(xué)院,河北 張家口 075000)
隨著現(xiàn)代工業(yè)產(chǎn)品的高質(zhì)量精度,高質(zhì)量和多功能品種市場需求,工業(yè)化生產(chǎn)更多地需要依賴于一種間歇生產(chǎn)過程.間歇控制過程這種控制系統(tǒng)一般通常是非線性的,時變,滯后的,模型一般是不完全確定的,因此對關(guān)于間歇控制過程這種系統(tǒng)控制技術(shù)問題的理論研究,具有一定的科學(xué)理論和技術(shù)實踐上的應(yīng)用價值.
故障檢測方法有很多,對此類方法的研究也越來越多,其中聚類分析的研究在不同系統(tǒng)的數(shù)據(jù)處理中也顯而易見的凸顯了優(yōu)勢.但是傳統(tǒng)聚類分析方法采用歐氏距離進(jìn)行計算,它將不同屬性的變量等同對待,這一點有時并不能滿足實際的要求.而采用馬氏距離可以排除變量之間相關(guān)性的干擾,克服指標(biāo)變量不同量綱不同權(quán)重所造成的誤判.
本課題研究改進(jìn)了目前傳統(tǒng)的歐氏距離聚類方法,采用普拉馬克歐氏時間距離聚類分析方法進(jìn)行聚類分析.在諸如Matlab等編程語言環(huán)境中,實現(xiàn)基于馬氏距離的時段間歇劃分過程并將時段劃分算法用于程序庫的設(shè)計[1-2].并使用pensim青霉素發(fā)酵模擬軟件進(jìn)行間歇時序的青霉素發(fā)酵過程數(shù)據(jù)測試.
多向主元分析方法需要每個子數(shù)學(xué)模型都具備獨立的子數(shù)據(jù)空間[3],這一系列的子數(shù)據(jù)空間組成了MPCA模型[4].原理是將三維間歇過程的矩陣操作數(shù)據(jù)進(jìn)行二維展開,然后對其進(jìn)行標(biāo)準(zhǔn)化處理,最后得到的數(shù)據(jù)是通過PCA建模的.其建模實質(zhì)是把一個龐大的數(shù)據(jù)空間,沿一個軌跡分割成一系列子數(shù)據(jù)空間,并分別構(gòu)成多個子數(shù)據(jù)模型,并由多個子數(shù)據(jù)構(gòu)成非線性多元統(tǒng)計數(shù)學(xué)模型[5].
給定在正常測量情況下可以工作的一個測量數(shù)據(jù)集,有m個過程變量,n個觀測值,將該數(shù)據(jù)集寫為矩陣(X∈Rn×m)的形式,其中每一列代表一個測量變量,每一行代表一個樣本.矩陣X如式1所示[6].
(1)
利用PCA對樣本數(shù)據(jù)進(jìn)行建模.定義標(biāo)準(zhǔn)化的樣本x協(xié)方差矩陣為:
(2)
對其特征值進(jìn)行分解,并按特征值的大小降序排列.PCA模型對X進(jìn)行以下分解:
(3)
T=XP
(4)
其中P∈Rm×A為負(fù)載矩陣,由S的前A個特征向量構(gòu)成.T∈Rn×4為得分矩陣,T的各列被稱為主元變量,A表示主元的個數(shù),也是得分矩陣的列數(shù).
基于PCA方法進(jìn)行過程監(jiān)控,通過對兩個多元的統(tǒng)計數(shù)據(jù)進(jìn)行監(jiān)視,T2和SPE實現(xiàn)了間歇生產(chǎn)過程的正常運作和實時監(jiān)測.其中,T2統(tǒng)計量的控制限可采用F分布來計算,公式如下[5]
(5)
其中,A為主元個數(shù),I為建模批次數(shù),α為顯著性水平.
SPE統(tǒng)計量,是指預(yù)測誤差平方和指標(biāo)(Squared prediction error,SPE),表示模型偏離主元件與模型預(yù)測距離的統(tǒng)計測量誤差值.可以用符合下式的計算方法式來計算出SPE統(tǒng)計量的控制限[4]:
(6)
(7)
(8)
其中,mk為建模數(shù)據(jù)集中所有批次測量數(shù)據(jù)在第k個時刻SPE統(tǒng)計量的均值,vk為其對應(yīng)的方差.
完成模型后,根據(jù)標(biāo)準(zhǔn)軌道分段的情況,對在線數(shù)據(jù)進(jìn)行了階段分類,得各點T2和SPE值[6].
(9)
tk,i=Xk,iPk
(10)
Sk=diag{λk,1,λk,2,…,λk,R}
(11)
(12)
圖1 Pensim仿真平臺
檢查各點是否超過控制限,若超過T2和SPE控制限,則發(fā)現(xiàn)故障,則說明該點出現(xiàn)故障;若沒有超過控制限,則該批次數(shù)據(jù)正常.
模塊的實驗與分析
本文檢測仿真數(shù)據(jù)從Pensim青霉素發(fā)酵仿真平臺獲得[6],青霉素仿真平臺如圖1所示.
故障情況圖中每個變量的說明如表1所示.
(1)基于MPCA的數(shù)據(jù)預(yù)處理
對20批次訓(xùn)練的樣本,按變量方向展開,獲得各階段的2維子數(shù)據(jù)矩陣,通過聚類分析算法,對20批次訓(xùn)練的樣本進(jìn)行階段分類,得出4個階段,對每一階段數(shù)據(jù)矩陣進(jìn)行標(biāo)準(zhǔn)化處理,消除因量綱差異所產(chǎn)生的不合理影響.
(2)基于MPCA的訓(xùn)練樣本建模
對每一階段的數(shù)據(jù)矩陣進(jìn)行PCA建模,根據(jù)主元貢獻(xiàn)率計算出所需主元個數(shù),并分別計算T2和SPE控制限.
(3)基于MPCA的在線數(shù)據(jù)建模
求每階段的均值與標(biāo)準(zhǔn)差,然后對所有在線建模數(shù)據(jù)進(jìn)行實時分析進(jìn)行建模標(biāo)準(zhǔn)化,使用PCA建模方法求得該點的T2和SPE值.
圖2給出MPCA建模方法對故障1(典型斜坡故障)的檢測結(jié)果.故障設(shè)定在160-180時刻加入一個10%的斜坡故障.
圖2 故障1(斜坡故障)情況圖
可以發(fā)現(xiàn),MPCA建模方法SPE能檢測到故障,同樣可以檢測到故障.通過檢測故障后獲得出現(xiàn)故障的時間點,然后在所有故障點上計算出對預(yù)測誤差和(SPE)的貢獻(xiàn),這些變量最大可能會導(dǎo)致故障.在對故障1進(jìn)行檢測時,從如圖3可以發(fā)現(xiàn),出現(xiàn)故障時的點位于第170至180點之間,選擇圖3所示的四個檢測點,計算出所有變量對SPE的貢獻(xiàn),可以看出故障起點在第170個點,進(jìn)入故障期后,變量1的貢獻(xiàn)逐漸增加,其他變量則逐漸減少.直到故障時段超出控制限最高的點(即第180個點)時,變量1的貢獻(xiàn)值才達(dá)到最大,其他變量的貢獻(xiàn)值幾乎降到最低,在走出故障時段后,變量1的貢獻(xiàn)值減小了,同時其他變量的貢獻(xiàn)值也有所增加,這就可以說明變量1是引起故障的來源,而在文中分析變量1是引起故障的原因.在160-180點這一時間內(nèi),變量1(通風(fēng)量)在此期間加入幅度5%的階躍故障,這與最初設(shè)定的故障類型相一致,因此對故障的檢測效果是有效的.
圖3 故障一中各時間點各變量對SPE的貢獻(xiàn)
以間歇過程為依據(jù),引出了故障檢測的概念,并從主元分析機(jī)理的角度,利用pensim平臺模擬了青霉素的發(fā)酵過程.最后,MPCA建模檢測了基于馬氏距離的K-means聚類劃分的子時段,并進(jìn)行實驗測試和評估.仿真結(jié)果可證明本文提出方法的有效性.