劉鴻斌, 張 昊, 景 宜, 張鳳山
(1. 南京林業(yè)大學(xué) 江蘇省林業(yè)資源高效加工利用協(xié)同創(chuàng)新中心, 江蘇 南京 210037; 2. 山東華泰紙業(yè)股份有限公司, 山東 東營(yíng) 257335)
隨著制漿造紙工業(yè)過程的日趨復(fù)雜化及生產(chǎn)規(guī)模的大型化,造紙過程中產(chǎn)生的廢水問題也愈發(fā)凸顯.造紙廢水主要來自于黑液、白水等,其特點(diǎn)是水量大、濃度高、泡沫多及溫度高,且非溶解性COD又為COD的主導(dǎo)成分,造成了水體的可生化性較差.此外,在造紙廢水處理過程中存在諸如廢液中殘留的纖維、木質(zhì)素及填料等較多干擾因素,造成Mg2+、Ca2+等離子與硫酸根、碳酸根及磷酸根離子形成鈣化顆粒污泥,從而降低了廢水處理反應(yīng)器的處理能力.
在造紙廢水處理過程中,集散控制系統(tǒng)(distri-buted control system, DCS)作為現(xiàn)代工業(yè)過程的控制平臺(tái)被廣泛運(yùn)用.DCS系統(tǒng)使得過程中數(shù)據(jù)的采集量大幅增加,且DCS系統(tǒng)具有多閉環(huán)、強(qiáng)干擾及高耦合的特點(diǎn),使得過程數(shù)據(jù)與故障信息之間無法得到清晰的邏輯關(guān)系[1].此外,過程中存在的耦合性、時(shí)變性等特征導(dǎo)致所采集的數(shù)據(jù)具有較強(qiáng)的非線性及動(dòng)態(tài)特征,這為過程故障檢測(cè)帶來較大困難.廢水處理過程的復(fù)雜性不僅造成故障檢測(cè)難度的提升,而且使得整個(gè)系統(tǒng)中更加頻發(fā)故障,極大地降低了污水處理效率及可靠性[2].這對(duì)于化工、石油等連續(xù)生產(chǎn)領(lǐng)域帶來很大挑戰(zhàn),同時(shí)也對(duì)過程故障的及時(shí)發(fā)現(xiàn)提出更高要求.
針對(duì)以上問題,工業(yè)過程模型在過程監(jiān)測(cè)等領(lǐng)域受到了廣泛關(guān)注.過程建模方法主要分為基于數(shù)學(xué)模型的方法、基于知識(shí)的方法及基于數(shù)據(jù)驅(qū)動(dòng)的方法.基于數(shù)學(xué)模型的方法針對(duì)復(fù)雜的工業(yè)過程往往難以建立準(zhǔn)確的數(shù)學(xué)模型,使得該方法無法很好地應(yīng)用于工業(yè)廢水處理過程.此外,造紙廢水處理過程的復(fù)雜性,也導(dǎo)致基于知識(shí)的方法在專家知識(shí)獲取、自適應(yīng)能力提高及實(shí)時(shí)性更新等方面存在較大缺陷,因此在實(shí)際運(yùn)用中的通用性較差.相較于基于數(shù)學(xué)模型和基于知識(shí)的方法,基于數(shù)據(jù)驅(qū)動(dòng)的方法不需要建立精確的模型,對(duì)于專家系統(tǒng)也無較強(qiáng)的依賴性,僅僅根據(jù)工業(yè)過程的歷史數(shù)據(jù),對(duì)數(shù)據(jù)中的信息進(jìn)行深度挖掘,從而進(jìn)行過程建模分析,以此實(shí)現(xiàn)過程故障檢測(cè)的目的.因此基于數(shù)據(jù)驅(qū)動(dòng)的方法被廣泛用于復(fù)雜過程的故障檢測(cè)及診斷.
傳統(tǒng)的統(tǒng)計(jì)過程監(jiān)測(cè)包括單變量和多變量統(tǒng)計(jì)監(jiān)測(cè).單變量過程統(tǒng)計(jì)主要包括Shewhart控制圖和指數(shù)加權(quán)移動(dòng)平均控制(exponentially weighted mo-ving average, EWMA)圖等[3].然而單變量過程統(tǒng)計(jì)監(jiān)測(cè)只考慮了過程中單一變量的變化,不能對(duì)多變量之間的相關(guān)性進(jìn)行準(zhǔn)確描述,在實(shí)際應(yīng)用中無法滿足現(xiàn)代造紙廢水處理過程的監(jiān)測(cè)要求.為了克服單變量在過程監(jiān)測(cè)中存在的缺陷,多變量統(tǒng)計(jì)過程監(jiān)測(cè)方法在20世紀(jì)90年代初運(yùn)用于過程監(jiān)測(cè)及故障診斷.多變量統(tǒng)計(jì)過程檢測(cè)方法主要包括多元線性回歸(multiple linear regression, MLR)[4]、主成分分析(principal component analysis, PCA)[5]及偏最小二乘(partial least squares, PLS)[6].然而傳統(tǒng)的線性方法以滿足線性關(guān)系為前提,且變量之間需以互相獨(dú)立為條件[7],因此傳統(tǒng)的多變量故障檢測(cè)方法無法較好適應(yīng)非線性動(dòng)態(tài)系統(tǒng),易出現(xiàn)過程故障信息誤報(bào),甚至發(fā)生事故[8].針對(duì)過程中普遍存在的時(shí)變性,文獻(xiàn)[9]首次提出動(dòng)態(tài)PCA方法,該方法在建模過程中考慮了過程的相關(guān)性,提高了動(dòng)態(tài)過程描述的準(zhǔn)確性,但該方法在處理非線性過程變量時(shí),不能進(jìn)行非線性投影,造成故障檢測(cè)過程中出現(xiàn)誤報(bào)率較高的情況.為了克服變量之間存在的非線性問題,文獻(xiàn)[10]提出核PCA方法,但該方法未考慮實(shí)際工業(yè)過程普遍存在的動(dòng)態(tài)特性,導(dǎo)致對(duì)故障檢測(cè)靈敏度不高,因此在運(yùn)用中存在一定局限性.
為此,筆者將PCA方法與核函數(shù)相結(jié)合,利用高斯核函數(shù)的非線性映射來解決數(shù)據(jù)非線性問題,并通過構(gòu)造增廣矩陣及引入時(shí)滯系數(shù)的方法來嵌入動(dòng)態(tài)模型,以此更好地描述過程的動(dòng)態(tài)特征.在偏移、漂移及精度下降3種故障下,分別采用PCA、核主成分分析(kernel principal component analysis, KPCA)及動(dòng)態(tài)核主成分分析方法(DKPCA)進(jìn)行對(duì)比分析,以此來探究DKPCA方法在復(fù)雜造紙廢水處理過程中的有效性.
主成分分析(PCA)作為一種多變量統(tǒng)計(jì)分析方法,其基本思想是將高維數(shù)據(jù)投影至低維數(shù)據(jù)[11].PCA模型通過建立主元子空間和殘差子空間,將數(shù)據(jù)樣本投影到子空間上,并在兩個(gè)子空間上分別建立T2統(tǒng)計(jì)量及平方預(yù)測(cè)誤差(squared prediction error,SPE)統(tǒng)計(jì)量.
假設(shè)數(shù)據(jù)樣本為X=[x1,x2,…,xn]T∈Rn×m,n為樣本數(shù),m為變量數(shù),其協(xié)方差矩陣定義為Σ=XTX/(n-1),利用PCA方法建立統(tǒng)計(jì)分析模型:
(1)
(2)
對(duì)式(1)兩邊同乘負(fù)載向量pi,可以得出主元向量ti為數(shù)據(jù)樣本X在負(fù)載向量pi上的投影,即
ti=Xpi.
(3)
由式(3)可得主元向量,即為原始數(shù)據(jù)樣本X在負(fù)載向量pi上的投影,投影越大,則表明所包含樣本數(shù)據(jù)中的原始信息越多.通過PCA方法分解后,原始數(shù)據(jù)X變量空間維度由m降至k,且變量之間互不相關(guān)[12],實(shí)現(xiàn)了低維度的多元統(tǒng)計(jì)分析.
在實(shí)際工業(yè)過程中,數(shù)據(jù)普遍存在較強(qiáng)的非線性特征,使得傳統(tǒng)PCA在解決該類問題時(shí)存在較大的局限性,因此相關(guān)學(xué)者提出核主成分分析(KPCA).KPCA方法用非線性映射將數(shù)據(jù)從原始數(shù)據(jù)空間映射到特征空間,從而在特征空間進(jìn)行PCA統(tǒng)計(jì)方法的分析,利用統(tǒng)計(jì)量指標(biāo)衡量故障檢測(cè)率.KPCA方法關(guān)于核函數(shù)的選擇主要包括線性核函數(shù)、多項(xiàng)式核函數(shù)及高斯核函數(shù)等,其中,由于高斯核函數(shù)具有所需要調(diào)整的參數(shù)較少等優(yōu)點(diǎn)被廣泛使用.筆者利用高斯函數(shù)K(xi,xj)=exp(-‖xi-xj‖2/c)作為核函數(shù),‖·‖為l2范數(shù),c為高斯函數(shù)帶寬.假設(shè)數(shù)據(jù)樣本為X=[x1,x2,…,xn]T∈Rn×m,通過非線性映射函數(shù)將原始數(shù)據(jù)進(jìn)行投影,非線性映射關(guān)系為
x∈Rm→Φ(x)∈Rh,
(4)
式中:Φ(·)為非線性映射函數(shù);m為原始空間數(shù)據(jù)維度;h為特征空間數(shù)據(jù)維度,且h通常較大.
首先計(jì)算特征空間中數(shù)據(jù)的協(xié)方差矩陣:
(5)
協(xié)方差矩陣Σφ對(duì)應(yīng)的特征方程為
λv=Σφv,
(6)
(7)
(8)
(9)
將式(7)進(jìn)一步化簡(jiǎn)為
(10)
特征空間中的新樣本xnew對(duì)應(yīng)得分向量計(jì)算式:
(11)
式中:k=1,2,…,p,p為KPCA中所選擇的主元個(gè)數(shù).
利用非線性映射將原始空間數(shù)據(jù)映射到特征空間,并在特征空間中利用PCA建立統(tǒng)計(jì)分析模型,一定程度上優(yōu)化了PCA無法克服非線性數(shù)據(jù)的問題.然而實(shí)際造紙廢水處理過程普遍具有時(shí)變性等特征,使得不同變量之間存在序列相關(guān)性[13].因此在KPCA算法基礎(chǔ)上通過構(gòu)建動(dòng)態(tài)模型,提出動(dòng)態(tài)核主成分分析(DKPCA)方法,以此提高動(dòng)態(tài)過程中故障檢測(cè)的準(zhǔn)確性.動(dòng)態(tài)模型如下:
數(shù)據(jù)樣本X的原始矩陣為
(12)
增廣矩陣定義為
X(l)=
(13)
式中:t為時(shí)間序列中某一時(shí)刻;d為時(shí)滯變量.
通過引入動(dòng)態(tài)方法,使得故障檢測(cè)模型對(duì)數(shù)據(jù)的動(dòng)態(tài)結(jié)構(gòu)有更強(qiáng)的捕捉性能,對(duì)模型的過程監(jiān)測(cè)性能有一定的改善.統(tǒng)計(jì)量指標(biāo)用來實(shí)現(xiàn)故障檢測(cè)準(zhǔn)確率的分析,常用的統(tǒng)計(jì)量指標(biāo)是平方預(yù)測(cè)誤差(SPE)[14],其控制線為過程檢測(cè)臨界值,當(dāng)檢測(cè)值超過控制線,則系統(tǒng)會(huì)將超過控制線的檢測(cè)點(diǎn)認(rèn)為是故障.SPE統(tǒng)計(jì)量控制線定義為
(14)
2.1.1 廢水?dāng)?shù)據(jù)
數(shù)據(jù)取自廣東東莞造紙廠好氧段廢水處理工況[15].圖1為造紙廢水處理過程數(shù)據(jù).共170組數(shù)據(jù),分別為流量(Q)、進(jìn)水化學(xué)需氧量(w(COD)in)、出水化學(xué)需氧量(w(COD)eff)、進(jìn)水懸浮固形物(w(SS)in)、出水懸浮固形物(w(SSeff))、溶解氧量(w(DO))、溫度(t′)及pH值.
圖1 造紙廢水處理過程數(shù)據(jù)
2.1.2 廢水處理過程
造紙廢水處理工藝采用活性污泥法,利用懸浮生長(zhǎng)的微生物絮體處理有機(jī)廢水,其處理流程如圖2所示.該系統(tǒng)由沉淀池、曝氣池及污泥回流系統(tǒng)組成.制漿造紙生產(chǎn)過程中產(chǎn)生的廢水首先進(jìn)入初沉池過濾掉部分雜質(zhì),由初沉池處理后的上層廢液進(jìn)入曝氣池,發(fā)生氧化反應(yīng),通過活性污泥與廢水進(jìn)行充分接觸與混合,使得水體中可溶性有機(jī)物被吸附,并被水體中微生物群所分解.處理后廢水進(jìn)入二沉池,將活性污泥與廢水進(jìn)行分離,并將一部分污泥回流至曝氣池.
圖2 好氧廢水處理過程
針對(duì)造紙廢水處理過程的復(fù)雜性,筆者構(gòu)建了偏移故障、漂移故障及精度下降故障3類故障模型.偏移故障是基于正常工況數(shù)據(jù)加上原始變量數(shù)據(jù)均值的20%來構(gòu)建故障(w(COD)in(t)+418);漂移故障是以原始數(shù)據(jù)加上時(shí)間乘以0.05得到的數(shù)據(jù)來構(gòu)建故障(pH(t)+0.05t);精度下降故障是在原始變量的基礎(chǔ)上加入均值為30、方差為1的正態(tài)隨機(jī)噪聲的方式構(gòu)建故障數(shù)據(jù)(w(SS)eff(t)+N(30,12));將樣本數(shù)據(jù)的前110組樣本點(diǎn)作為訓(xùn)練集,后60組樣本點(diǎn)作為測(cè)試集.故障構(gòu)建圖如圖3所示.
圖3 3類故障數(shù)據(jù)
基于PCA、KPCA及DKPCA等3種過程監(jiān)測(cè)方法,對(duì)造紙廢水處理過程進(jìn)行故障檢測(cè)分析.不同方法的故障檢測(cè)率如表1所示.基于PCA、KPCA及DKPCA等3種方法的故障檢測(cè)圖如圖4-6所示.紅色虛線為置信度為95%的控制線,超過紅線則表示故障被準(zhǔn)確檢出,本研究采用SPE統(tǒng)計(jì)量來表征故障檢測(cè)的準(zhǔn)確性.
由表1可知:在SPE統(tǒng)計(jì)量指標(biāo)下,相較于PCA及KPCA,在偏移故障中,DKPCA方法的故障檢測(cè)率分別提升了96.96%及87.87%;在漂移故障中,KPCA未檢測(cè)出故障,DKPCA的故障檢測(cè)率相較于PCA提升了5.12%;在精度下降故障中,PCA及KPCA方法故障檢測(cè)率均為100%,但DKPCA方法下降至68.33%.
表1 SPE指標(biāo)下3種方法的故障檢測(cè)率比較 %
由圖4-6可知:漂移故障中,相較于PCA方法,DKPCA方法故障檢測(cè)率僅提升了5.12%,但DKPCA通過動(dòng)態(tài)方法的引入,對(duì)于復(fù)雜過程的動(dòng)態(tài)特性有著更強(qiáng)的捕捉能力,對(duì)故障檢測(cè)的靈敏度也更高;DKPCA在初始出現(xiàn)故障時(shí)就可立即檢測(cè)出故障,而PCA方法在第16個(gè)樣本點(diǎn)處才檢測(cè)出故障,因此動(dòng)態(tài)方法對(duì)于在線故障檢測(cè)的靈敏度有一定的改善;PCA及KPCA在精度下降故障下檢測(cè)率均為100.00%,而DKPCA檢測(cè)率為68.33%,得出DKPCA對(duì)于精度下降等此類微小故障的檢測(cè)有一定的局限性.
圖4 基于SPE指標(biāo)的PCA故障檢測(cè)結(jié)果
圖5 基于SPE指標(biāo)的KPCA故障檢測(cè)結(jié)果
圖6 基于SPE指標(biāo)的DKPCA故障檢測(cè)結(jié)果
1) 將動(dòng)態(tài)技術(shù)與傳統(tǒng)靜態(tài)故障監(jiān)測(cè)方法結(jié)合,表明了動(dòng)態(tài)模型在故障監(jiān)測(cè)中的有效性.
2) 在傳統(tǒng)PCA和KPCA基礎(chǔ)上提出了動(dòng)態(tài)核主成分分析(DKPCA)方法,有效克服了過程數(shù)據(jù)存在的非線性及動(dòng)態(tài)特性.
3) DKPCA方法在偏移故障下相較于傳統(tǒng)的PCA及KPCA方法,其故障檢測(cè)率分別提升了96.96%及87.87%,有效地提高了故障檢測(cè)率.
4) DKPCA方法對(duì)于故障檢測(cè)更為迅速,提高了在線檢測(cè)的靈敏度及可靠性.通過動(dòng)態(tài)技術(shù)及核函數(shù)的引用,有效解決了傳統(tǒng)方法無法克服過程的非線性及時(shí)變性的問題,提高了實(shí)際工業(yè)過程檢測(cè)的準(zhǔn)確性及靈敏度.