劉偉旻,王建林,邱科鵬,于濤,趙利強(qiáng)
?
基于多證據(jù)融合決策的間歇過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè)方法
劉偉旻,王建林,邱科鵬,于濤,趙利強(qiáng)
(北京化工大學(xué)信息科學(xué)與技術(shù)學(xué)院,北京 100029)
間歇過(guò)程測(cè)量數(shù)據(jù)的高維、非線性、非高斯分布特征直接影響過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè)的準(zhǔn)確性,為了融合多源數(shù)據(jù)異常檢測(cè)信息,提升間歇過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè)精度,提出了一種基于多證據(jù)融合決策的間歇過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè)方法,該方法通過(guò)引入證據(jù)理論(Dempster-Shafer,D-S),采用主焦元判別偽證據(jù)和重新計(jì)算證據(jù)權(quán)重改進(jìn)沖突證據(jù)處理方法,減小了沖突證據(jù)對(duì)多證據(jù)融合決策結(jié)果的影響,提高了間歇過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè)的準(zhǔn)確率。構(gòu)建了基于多證據(jù)融合的測(cè)量數(shù)據(jù)異常檢測(cè)模型并將其應(yīng)用到間歇過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè)決策判決中。實(shí)驗(yàn)結(jié)果表明,該方法能夠融合多證據(jù)信息,有效地處理沖突證據(jù),實(shí)現(xiàn)了間歇過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè),降低了誤檢和漏檢率。
間歇過(guò)程;D-S證據(jù)理論;沖突證據(jù);多證據(jù)決策;測(cè)量數(shù)據(jù)異常檢測(cè)
間歇過(guò)程作為工業(yè)生產(chǎn)中的一種重要生產(chǎn)方式,被廣泛應(yīng)用于精細(xì)化工、生物制藥、食品、聚合物反應(yīng)及金屬加工等現(xiàn)代重要生產(chǎn)領(lǐng)域[1-3]。間歇過(guò)程在線檢測(cè)技術(shù)及系統(tǒng)的不斷進(jìn)步,提供了豐富的過(guò)程測(cè)量數(shù)據(jù),為過(guò)程在線監(jiān)測(cè)與優(yōu)化控制提供了基礎(chǔ)和保障[4-7]。然而間歇過(guò)程現(xiàn)場(chǎng)檢測(cè)儀表及系統(tǒng)出現(xiàn)性能衰減、故障、外界干擾等異常,直接導(dǎo)致過(guò)程測(cè)量數(shù)據(jù)的可靠性和準(zhǔn)確性降低,嚴(yán)重影響過(guò)程測(cè)量數(shù)據(jù)的質(zhì)量[8],因此實(shí)現(xiàn)對(duì)間歇過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè),能夠有效地保障過(guò)程在線監(jiān)測(cè)、優(yōu)化控制等方法和技術(shù)的實(shí)施[9-10]。
傳統(tǒng)的過(guò)程數(shù)據(jù)異常檢測(cè)方法主要是利用誤差的顯著性水平進(jìn)行統(tǒng)計(jì)假設(shè)檢驗(yàn),包括整體檢驗(yàn)法、約束檢驗(yàn)法、組合檢驗(yàn)法、廣義似然比法等[11],這些方法主要應(yīng)用于有明確過(guò)程模型約束的過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè)上,雖然取得了較好的應(yīng)用效果,但適用面較窄,難以在過(guò)程機(jī)理復(fù)雜的間歇過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè)中應(yīng)用。近年來(lái)出現(xiàn)了基于數(shù)據(jù)驅(qū)動(dòng)的過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè)方法:聚類(lèi)分析、多變量統(tǒng)計(jì)分析等方法[12]。聚類(lèi)分析方法[13]不依賴(lài)過(guò)程模型,能夠?qū)崿F(xiàn)過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè)。田慧欣等[14]將聚類(lèi)算法與軟測(cè)量建模過(guò)程相結(jié)合,用建模誤差指導(dǎo)過(guò)失誤差偵破過(guò)程,使其克服了單純聚類(lèi)分析的缺陷。但聚類(lèi)分析提取特征量單一,難以全面表達(dá)復(fù)雜的過(guò)程測(cè)量數(shù)據(jù)異常。多變量統(tǒng)計(jì)分析方法[15]以采集到的過(guò)程測(cè)量數(shù)據(jù)為基礎(chǔ),依靠分析數(shù)據(jù)統(tǒng)計(jì)量,從其中的變化提取特征,挖掘隱含的過(guò)程測(cè)量數(shù)據(jù)異常信息。Narasimhan等[16]根據(jù)間歇過(guò)程測(cè)量數(shù)據(jù)的時(shí)變信息,通過(guò)建立統(tǒng)計(jì)分析模型實(shí)現(xiàn)間歇過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè),該方法從不同側(cè)面反映測(cè)量數(shù)據(jù)異常變化信息,但容易忽略某個(gè)維度的異常變化特性,無(wú)法保證多變量統(tǒng)計(jì)分析結(jié)果的準(zhǔn)確性,容易導(dǎo)致誤檢;Luo等[17]同時(shí)考慮多個(gè)維度上的時(shí)變數(shù)據(jù)特征的變化,實(shí)現(xiàn)全局多變量統(tǒng)計(jì)分析,獲得了表征過(guò)程測(cè)量數(shù)據(jù)異常的統(tǒng)計(jì)量變化,但其忽略局部微小變化信息,容易導(dǎo)致漏檢?;跀?shù)據(jù)驅(qū)動(dòng)的方法均采用單一過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè)獲取單源數(shù)據(jù)異常信息,沒(méi)有通過(guò)多源數(shù)據(jù)異常信息融合處理來(lái)提高間歇過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè)的準(zhǔn)確率。
證據(jù)理論(Dempster-Shafer,D-S)是一種不確定性推理方法[18],通過(guò)對(duì)多源證據(jù)的一致性信息處理,排除和整合矛盾信息,從不精確和不完整信息中得到可能性最大的結(jié)論,并已在故障檢測(cè)與診斷中得到應(yīng)用,取得較好的應(yīng)用效果。陳斌等[19]將神經(jīng)網(wǎng)絡(luò)和證據(jù)理論相結(jié)合,對(duì)管道流量、壓力、聲波傳感器等局部決策信息進(jìn)行證據(jù)融合,提高了管道泄漏檢測(cè)精度;Ghosh等[20]在不同層次上提取連續(xù)攪拌反應(yīng)器的多源診斷結(jié)果,使用D-S證據(jù)理論融合多源信息,提高異常檢測(cè)精度;Hui等[21]提出一種SVM-DS方法,利用證據(jù)融合改進(jìn)SVM軸承多類(lèi)異常檢測(cè)投票模型,實(shí)現(xiàn)在證據(jù)混亂下的異常檢測(cè)。將證據(jù)融合理論引入間歇過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè),融合多源測(cè)量數(shù)據(jù)異常證據(jù)信息,是提高間歇過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè)準(zhǔn)確率的有效途徑。然而當(dāng)多源證據(jù)體間不完全一致時(shí),將出現(xiàn)沖突證據(jù)處理問(wèn)題,直接影響證據(jù)融合結(jié)果的準(zhǔn)確性。
本文提出了一種基于多證據(jù)融合決策的間歇過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè)方法。引入D-S證據(jù)理論,采用主焦元判別偽證據(jù)和重新計(jì)算證據(jù)權(quán)重,改進(jìn)沖突證據(jù)處理方法,構(gòu)建了基于多證據(jù)融合的測(cè)量數(shù)據(jù)異常檢測(cè)模型,并將其應(yīng)用到青霉素發(fā)酵過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè)決策判決中,驗(yàn)證所提方法的有效性。
1.1 證據(jù)理論及沖突證據(jù)
D-S證據(jù)理論是一種不確定性問(wèn)題處理方法,能夠?qū)⑿哦荣x予假設(shè)空間的單個(gè)元素,同時(shí)也能賦予它的子集[22]。定義識(shí)別框架是所有可能取值的一個(gè)完備集合,且內(nèi)的元素是互不相容的。在上的基本概率分配(basic probability assignment,BPA)是一個(gè)2?[0,1]的函數(shù),即BPA函數(shù),且滿足()=0,及
式中,使得(>0的稱(chēng)為焦元,表示識(shí)別框架中的任一子集。()為命題的支持程度。對(duì)于上的任一焦元,若由2條證據(jù)體獲取的BPA為1,2,其焦元分別為和,則2條證據(jù)的融合規(guī)則為
(2)
式中,為沖突系數(shù);1/(1-)為歸一化系數(shù);通過(guò)歸一化處理將大小為的信度分配給非空集。證據(jù)融合后的不確定度為
實(shí)際應(yīng)用中,當(dāng)證據(jù)源受到某種較大干擾時(shí),將提供錯(cuò)誤的信息,產(chǎn)生偽證據(jù),偽證據(jù)與其他證據(jù)源提供的證據(jù)產(chǎn)生高度沖突,出現(xiàn)沖突證據(jù)問(wèn)題。當(dāng)直接利用D-S規(guī)則進(jìn)行證據(jù)融合將產(chǎn)生相悖的結(jié)論[23];即使有大量的有效證據(jù),融合后得到正確的結(jié)論,然而由于偽證據(jù)的影響,導(dǎo)致收斂速度慢,甚至使目標(biāo)命題的信度支持不突出,直接影響決策。
1.2 改進(jìn)的沖突證據(jù)處理方法
證據(jù)推理的期望是增強(qiáng)主焦元的置信度,Murphy方法使平均支持程度最高的焦元獲得最終支持[24]。本文提出了采用主焦元判別偽證據(jù)和權(quán)重計(jì)算對(duì)沖突證據(jù)進(jìn)行處理,即由Murphy方法求出平均證據(jù)并確定主焦元,引入權(quán)重計(jì)算,計(jì)算主焦元的大小并確定偽證據(jù)。若存在偽證據(jù),則修改證據(jù)源;若不存在偽證據(jù),各證據(jù)支持的命題一致,直接用D-S融合證據(jù)。
改進(jìn)的沖突證據(jù)處理步驟如下。
(1)判斷證據(jù)體數(shù)量,若僅有2條證據(jù)融合,默認(rèn)兩個(gè)證據(jù)的權(quán)重為0.5,轉(zhuǎn)入步驟(5)。
(2)由Murphy方法求出平均證據(jù)的m= [1,2,…,a],由max(1,2,…,a) 確定主焦元的大小,對(duì)應(yīng)命題標(biāo)號(hào)為。若主焦元不唯一或者主焦元的大小等于或小于證據(jù)支持命題的不確定度的值,則說(shuō)明證據(jù)間整體沖突較大,轉(zhuǎn)入步驟(3);否則轉(zhuǎn)入步驟(6)。
(3)判斷是否存在偽證據(jù),即提供錯(cuò)誤決策信息的證據(jù)體。各證據(jù)對(duì)主焦元位置命題的支持度為m(a),若存在m(a)<,且m(a)≠max(m[1,2,…,a])則判定證據(jù)體為偽證據(jù),轉(zhuǎn)入步驟(4);否則,轉(zhuǎn)入步驟(6)。
(4)利用對(duì)主焦元的支持度確定各證據(jù)權(quán)重w,即
(5)對(duì)證據(jù)進(jìn)行加權(quán)平均
(5)
利用D-S組合規(guī)則融合加權(quán)后的證據(jù)-1次,得到最后組合結(jié)果,轉(zhuǎn)入步驟(7),為證據(jù)數(shù)。
(6)利用D-S方法對(duì)證據(jù)進(jìn)行合成,得到最終結(jié)果。
(7)根據(jù)決策規(guī)則做出決策。
該改進(jìn)的沖突證據(jù)處理方法能將沖突證據(jù)的判別和處理同時(shí)進(jìn)行,由證據(jù)體入手,根據(jù)期望命題判斷沖突證據(jù),與應(yīng)用對(duì)象無(wú)關(guān),具有普適性。判別沖突證據(jù)時(shí)只進(jìn)行簡(jiǎn)單的比較運(yùn)算,具有運(yùn)算量小的優(yōu)點(diǎn)?;谥鹘乖_定權(quán)重系數(shù),從期望命題出發(fā),意義明確,即與其他多數(shù)證據(jù)信息較為一致的證據(jù),其可信度高,其權(quán)重較大,反之則較小。
2.1 多證據(jù)融合決策的間歇過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè)模型
圖1為多證據(jù)融合決策的間歇過(guò)程數(shù)據(jù)異常檢測(cè)模型,由數(shù)據(jù)預(yù)處理模塊、多證據(jù)構(gòu)造模塊、多證據(jù)融合推理分析模塊、融合決策模塊組成。在使用間歇過(guò)程數(shù)據(jù)進(jìn)行過(guò)程建模監(jiān)測(cè)前,間歇過(guò)程三維矩陣()按照批次方向或變量方向展開(kāi)為二維矩陣()或(),其中為批次個(gè)數(shù),為變量個(gè)數(shù),為采樣時(shí)間,并進(jìn)行相應(yīng)的標(biāo)準(zhǔn)化處理,使用多元統(tǒng)計(jì)分析方法提取反映過(guò)程測(cè)量數(shù)據(jù)異常的統(tǒng)計(jì)量特征信息,構(gòu)造證據(jù)體子空間。將每個(gè)證據(jù)體在征兆空間進(jìn)行初步診斷,獲得各證據(jù)體的BPA,并通過(guò)多證據(jù)融合進(jìn)行決策,最終實(shí)現(xiàn)間歇過(guò)程數(shù)據(jù)異常檢測(cè)。
2.2 基于統(tǒng)計(jì)量特征多證據(jù)構(gòu)造
在上述數(shù)據(jù)標(biāo)準(zhǔn)化處理的基礎(chǔ)上,獲得兩種標(biāo)準(zhǔn)化后的數(shù)據(jù),分別使用多向主元分析法[25](multiway principal component alalysis,MPCA)和平行因子法[26](PARAFAC2)方法求得在不同置信度下的預(yù)測(cè)誤差平方和指標(biāo)(squared predition error,SPE)和Hotelling-2(下文簡(jiǎn)稱(chēng)2)統(tǒng)計(jì)量的測(cè)量數(shù)據(jù)異常檢測(cè)結(jié)果。
(1)基于MPCA的統(tǒng)計(jì)量特征多證據(jù)構(gòu)造
MPCA將三維數(shù)組展開(kāi)為二維數(shù)據(jù)形式后,計(jì)算相應(yīng)的得分矩陣、負(fù)載矩陣及其殘差矩陣,并保留適當(dāng)?shù)闹髟獋€(gè)數(shù),MPCA模型定義如下
其計(jì)算出來(lái)的主成分可近似地服從正態(tài)分布。
①SPE特征證據(jù)源:MPCA模型的SPE統(tǒng)計(jì)量服從加權(quán)2分布
其中,m是建模數(shù)據(jù)集中所有間歇過(guò)程批次數(shù)據(jù)在第個(gè)采樣時(shí)刻SPE(=1,…,)值的均值;v則是對(duì)應(yīng)的方差。在離線或在線計(jì)算時(shí)刻的SPE值時(shí),的計(jì)算如下
(8)
②2特征證據(jù)源:MPCA模型的2統(tǒng)計(jì)量服從多維正態(tài)分布
其中,-1是建模數(shù)據(jù)集的協(xié)方差對(duì)角陣,表示在第個(gè)采樣時(shí)刻的得分向量。在離線或在線計(jì)算時(shí)刻的2值時(shí),的計(jì)算如下
=P(10)
根據(jù)不同的顯著水平,根據(jù)式(7)和式(9)能夠獲得不同置信度下SPE和2控制限用于在線監(jiān)測(cè)。
(2)基于PARAFAC2的統(tǒng)計(jì)量特征多證據(jù)構(gòu)造
將PARAFAC2用于標(biāo)準(zhǔn)化后的三維矩陣,計(jì)算相應(yīng)的正交矩陣、得分矩陣、負(fù)載矩陣和、其殘差矩陣和組合得分矩陣,PARAFAC2模型定義如下
①SPE特征證據(jù)源:對(duì)于離線過(guò)程,第批次,采樣時(shí)刻的SPE值為
(12)
在線過(guò)程采樣時(shí)刻的SPE值為
②2特征證據(jù)源:對(duì)于離線過(guò)程,對(duì)于第批次,且采樣時(shí)刻的2值為
(14)
其中,為所有(=1,…,)的協(xié)方差矩陣
在線過(guò)程采樣時(shí)刻的2值為
(16)
根據(jù)式(12)和式(14)計(jì)算出離線情況下建模數(shù)據(jù)的SPE和2,使用核密度估計(jì)[27](kernel density estimate,KDE)方法計(jì)算不同顯著水平時(shí)的SPE和2的控制限用于在線監(jiān)測(cè)。
(3)多證據(jù)源的BPA輸出
歷史數(shù)據(jù)集經(jīng)過(guò)數(shù)據(jù)預(yù)處理后,作為MPCA和PARAFAC2統(tǒng)計(jì)模型的輸入,輸出的是相應(yīng)統(tǒng)計(jì)量的控制限。傳統(tǒng)異常檢測(cè)方法中,通過(guò)計(jì)算在線時(shí)刻數(shù)據(jù)的統(tǒng)計(jì)量,并與統(tǒng)計(jì)量相應(yīng)的控制限作比對(duì),若超過(guò)控制限,則判定時(shí)刻的數(shù)據(jù)存在異常;反之,則數(shù)據(jù)正常。此方法無(wú)法實(shí)現(xiàn)BPA分配。
傳統(tǒng)的統(tǒng)計(jì)模型設(shè)定歷史過(guò)程測(cè)量數(shù)據(jù)集服從特定分布和顯著性水平,屬于該數(shù)據(jù)集的置信度為1-,能夠計(jì)算出在該顯著性水平下的異常判定控制限。因此,本文為統(tǒng)計(jì)模型設(shè)計(jì)一種BPA計(jì)算方法,設(shè)當(dāng)前的統(tǒng)計(jì)模型為,統(tǒng)計(jì)量為和顯著水平集合為=[0.01,0.02,…,0.99]。首先,在顯著水平集合為時(shí)計(jì)算異常檢測(cè)控制限Limit();然后,在線計(jì)算時(shí)刻數(shù)據(jù)樣本的統(tǒng)計(jì)量為f;最后,搜尋Limit(down)<f< Limit(up)區(qū)間,尋找將該點(diǎn)判為異常的最大概率down,進(jìn)而設(shè)置down作為模型和統(tǒng)計(jì)量在時(shí)刻的證據(jù)源異常BPA輸出。
2.3 多證據(jù)融合的決策方法
獲得各證據(jù)的BPA,經(jīng)證據(jù)理論融合處理,得到識(shí)別框架中所有可能發(fā)生狀態(tài)命題的總信度值,由以下規(guī)則確定檢測(cè)結(jié)果[28]。
(1)(F)max{(F)},目標(biāo)命題具有最大的BPA。
(2)(F)m(F)1,且(F)m()0,目標(biāo)命題的BPA與其他命題的BPA差值必須大于某一閾值,且目標(biāo)的BPA必須大于不確定區(qū)間的長(zhǎng)度。
(3)()2,即不確定度必須小于某一閾值。
其中,F為決策結(jié)構(gòu),1值設(shè)為0.2,2值設(shè)為0.1。規(guī)則(1)是間歇過(guò)程數(shù)據(jù)異常檢測(cè)的基本條件,規(guī)則(2)確保檢測(cè)結(jié)果的BPA占有較大優(yōu)勢(shì),規(guī)則(3)確保樣本是充分可判的。如以上3個(gè)規(guī)則不能同時(shí)滿足,則無(wú)法獲得結(jié)論,則輸出決策結(jié)果為不確定。通過(guò)以上多證據(jù)融合決策方法實(shí)現(xiàn)對(duì)間歇過(guò)程數(shù)據(jù)異常檢測(cè)決策判斷。
3.1 實(shí)驗(yàn)數(shù)據(jù)
青霉素是一種具有廣泛臨床醫(yī)用價(jià)值的抗生素,其生產(chǎn)過(guò)程是一個(gè)典型的非線性、動(dòng)態(tài)和多時(shí)段的間歇生產(chǎn)過(guò)程。Pensim仿真平臺(tái)[29]為青霉素發(fā)酵過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè)提供了標(biāo)準(zhǔn)的過(guò)程仿真數(shù)據(jù)。實(shí)驗(yàn)過(guò)程選取10個(gè)主要過(guò)程變量,如表1所示。設(shè)定不同的初始條件,生成20個(gè)正常批次數(shù)據(jù),采樣時(shí)間為400 h,采樣間隔為1 h,在每批次數(shù)據(jù)中加入高斯白噪聲。生成5個(gè)異常批次,異常批次的情況如表2所示。
3.2 實(shí)驗(yàn)結(jié)果與分析
根據(jù)歷史情況統(tǒng)計(jì),間歇過(guò)程可能發(fā)生的狀態(tài)為平穩(wěn)狀態(tài)、異常狀態(tài)。構(gòu)建識(shí)別框架={平穩(wěn)狀態(tài),異常狀態(tài)},()為不確定度。歷史數(shù)據(jù)按照兩種數(shù)據(jù)標(biāo)準(zhǔn)化方法,分別使用MPCA和PARAFAC2多變量統(tǒng)計(jì)分析方法,計(jì)算SPE和2統(tǒng)計(jì)量的證據(jù)源。設(shè)定保留原有數(shù)據(jù)空間中85%以上的信息,使用累積貢獻(xiàn)率[30]方法計(jì)算得到需要保留的主成分個(gè)數(shù)。對(duì)于測(cè)試批次,輸入多證據(jù)融合決策的間歇過(guò)程數(shù)據(jù)異常檢測(cè)模型,實(shí)現(xiàn)在線間歇過(guò)程數(shù)據(jù)異常檢測(cè)。下列實(shí)驗(yàn)結(jié)果通過(guò)多次實(shí)驗(yàn)求得的平均值作為最終實(shí)驗(yàn)結(jié)果。
表1 青霉素發(fā)酵過(guò)程變量說(shuō)明
Note: 1cal=4.1868J.
表2 青霉素發(fā)酵過(guò)程異常批次說(shuō)明
表3 不同監(jiān)測(cè)方法的異常檢測(cè)率
基于批次方向展開(kāi)標(biāo)準(zhǔn)化的B-MPCA和B-PARAFAC2與基于變量方向展開(kāi)標(biāo)準(zhǔn)化的V-MPCA和V-PARAFAC2的異常檢測(cè)率和誤檢率結(jié)果如表3和表4所示。對(duì)于不同的異常類(lèi)型,如:B-MPCA考察的是不同操作批次間的隨機(jī)波動(dòng),通過(guò)判斷波動(dòng)大小是否服從多維正態(tài)分布,進(jìn)而判斷是否發(fā)生故障。在異常批次1中,由專(zhuān)家機(jī)理知識(shí)可知,異常持續(xù)位置正好處于過(guò)程過(guò)渡階段,因此,歷史訓(xùn)練批次中,時(shí)間段的隨機(jī)波動(dòng)相對(duì)較大,訓(xùn)練而得異常檢測(cè)模型難以檢測(cè)較小的異常;而對(duì)于其他異常批次,異常持續(xù)位置處于過(guò)程發(fā)展的主要階段,因此B-MPCA均有較好的異常檢測(cè)結(jié)果。
不同異常檢測(cè)方法的檢測(cè)性能均不相同,而且不同統(tǒng)計(jì)量對(duì)不同異常的敏感程度也不一樣。然而,如表4所示,由于V-MPCA方法中的2統(tǒng)計(jì)量證據(jù)源提供了錯(cuò)誤信息,使用傳統(tǒng)的D-S證據(jù)融合方法雖然能提高數(shù)據(jù)異常檢測(cè)精度,但同時(shí)也帶來(lái)了較高的誤檢率。所提出的改進(jìn)沖突證據(jù)處理方法進(jìn)行證據(jù)融合,能夠減少證據(jù)沖突導(dǎo)致的錯(cuò)誤融合結(jié)果,利用權(quán)重對(duì)證據(jù)源預(yù)處理,給偽證據(jù)較小權(quán)重減小了其對(duì)融合結(jié)果的影響,相比于傳統(tǒng)的D-S方法,不僅提高了數(shù)據(jù)異常檢測(cè)率,而且降低了數(shù)據(jù)異常誤檢率。
表4 不同監(jiān)測(cè)方法的異常誤檢率
從表3和表4可知,單一特征源進(jìn)行間歇過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè),準(zhǔn)確率偏低,平均準(zhǔn)確率小于30%;多證據(jù)融合決策的間歇過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè)平均準(zhǔn)確率達(dá)到80%。
間歇過(guò)程的測(cè)量數(shù)據(jù)具有高維、非線性、非高斯分布特征。將證據(jù)融合引入間歇過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè),融合多源證據(jù)信息,能夠有效提高間歇過(guò)程異常檢測(cè)準(zhǔn)確率;針對(duì)證據(jù)理論融合中存在的沖突證據(jù),所提出的多證據(jù)融合決策的間歇過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè)方法充分利用證據(jù)源的冗余互補(bǔ)信息,采用主焦元判別偽證據(jù),并重新計(jì)算證據(jù)權(quán)重,能夠有效地處理沖突證據(jù),提高了間歇過(guò)程測(cè)量數(shù)據(jù)異常檢測(cè)的準(zhǔn)確性,有較好的泛化能力和穩(wěn)定性,降低了誤檢和漏檢率。
[1] BAKSHI B R, LOCHER G, STEPHANOPOULOS G,. Analysis of operating data for evaluation, diagnosis and control of batch operations[J]. Journal of Process Control, 1994, 4(4): 179-194.
[2] WISE B M, GALLAGHER N B, BUTLER S W,. A comparison of principal component analysis, multiway principal component analysis, trilinear decomposition and parallel factor analysis for fault detection in a semiconductor etch process[J]. Journal of Chemometrics, 1999, 13(3/4): 379-396.
[3] RATO T J, RENDALL R, GOMES V,. A systematic methodology for comparing batch process monitoring methods(Ⅰ): Assessing detection strength[J]. Industrial & Engineering Chemistry Research, 2016, 55: 5342-5358.
[4] CAMACHO J, PICó J, FERRER A. Bilinear modelling of batch processes(Ⅰ): Theoretical discussion[J]. Journal of Chemometrics, 2008, 22(5): 299-308.
[5] 曹鵬飛, 羅雄麟. 化工過(guò)程軟測(cè)量建模方法研究進(jìn)[J]. 化工學(xué)報(bào), 2013, 64(3): 788-800. CAO P F, LUO X L. Modeling of soft sensor for chemical process[J]. CIESC Journal, 2013, 64(3): 788-800.
[6] WANG H, YAO M. Fault detection of batch processes based on multivariate functional kernel principal component analysis[J]. Chemometrics & Intelligent Laboratory Systems, 2015, 149: 78-89.
[7] 王立敏, 楊繼勝, 于晶賢, 等. 基于T-S模糊模型的間歇過(guò)程的迭代學(xué)習(xí)容錯(cuò)控制[J]. 化工學(xué)報(bào), 2017, 68(3): 1081-1089. WANG L M, YANG J S, YU J X,. Iterative learning fault-tolerant control for batch processes based on T-S fuzzy model[J]. CIESC Journal, 2017, 68(3): 1081-1089.
[8] KADLEC P, GABRYS B, STRANDT S. Data-driven soft sensors in the process industry[J]. Computers & Chemical Engineering, 2009, 33(4): 795-814.
[9] ZHANG Z J, CHEN J H. Correntropy based data reconciliation and gross error detection and identification for nonlinear dynamic processes[J]. Computers & Chemical Engineering, 2015, 75: 120-134.
[10] CENCIC O, FRüHWIRTH R. A general framework for data reconciliation(Ⅰ): Linear constraints[J]. Computers & Chemical Engineering, 2015, 75: 196-208.
[11] 蔣余廠, 劉愛(ài)倫. 基于GLR-NT的顯著性誤差檢測(cè)與數(shù)據(jù)協(xié)調(diào)[J]. 華東理工大學(xué)學(xué)報(bào)(自然科學(xué)版), 2011, 37(4): 502-508. JIANG Y C, LIU A L. Gross error detection and data reconciliation based on a GLR-NT combined method[J]. Journal of East China University of Science and Technology (Natural Science Edition), 2011, 37(4): 502-508.
[12] GE Z Q, SONG Z H, GAO F R. Review of recent research on data-based process monitoring[J]. Industrial & Engineering Chemistry Research, 2013, 52(10): 3543-3562.
[13] WANG J S, CHIANG J C. A cluster validity measure with outlier detection for support vector clustering[J]. IEEE Transactions on Systems Man and Cybernetics, Part B-Cybernetics, 2008, 38(1): 78-89.
[14] 田慧欣, 毛志忠, 趙珍. 與軟測(cè)量建模相結(jié)合的過(guò)失誤差偵破新方法[J]. 儀器儀表學(xué)報(bào), 2008, 29(12): 2658-2662. TIAN H X, MAO Z Z, ZHAO Z. New method of gross error detection combined with soft sensor modeling[J]. Chinese Journal of Scientific Instrument, 2008, 29(12): 2658-2662.
[15] COAKLEY D, RAFTERY P, KEANE M. A review of methods to match building energy simulation models to measured data[J]. Renewable and Sustainable Energy Reviews, 2014, 37(3): 123-141.
[16] NARASIMHAN S, BHATT N. Deconstructing principal component analysis using a data reconciliation perspective[J]. Computers & Chemical Engineering, 2015, 77: 74-84.
[17] LUO L J, BAO S Y, MAO J F,. Phase partition and phase-based process monitoring methods for multiphase batch processes with uneven durations[J]. Industrial & Engineering Chemistry Research, 2016, 55(7): 2035-2048.
[18] ZADEH L A. A simple view of the Dempster-Shafer theory of evidence and its implication for the rule of combination[J]. AI Magazine, 1986, 7(2): 85-90.
[19] 陳斌, 萬(wàn)江文, 吳銀鋒, 等. 神經(jīng)網(wǎng)絡(luò)和證據(jù)理論融合的管道泄漏診斷方法[J]. 北京郵電大學(xué)學(xué)報(bào), 2009, 32(1): 5-9. CHEN B, WAN J W, WU Y F,. A pipeline leakage diagnosis for fusing neural network and evidence theory[J]. Journal of Beijing University of Posts and Telecommunications, 2009, 32(1): 5-9.
[20] GHOSH K, NATARAJAN S, SRINIVASAN R. Hierarchically distributed fault detection and identification through Dempster-Shafer evidence fusion[J]. Industrial & Engineering Chemistry Research, 2011, 50(15): 9249-9269.
[21] HUI K H, LIM M H, LEONG M S,. Dempster-Shafer evidence theory for multi-bearing faults diagnosis[J]. Engineering Applications of Artificial Intelligence, 2017, 57: 160-170.
[22] DEMPSTER A P. The Dempster-Shafer calculus for statisticians[J]. International Journal of Approximate Reasoning, 2008, 48(2): 365-377.
[23] LIU W R. Analyzing the degree of conflict among belief functions[J]. Artificial Intelligence, 2006, 170(11): 909-924.
[24] MURPHY C K. Combining belief functions when evidence conflicts[J]. Decision Support Systems, 2000, 29(1): 1-9.
[25] NOMIKOS P, MACGREGOR J F. Monitoring batch processes using multiway principal component analysis[J]. AIChE Journal, 1994, 40(8): 1361-1375.
[26] KIERS H A L, TEN BERGE J M F, BRO R. PARAFAC2(Ⅰ): A direct fitting algorithm for the PARAFAC2 model[J]. Journal of Chemometrics, 1999, 13(3/4): 275-294.
[27] 韓敏, 張占奎. 基于改進(jìn)核主成分分析的故障檢測(cè)與診斷方法[J]. 化工學(xué)報(bào), 2015, 66(6): 2139-2149. HAN M, ZHANG Z K. Fault detection and diagnosis method based on modified kernel principal component analysis[J]. CIESC Journal, 2015, 66(6): 2139-2149.
[28] BASIR O, YUAN X H. Engine fault diagnosis based on multi-sensor information fusion using Dempster-Shafer evidence theory[J]. Information Fusion, 2007, 8(4): 379-386.
[29] BIROL G, üNDEY C, CINAR A. A modular simulation package for fed-batch fermentation: penicillin production[J]. Computers & Chemical Engineering, 2002, 26(11): 1553-1565.
[30] JACKSON J E. A User's Guide to Principal Components[M]. New York: John Wiley & Sons, 2005.
Multi-evidence fusion decision-making method for detecting abnormal data of batch processes
LIU Weimin, WANG Jianlin, QIU Kepeng, YU Tao, ZHAO Liqiang
(College of Information Science and Technology, Beijing University of Chemical Technology, Beijing100029, China)
High-dimensional, non-linear, and non-Gaussian distributions of measured data in batch processes directly influence accuracy of detecting abnormal data. In order to integrate information of multi-source abnormal detection and increase detection accuracy, a method was proposed on the basis of multi-evidence fusion decision. With introduction of the Dempster-Shafer evidence theory, the main focal element was used to identify fake evidence and to recompute weight of evidences. The re-calculation on weight of evidences improved handling conflict evidences, reduced influence of conflict evidences on multi-evidence fusion decision, and enhanced detection accuracy of abnormal measured data. Furthermore, an abnormal detection model was constructed from multi-evidence fusion decision and was applied to decision-making of abnormal data detection in batch processes. The experimental results show that the proposed method can combine multi-evidence information and analyze conflict evidence effectively. Thus abnormal data detection for batch processes is achieved with low false and missing detection rates.
batch processes; Dempster-Shafer theory; conflicting evidence; multi-evidence decision; abnormal measured data detection
10.11949/j.issn.0438-1157.20170117
TQ 277
A
0438—1157(2017)08—3183—07
王建林。第一作者:劉偉旻(1989—),男,博士研究生。
國(guó)家自然科學(xué)基金項(xiàng)目(61240047);北京市自然科學(xué)基金項(xiàng)目(4152041)。
2017-02-26收到初稿,2017-04-22收到修改稿。
2017-02-26.
Prof. WANG Jianlin, wangjl@ mail.buct.edu.cn
supported by the National Natural Science Foundation of China (61240047) and the Natural Science Foundation of Beijing (4152041).