朱紅林,王帆,侍洪波,譚帥
?
基于LPP-GNMF算法的化工過程故障監(jiān)測方法
朱紅林,王帆,侍洪波,譚帥
(華東理工大學化工過程先進控制和優(yōu)化技術(shù)教育部重點實驗室,上海 200237)
提出了基于LPP-GNMF算法的化工過程故障監(jiān)測方法。非負矩陣分解(NMF)是一種新興的降維算法,由于它在機理上具有潛變量的正向純加性的特點,所以在對數(shù)據(jù)進行壓縮時,可以基于數(shù)據(jù)內(nèi)部的局部特征有效描述數(shù)據(jù)信息,相比于傳統(tǒng)的多元統(tǒng)計過程監(jiān)控方法如主元分析(PCA)等有更好的解釋能力。然而NMF要求原始數(shù)據(jù)滿足非負性的要求,實際的化工過程有時并不能保證,為放寬對原始數(shù)據(jù)的非負要求,引入了廣義非負矩陣分解(GNMF)算法。其次,GNMF在分解的過程中沒有考慮到樣本間的局部結(jié)構(gòu)和幾何性質(zhì),可能存在不能準確處理數(shù)據(jù)的問題。針對這一問題,提出了將GNMF與LPP(局部投影保留)相結(jié)合的算法。將提出的LPP-GNMF算法應用于TE過程來評估其監(jiān)測性能,并與PCA算法、NMF算法、SNMF算法進行比較,仿真模擬結(jié)果表明所提算法的可行性。
算法;故障監(jiān)測;主元分析;廣義非負矩陣分解;局部投影保留;模擬
隨著化工過程的日趨復雜,為了確保生產(chǎn)設備的安全運行,提高生產(chǎn)的效率,改善產(chǎn)品的質(zhì)量,避免因系統(tǒng)故障而產(chǎn)生災難性的事故,對過程的生產(chǎn)狀態(tài)進行故障監(jiān)測變得十分重要。同時,隨著計算機集散系統(tǒng)的廣泛應用,化工過程中產(chǎn)生的大量數(shù)據(jù)被記錄下來。如何有效利用這些高維、相互關(guān)聯(lián)或冗余的海量數(shù)據(jù)[1],挖掘出系統(tǒng)運行狀態(tài)的特征信息,變得尤為關(guān)鍵。在這種情況下,多元統(tǒng)計過程監(jiān)控方法(MSPM)應運而生。
MSPM方法通過將高維空間的原始數(shù)據(jù)投影到相對獨立的低維子空間,可有效解決復雜化工過程數(shù)據(jù)量大、數(shù)據(jù)間耦合性強的問題,降低數(shù)據(jù)分析的難度。傳統(tǒng)的MSPM算法主要包括主元分析法(PCA)、規(guī)范變量分析法(CVA)、偏最小二乘法(PLS)、獨立主元分析法(ICA)、Fisher判別分析法(FDA)等[2-6]。這些算法目前都已被成功應用于化工過程的故障監(jiān)測中。
PCA算法是化工過程監(jiān)測研究中應用最為廣泛的一種算法,它通過對原始數(shù)據(jù)進行最優(yōu)線性降維處理,有效解決了變量間的相關(guān)性問題,提取出的特征能夠反映原始數(shù)據(jù)全局信息[7]。PCA算法需要原始數(shù)據(jù)滿足高斯分布,然而現(xiàn)實的化工過程中數(shù)據(jù)分布往往不能滿足這一要求。針對此問題,相關(guān)學者提出了ICA算法[8-10]。ICA算法通過將原始數(shù)據(jù)分解為統(tǒng)計意義上相互獨立的主元的線性組合,能夠有效處理非高斯分布的數(shù)據(jù),但它對高斯分布數(shù)據(jù)的處理效果并不理想。
非負矩陣分解算法(NMF)是由Lee等[11]在1999年首次提出的。作為一種新興的多元統(tǒng)計分析算法,NMF算法與傳統(tǒng)多元統(tǒng)計分析算法相比,對原始數(shù)據(jù)除了非負性要求外沒有其他要求,因此其應用范圍更加廣泛。NMF算法能夠在大量數(shù)據(jù)中學習到數(shù)據(jù)內(nèi)部的局部特征,分解得到具有非負性與較強稀疏性的因子。其中稀疏性刻畫了數(shù)據(jù)的局部特征,非負性在運算上表示為正向純加性。所以NMF算法與傳統(tǒng)統(tǒng)計分析算法相比,具有更強的解釋性,即局部組成整體的特性。在最近幾年,NMF算法得到了越來越多的關(guān)注和研究。Wild等[12]利用球面均值聚類作為NMF的初始化步驟,在提高了算法效率的同時,也可能使算法收斂到相對不好的局部解。Cichocki等[13]提出了利用歐氏距離平方的局部特性,先在不要求非負的條件下得到解析解,最后通過非線性投影使其滿足非負性的要求,雖然這種改進的算法收斂速度較快,但很可能會發(fā)生振蕩。Hoyer[14]針對NMF算法天然具備的稀疏性不充分的問題,提出通過非線性投影實現(xiàn)對稀疏性的精確控制。Cai等[15]將NMF與流形學習中的圖譜理論相結(jié)合,在NMF的目標函數(shù)中增加了流形正則的約束項,提出了圖譜正則NMF算法,吸收了流形學習描述數(shù)據(jù)幾何結(jié)構(gòu)的能力。Lee等[16]通過利用有標簽數(shù)據(jù)和無標簽數(shù)據(jù)提取數(shù)據(jù)的類別信息,提出了一種半監(jiān)督的NMF算法。
目前,在化工過程的故障監(jiān)測領(lǐng)域,NMF算法的應用還相對較少。Li等[17]提出了利用NMF算法對非高斯過程進行故障監(jiān)測,并通過仿真實驗驗證了NMF算法應用于化工過程故障監(jiān)測的可行性,而且比傳統(tǒng)的多元統(tǒng)計故障監(jiān)測方法有更加廣泛的應用能力。王帆等[18]提出了稀疏性非負矩陣分解(SNMF)算法,通過在NMF算法的基礎(chǔ)上引入稀疏編碼(sparse coding)方法得到對數(shù)據(jù)集更加稀疏的表示,通過TE過程的仿真驗證說明該方法相比于基本NMF算法具有明顯的優(yōu)越性。
然而,目前NMF算法在化工過程的故障監(jiān)測領(lǐng)域的應用中,往往沒有考慮到樣本間的局部結(jié)構(gòu)和幾何性質(zhì),這就可能造成數(shù)據(jù)處理不夠準確的問題。針對這一問題,通過將NMF算法與LPP算法相融合,提出一種既能保持NMF算法挖掘數(shù)據(jù)內(nèi)部局部信息能力,又具有LPP算法保留樣本間的幾何信息和局部結(jié)構(gòu)能力的新算法。同時,在化工過程中并不能保證所有數(shù)據(jù)具有非負特性,因此引用了一種GNMF算法的思想,放寬了NMF的非負性限制,提出了LPP-GNMF算法。最后通過對TE過程的仿真實驗以驗證算法的有效性和優(yōu)越性。
1.1 非負矩陣分解
矩陣分解是對大規(guī)模數(shù)據(jù)進行處理和分析的有效工具,NMF算法作為一種新興的算法,為矩陣分解提供了一種新的思路。與其他矩陣分解算法不同,NMF算法要求分解前后矩陣中的元素都是非負的。因為對分解后的矩陣元素只做加法運算,且分解后的基矩陣具有稀疏性,所以NMF算法具有部分構(gòu)成整體的特性,較其他算法具有更好的解釋性。
NMF算法可以這樣描述:對于一個給定的非負矩陣∈×n,其中為樣本數(shù),為測量變量數(shù)。NMF算法是要找到兩個非負矩陣∈×k和∈×n,使得式(1)成立。
其中,下角標“+”表示非負性約束,為降維階次。一般地,降維階次的取值應該滿足(+)<。NMF算法得到的兩個非負矩陣:稱為基矩陣,其中每一列構(gòu)成一個基向量,稱為系數(shù)矩陣,其中每一列代表了趨近于的每一列所需的非負系數(shù)。因此這個分解過程可以形象地描述為:對于個維非負數(shù)據(jù)組成的矩陣,在維空間中存在一組非負向量,使得矩陣中每一列向量都可以描述為該組非負向量的非負線性組合。NMF算法由此實現(xiàn)了原始數(shù)據(jù)的低維近似描述。
NMF算法的求解可以歸結(jié)為一個非線性最優(yōu)化的過程,首先通過定義一個目標函數(shù)來刻畫式(1)前后的逼近程度,然后尋找一套合適的迭代規(guī)則求解該最優(yōu)化問題。Lee等[11]給出了兩種目標函數(shù)來解決該優(yōu)化問題,并給出了迭代規(guī)則,本文選用其給出的第1種目標函數(shù)。
采用歐氏距離來度量原始矩陣與基矩陣和系數(shù)矩陣之積(即原始數(shù)據(jù)的低維近似)之間的誤差,NMF的解就是在非負條件下使它們之間誤差最小的穩(wěn)定點。其目標函數(shù)如式(2)所示。
對于這個最優(yōu)化問題,它的下限為0,當且僅當=時,式(2)取最小值0。當式(2)值越接近于0,則說明所得解越精確。上述目標函數(shù)對于分別以和為變量的最優(yōu)化問題是凸的,但同時對于和卻是非凸的,因此該優(yōu)化問題無全局最優(yōu)解。Lee等[11]給出并證明了該目標函數(shù)的局部最優(yōu)解的乘性迭代規(guī)則如下。
在該迭代規(guī)則下,當且僅當和固定時,目標函數(shù)值保持不變。其中基矩陣保留了原始矩陣的空間關(guān)系和數(shù)據(jù)結(jié)構(gòu),系數(shù)矩陣為原始矩陣的低階近似矩陣。
1.2 局部保留投影(LPP)
LPP算法是一種低維子空間表示高維數(shù)據(jù)的降維方法,它利用構(gòu)建鄰近圖的方法來建立關(guān)系映射,具有流形分析和學習的能力。該算法主要考慮了保持數(shù)據(jù)的鄰近點之間的結(jié)構(gòu),能夠保留原始數(shù)據(jù)的局部信息和幾何結(jié)構(gòu)。
假設原始數(shù)據(jù)矩陣∈×n中有個樣本,(=1, 2,…,),每個樣本的維度為。降維的目標是尋找一個投影方向矩陣,使得高維樣本數(shù)據(jù)經(jīng)過線性變化T得到其在低維空間(維)中能最大限度代表高維樣本數(shù)據(jù)的低維數(shù)據(jù)向量表示∈(=1, 2,…,),并且保證在原樣本空間中的相鄰點經(jīng)過線性變換后在低維空間仍然盡可能接近。在一定的約束條件下通過最小化式(5)的目標函數(shù),求得投影方向矩陣
其中的值為
為對稱矩陣,它表示樣本量與的鄰近關(guān)系。利用關(guān)系式=T,目標函數(shù)可以簡化為式(7)
該算法的具體步驟如下。
(1)構(gòu)建鄰域圖。以歷史數(shù)據(jù)庫中的個樣本點構(gòu)造鄰域圖。鄰域數(shù)目為。
(2)計算權(quán)重矩陣。若與相鄰,則權(quán)重值=1;若與不相鄰,則權(quán)重值=0。
(3)計算投影方向矩陣。計算式(8)廣義特征方程的個最小特征值對應的特征向量,構(gòu)成投影方向矩陣。
(4)新訓練樣本∈的低維表示:=T∈。
2.1 廣義非負矩陣分解
由于NMF算法要求原始數(shù)據(jù)矩陣滿足非負性,然而化工過程中產(chǎn)生的數(shù)據(jù)在一些情況下并不能滿足非負性要求,為此對原始數(shù)據(jù)矩陣的非負性限制進行放寬,引入了一種廣義非負矩陣分解(GNMF)算法的思想[19]。其分解的數(shù)學形式變?yōu)?/p>
GNMF算法的目標函數(shù)為
其迭代規(guī)則為
其中,[]+=(||+)/2,[]?=(||?)/2,±=+??。
2.2 LPP-GNMF算法
GNMF算法能夠挖掘出數(shù)據(jù)點內(nèi)部的局部信息,卻忽略了數(shù)據(jù)點之間的幾何關(guān)系,這可能會造成數(shù)據(jù)處理不夠準確的問題。LPP算法是一種流形學習算法,它的基本思想是在降維的過程中保持數(shù)據(jù)的鄰近點之間的結(jié)構(gòu)關(guān)系,保留原始數(shù)據(jù)的幾何結(jié)構(gòu)和局部信息。因此希望通過在GNMF算法的基礎(chǔ)上增加一個LPP算法的新的約束項,即在式(10)的基礎(chǔ)上添加式(8)作為約束條件,得到的目標函數(shù)如式(12)所示
其中,=1, 2,…,,∈×k是基矩陣,表示其列向量(基向量);是接近于零的極小值,它對等式(8)做一定的松弛;∈×m為一個對角矩陣,其對角線上的前個元素可能為非零值,其他所有元素均為零。其思想是:找到合適的基矩陣,使得原始數(shù)據(jù)矩陣與T盡可能接近的同時使得T與T盡可能接近。為了方便計算,將目標函數(shù)式(12)轉(zhuǎn)化為式(13)。
其中LPP-GNMF算法是在GNMF算法的基礎(chǔ)上增加一個LPP算法作為一個約束項,參數(shù)為一個系數(shù),通過它調(diào)整LPP算法的影響程度。
LPP-GNMF算法的迭代公式為
其中,=T?T,為對角矩陣,,=1, 2,…,。
基于2.2節(jié)提出的LPP-GNMF算法,這里提出一種新的化工過程故障監(jiān)測方法。
3.1 初始化
LPP-GNMF算法是一種迭代算法,其基矩陣的初始化對算法的結(jié)果有很大的影響。選擇一個好的初始化值,能使LPP-GNMF算法快速收斂到一個更好的局部最優(yōu)解。目前,奇異值分解(SVD)和正隨機數(shù)初始化是兩種常見的初始化方法。
這里選用奇異值分解方法對LPP-GNMF算法的基矩陣進行初始化,通過對分解結(jié)果的負值強置為零保證的非負性。降維階次的選取根據(jù)對原始數(shù)據(jù)矩陣的協(xié)方差陣做奇異值分解,按方差貢獻度85%選取。
3.2 LPP-GNMF算法的監(jiān)測指標及控制限
當LPP-GNMF算法用于過程監(jiān)控時,其過程監(jiān)測模型如式(15)所示
為了對過程故障進行監(jiān)測,構(gòu)造兩個監(jiān)測指標如式(16)、式(17)所示
3.3 過程故障監(jiān)測流程
基于LPP-GNMF算法的過程故障監(jiān)測流程如下。
(1)離線建模
① 數(shù)據(jù)預處理。對訓練樣本矩陣進行歸一化處理。
② 給定鄰域數(shù)目,構(gòu)建領(lǐng)域圖,參照1.2節(jié)LPP算法,計算權(quán)重矩陣以及矩陣、。
③ 首先對基矩陣進行初始化,用LPP-GNMF算法的迭代公式計算得到基矩陣的值。
④ 根據(jù)式(16)、式(17)分別計算監(jiān)測指標2和SPE。
⑤使用KDE方法計算監(jiān)測指標2和SPE的控制限。
(2)在線監(jiān)測
① 對于新的測試樣本new,根據(jù)式(16)、式(17)計算監(jiān)測指標2new和SPEnew的值。
② 通過比較監(jiān)測指標2new和SPEnew的值與相應控制限之間的關(guān)系,判斷過程是否發(fā)生故障。
4.1 TE過程
TE過程作為基于實際化工過程而搭建的仿真平臺,能夠模擬化工生產(chǎn)的過程,產(chǎn)生大量的正常數(shù)據(jù),并通過設置多種故障場景,得到多種故障數(shù)據(jù)。目前,TE測試平臺在基于數(shù)據(jù)驅(qū)動的故障監(jiān)測領(lǐng)域被大量使用,已成為評價監(jiān)測算法性能和優(yōu)越性的有效工具。本文選用TE過程對LPP-GNMF的監(jiān)測性能進行驗證,下面對TE過程進行簡要介紹。
TE過程是一個復雜的化工生產(chǎn)過程,包含5個主要的操作單元:反應器、汽提塔、冷凝器、氣液分離器、循環(huán)壓縮機[20]。它包含有4種反應物、2種產(chǎn)品、1種副產(chǎn)品以及1種惰性氣體。該過程中總共包含12個控制變量以及41個測量變量,其中第12個控制變量為反應器的攪拌速度,它屬于機械領(lǐng)域,即使發(fā)生故障也不會對產(chǎn)品質(zhì)量造成太大影響,所以不用于監(jiān)控建模。
TE過程中總共可以設定21種故障場景[20]。訓練集和測試集樣本的采樣時間均為3 min,每個樣本數(shù)據(jù)包含52個變量。選用960正常樣本數(shù)據(jù)作為訓練集用于建立監(jiān)測模型。在每一種故障情況下,進行960次采樣,故障在第160個樣本點后加入,得到測試集。
這里分別將PCA算法、NMF算法、SNMF算法、LPP-GNMF算法應用于TE過程仿真實驗中。在PCA算法的仿真實驗中,方差貢獻度選為85%,此時降維階次選為27。為了滿足NMF算法、SNMF算法要求原始矩陣具有非負性的要求,對每個測量變量,首先減去該變量可變化范圍的最小值,再除以可變化范圍的最大值與最小值之差。對于LPP-GNMF算法由于對原始矩陣的非負要求進行了放寬,只需與PCA一樣,對變量進行歸一化處理。降維階次的值,根據(jù)SVD分解結(jié)果,按方差貢獻度為85%選取為27。對于鄰域數(shù)目與參數(shù),根據(jù)最終監(jiān)測結(jié)果的好壞,經(jīng)過多次試湊,分別取為12和0.4。
4.2 結(jié)果討論
故障監(jiān)測率是指故障引入系統(tǒng)后,被算法檢測出來的樣本數(shù)與總故障樣本數(shù)之間的百分比。故障監(jiān)測率是評價監(jiān)測效果的重要標準。4種算法的監(jiān)測結(jié)果見表1[18]。
對于故障3、9、15、19,因為其測試集數(shù)據(jù)在均值、方差以及高階矩上都沒有明顯的變化,所以使用多元統(tǒng)計過程監(jiān)控方法的監(jiān)測效果很差,在本文中不進行研究[21]。在其余故障情況下,NMF算法與LPP-GNMF算法的誤報率始終保持在5%之內(nèi)。對于故障21,基于PCA算法的SPE監(jiān)測指標的誤報率過高,這里也不進行研究。對于故障8、12、17、18、19,基于PCA算法的SPE監(jiān)測指標的誤報率略高于5%。
對于故障1、2、6、7、8,從表1中可以看出,4種算法的故障監(jiān)測率基本相同,這是因為當這些故障發(fā)生時,它們的數(shù)據(jù)結(jié)構(gòu)發(fā)生較明顯變化,故4種算法均能獲得很好的監(jiān)測效果。對于故障5、10、11、16、18、20,基于LPP-GNMF算法的監(jiān)測效果要好于基于PCA算法。但在有些情況下,LPP-GNMF算法的監(jiān)測效果卻不如PCA,這是因為NMF算法具有稀疏性的特點,它會將信息集中在相對較少的投影方向上,這可能使得一些與這些投影方向相關(guān)性較差的信息的丟失,而PCA算法卻能包含這些信息。但同時從表1可以看到,對于這類故障,LPP-GNMF算法的監(jiān)測效果與PCA相差不大,LPP-GNMF能用較少的投影方向獲取到相關(guān)信息。
表1 PCA、NMF、SNMF、LPP-GNMF算法對TE過程的故障監(jiān)測率
Table 2 Fault detection rates of PCA, NMF, SNMF and LPP-GNMF in TE process
對于故障4、5、10、11、12、13、14、16、17、18和20,基于LPP-GNMF算法的監(jiān)測效果都好于基于NMF與SNMF的算法。從表1中可以看出,故障4、5、14、16和17的2監(jiān)測指標,LPP-GNMF算法較NMF算法有超過10%的提升;故障10、11、14、17、20的SPE監(jiān)測指標,LPP-GNMF算法較NMF算法也有較明顯提高。同時LPP-GNMF算法與SNMF算法相比,故障5、16的2監(jiān)測指標、故障11、17、20的SPE監(jiān)測指標均有很大的提升。
值得注意的是,在故障4的監(jiān)測上,基于PCA算法的2監(jiān)測指標與基于NMF算法的2監(jiān)測指標故障監(jiān)測率很低,而LPP-GNMF算法與SNMF算法的2指標卻能較為有效地對故障進行監(jiān)控。4種算法對故障4的監(jiān)測效果如圖1所示[18]。此外,對于故障5,4種算法的SPE指標的監(jiān)測效果都很差,而LPP-GNMF的2指標相較于PCA、NMF和SNMF卻有很大的提高,其故障監(jiān)測率能達到99.125%。它們的監(jiān)測效果如圖2所示[18]。
總體而言,基于NMF與LPP-GNMF算法的故障監(jiān)測效果優(yōu)于基于PCA算法。由于在對數(shù)據(jù)進行非負矩陣分解的過程中,考慮到了保持樣本點間幾何拓撲結(jié)構(gòu)的問題,從而對數(shù)據(jù)實現(xiàn)了更加準確的處理,故LPP-GNMF算法的監(jiān)測效果明顯優(yōu)于基本NMF算法與SNMF算法。
相比于傳統(tǒng)的多元統(tǒng)計過程監(jiān)控算法,NMF算法對數(shù)據(jù)具有更好的解釋能力。在NMF算法的基礎(chǔ)上,為了在降維的過程中保持樣本間的幾何信息與局部結(jié)構(gòu),將LPP算法引入NMF的目標函數(shù)中,實現(xiàn)了對樣本數(shù)據(jù)更加準確的處理。同時由于化工過程中往往不能保證數(shù)據(jù)的非負性,因此應用了GNMF的思想,放寬了NMF算法的應用范圍。將提出的LPP-GNMF算法用于TE過程的監(jiān)控中,仿真過程證明所提出的LPP-GNMF算法的監(jiān)控效果明顯優(yōu)于基本的NMF算法。
[1] 李晗, 蕭德云. 基于數(shù)據(jù)驅(qū)動的故障診斷方法綜述[J]. 控制與決策, 2011, 26(1): 1-9. LI H, XIAO D Y. Survey on data driven fault diagnosis methods[J]. Control and Decision, 2011, 26(1): 1-9.
[2] HE X B, YU P Y. Variable MWPCA for adaptive process monitoring[J]. Industrial and Engineering Chemistry Research, 2008, 47(2): 419-427.
[3] ODIOWEI P P, CAO Y. Nonlinear dynamic process monitoring using canonical variate analysis and kernel density estimations[J]. IEEE Transactions on Industrial Informatics, 2009, 27(1): 1557-1562.
[4] LI G, QIN S J, ZHOU D. Geometric properties of partial least squares for process monitoring[J]. Automatica, 2010, 46(1): 204-210.
[5] KANO M, TANAKA S, HASEBE S,. Monitoring independent components for fault detection[J]. AIChE Journal, 2003, 49(4): 969-976.
[6] HE X B, WANG W, YANG Y H. Variable-weighted fisher discriminant analysis for process fault diagnosis[J]. Journal of Process Control, 2009, 19(6): 923-931.
[7] 夏陸岳, 潘海天, 周猛飛, 等. 基于改進多尺度主元分析的丙烯聚合過程監(jiān)測與故障診斷[J]. 化工學報, 2011, 62(8): 2312-2317. XIA L Y, PAN H T, ZHOU M F,. Process monitoring and fault diagnosis of propylene polymerization based on improved multiscale principle component analysis[J]. CIESC Journal, 2011, 62(8): 2312-2317.
[8] LEE J M, YOO C K, LEE I B. Statistical process monitoring with independent component analysis[J]. Journal of Process Control, 2004, 14(5): 467-485.
[9] ZHANG Y W, QIN S J. Fault detection of nonlinear process using multiway kernel independent analysis[J]. Industrial and Engineering Chemistry Research, 2007, 46(23): 7780-7787.
[10] GE Z Q, SONG Z H. Process monitoring based on independent component analysis-principal component analysis (ICA-PCA) and similarity factors[J]. Industrial and Engineering Chemistry Research, 2007, 46(7): 2054-2063.
[11] LEE D D, SEUNG H S. Learning the parts of objects by nonnegative matrix factorization[J]. Nature, 1999, 401: 788-791.
[12] WILD S, CURRY J, DOUGHERTY A. Improving non-negative matrix factorizations through structured initialization[J]. Pattern Recognition, 2004, 37(11): 2217-2232.
[13] CICHOCKI A, AMARI S I, ZDUNEK R,. Extended SMART algorithms for non-negative matrix factorization[J]. Lecture Notes in Computer Science, 2006, 4029: 548-562.
[14] HOYER P O. Non-negative matrix factorization with sparseness constraints[J]. Journal of Machine Learning Research, 2004, 5(1): 1457-1469.
[15] CAI D, HE X, HAN J,. Graph regularized non-negative matrix factorization for data representation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2011, 33(8): 1548-1560.
[16] LEE H, YOO J, CHOI S. Semi-supervised nonnegative matrix factorization[J]. IEEE Signal Processing Letters, 2010, 17(1): 4-7.
[17] LI X B, YANG Y P, ZHANG W D. Fault detection method for non-Gaussian processes based on non-negative matrix factorization[J]. Asia-Pacific Journal Chemical Engineering, 2013, 8(3): 362-370.
[18] 王帆, 楊雅偉, 譚帥, 等. 基于稀疏性非負矩陣分解的故障監(jiān)測方法[J]. 化工學報, 2015, 66(5): 1798-1805. WANG F, YANG Y W, TAN S,. Fault detection method based on sparse non-negative matrix factorization[J]. CIESC Journal, 2015, 66(5): 1798-1805.
[19] LI X B, YANG Y P, ZHANG W D. Statistical process monitoringgeneralized non-negative matrix projection[J]. Chemometrics and Intelligent Laboratory System, 2013, 121(7): 15-25.
[20] DOWNS J J, VOGEL E F. A plant-wide industrial process control problem[J]. Computers & Chemical Engineering, 1993, 17(3): 245-255.
[21] YU J B. Local and global principal component analysis for process monitoring[J]. Journal of Process Control, 2012, 22(7): 1358-1373.
Fault detection method for chemical process based on LPP-GNMF algorithm
ZHU Honglin, WANG Fan, SHI Hongbo, TAN Shuai
(Key Laboratory of Advanced Control and Optimization for Chemical Processes of Ministry of Education, East China University of Science and Technology, Shanghai 200237, China)
A fault detection method for chemical process based on LPP-GNMF algorithm is proposed. NMF (non-negative matrix factorization) is a novel dimensionality reduction algorithm, with characteristics of positive pure additivity of latent variables in the mechanism, thus, when compressing the data, the information can be described based on the local characteristics inner the data. Compared to the traditional multivariate statistical process monitoring methods such as principal component analysis (PCA), NMF offers a better ability for data explanation. However, firstly, NMF requires the original data to meet the requirements of non-negative, which can not be guaranteed in the actual chemical process, in order to relax the non-negative requirements of the original data, a generalized non-negative matrix factorization (GNMF) algorithm is quoted. Secondly, GNMF does not take the local structure and geometric properties into account during the process of decomposition, which may not be accurate to deal with the problem of data. Aiming at this problem, the algorithm of combining GNMF with LPP (locality preserving projection) is proposed. The proposed LPP-GNMF algorithm is applied to the Tennessee Eastman process to evaluate the monitoring performance. The simulation results show the feasibility of the proposed algorithm compared with the PCA algorithm, the NMF algorithm and the SNMF algorithm.
algorithm; fault detection; principal component analysis; generalized non-negative matrix factorization; locality preserving projection; simulation
date: 2016-08-30.
Prof. SHI Hongbo, hbshi@ecust.edu.cn
10.11949/j.issn.0438-1157.20161199
TP 277
A
0438—1157(2016)12—5155—08
國家自然科學基金項目(61374140);國家自然科學基金青年科學基金項目(61403072)。
supported by the National Natural Science Foundation of China (61374140) and the Young Scientists Fund of the National Natural Science Foundation of China (61403072).
2016-08-30收到初稿,2016-09-11收到修改稿。
聯(lián)系人:侍洪波。第一作者:朱紅林(1991—),男,碩士研究生。