陳家益,趙忠蓋,劉 飛
?
魯棒PPLS模型及其在過程監(jiān)控中的應用
陳家益,趙忠蓋,劉飛
(江南大學自動化研究所,輕工過程先進控制教育部重點實驗室,江蘇 無錫 214122)
摘要:概率偏最小二乘(PPLS)模型建立的條件是主元和誤差都服從高斯分布,但是高斯分布的期望和方差容易受到離群點的影響,導致模型的魯棒性較差。針對 PPLS模型的不足,提出一種魯棒概率偏最小二乘(RPPLS)方法,用拖尾更寬的T分布代替高斯分布,通過調(diào)整自由度參數(shù),使模型對含離群點數(shù)據(jù)的擬合效果更好。更進一步,將RPPLS引入過程監(jiān)控中,提出GT2和GSPE兩個監(jiān)控指標,分別監(jiān)控過程的受控狀態(tài)以及模型關系的變化。PPLS和RPPLS在TE過程監(jiān)控的應用結(jié)果表明RPPLS不僅能更準確檢測故障的產(chǎn)生,而且能更有效降低故障的漏報率。
關鍵詞:魯棒概率偏最小二乘算法;T分布;參數(shù)估值;監(jiān)控指標;模型
隨著人們對高質(zhì)量和多品種產(chǎn)品的需求日益增長,工業(yè)生產(chǎn)越來越趨向大型化和間歇化,為了保證生產(chǎn)過程的安全平穩(wěn)運行和產(chǎn)品質(zhì)量,對過程變量進行全面有效地監(jiān)控變得非常重要[1-2]。多元統(tǒng)計過程控制(MSPC)方法通過將高維數(shù)據(jù)投影到低維空間,大大簡化和改進了過程的監(jiān)控程序,在工業(yè)監(jiān)控過程中得到了廣泛的應用[3-4]。偏最小二乘(PLS)是常用的統(tǒng)計建模方法,不僅可以完成降維和特征提取,還考慮了輸入輸出之間的回歸關系,從而提高了預測模型的準確性[5-6],但 PLS模型沒有考慮到主元和誤差的概率分布情況。Li等[7]將概率分布引入PLS模型提出概率偏最小二乘(PPLS)方法,考慮到每個變量的概率分布,在主元和誤差都服從高斯分布的條件下,通過求解極大似然函數(shù)得到模型參數(shù)。但是在工業(yè)過程中,現(xiàn)場環(huán)境惡劣,檢測離群點普遍存在,而高斯分布的期望和方差容易受到離群點的影響,導致建立的模型魯棒性較差。為了解決這個問題,拖尾更寬的T分布被引入用于代替高斯分布[8-9]。高斯分布是T分布的自由度趨于無窮大時的一種特殊情況,顯然不受約束的T分布更能反映實際工程下數(shù)據(jù)的分布狀況。T分布能通過調(diào)整自由度的大小改變拖尾寬度,減小中間的概率空間,增加兩邊的概率空間,從而能夠包含更多的離群點,使模型對含離群值數(shù)據(jù)的擬合效果更好,因此得到廣泛應用。Archambeau等[10-11]提出了魯棒概率主元分析(RPPCA)模型和混合RPPCA模型,Chen等[12]將RPPCA模型推廣到處理數(shù)據(jù)缺失問題并進行了貢獻分析,Zhu等[13]提出了魯棒混合PPCA模型。但是,這些方法主要是針對概率主元分析(PPCA)的改進。
本文首先分析了離群點對PPLS模型的影響,然后提出一種魯棒概率偏最小二乘(RPPLS)方法,用T分布來代替高斯分布,使生成模型對離群點具有更好的魯棒性,彌補PPLS模型的不足??紤]到建立RPPLS模型時,不僅模型參數(shù)未知,而且有關主元分布的參數(shù),包括自由度、均值和方差均未知,故引入最大期望(EM)算法進行參數(shù)估計。更進一步,基于RPPLS模型,通過構建GT2和GSPE兩個監(jiān)控指標,將RPPLS引入到過程監(jiān)控,通過監(jiān)控過程的受控狀態(tài)以及模型關系的變化,判斷過程正常運行程度或故障。最后將PPLS和RPPLS分別應用在TE過程監(jiān)控,對檢測故障的準確性和降低故障的漏報率進行對比。
PPLS是一種高斯隱變量模型[14-15],假設經(jīng)過歸一化后數(shù)據(jù)的過程變量和輸出變量分別為:。其中Dx、Dy分別為過程變量和輸出變量個數(shù),N為樣本采樣數(shù),則PPLS模型可以表示如下
其中,P∈RDx×K,C∈RDy×K,K 由式(5)和已知條件,用貝葉斯公式求tn的后驗分布 E步 M步 反復迭代E步和M步,直到算法收斂,PPLS模型建立完成,具體步驟參考算法 1。最后考慮到輸入輸出回歸關系,對式(2)取xn的條件期望,將式(6)代入式(2)得到 yn的近似值,計算如下 由式(15)得到xn關于yn的回歸系數(shù)矩陣如下 算法1 基于PPLS模型的EM算法 (1)輸入:X、Y、K。 (2)標準化:X、Y。 σx=1,σy=1,k=0,P=X(:,1:K),P=X(:,1:K)。 (4)計算E步 (5)計算M步 2.1 RPPLS模型 式中,矩陣Σ是正定矩陣,當ν>1,μ為均值向量,當ν>2時,x的協(xié)方差矩陣等于vΣ/(v-2)。Γ(·)表示 Gamma函數(shù),其概率密度函數(shù)定義為:T分布通過調(diào)整自由度ν的大小,可以改變拖尾寬度,當ν∞時,t(ν,μ,Σ)就是N(μ,Σ),所以正態(tài)分布只是T分布的一種特殊形式。 將PPLS模型中的高斯分布全部用T分布代替可以得到RPPLS模型,RPPLS模型可以表示成如下形式 其中,系數(shù)矩陣P、C,均值μx、μy和PPLS模型一樣,而殘差滿足,主元滿足 2.2 極大似然公式推導 直接用T分布計算非常困難,本文引入中間隨機變量un[19],當un服從伽馬分布,則服從T分布的變量x關于un的條件分布x|un服從正態(tài)分布。通過引入un,可以把T分布轉(zhuǎn)化成正態(tài)分布計算,具體轉(zhuǎn)化過程如下 由式(18)、式(19)、式(21)、式(22)可以分別得到xn、yn關于tn、un的條件分布 由式(24)、式(25)可以得到xn、yn關于tn、un的聯(lián)合分布如下 由式(23)、式(24),用貝葉斯公式求tn關于xn、un的后驗分布 由于在RPPLS模型中tn、un是兩個隱含變量,很難直接用貝葉斯公式求解后驗分布,因此本文把p(tn, un| zn;Θ)分成如下兩個部分求解,可以得到p(tn, un| zn;Θ)的期望值[10,20] 2.3 EM算法估計模型參數(shù) 在E步,根據(jù)p(tn, un| zn;Θ)的期望求L(Θ)期望〈L(Θ)〉,然后對〈L(Θ)〉求偏導,求出更新值Θ~。具體求解過程見文獻[10],參數(shù)的迭代公式如下: E步 其中,A=(WWT+Φ)-1, B=(I+WTΦ-1W)-1。M步 其中,帶有波浪號上標的表示更新值,函數(shù)ψ(x)=(dlnΓ (x)/dx)。反復迭代E步和M步,直到收斂,RPPLS模型建立完成,EM算法的具體步驟參考算法2。同樣考慮到輸入輸出回歸關系,對式(19) 取xn、un的條件期望,并將式(27)代入式(19),可以得到y(tǒng)n的近似值,計算如下 由式(40)得到xn關于yn的回歸系數(shù)矩陣如下 算法2 基于RPPLS模型的EM算法 (1)輸入:X、Y、K、v。 (2)標準化:X、Y。 (4)計算E步 (5)計算M步 2.4 魯棒性分析 概率偏最小二乘(PPLS)建立的條件是主元和誤差都服從高斯分布,但是高斯分布的期望和方差容易受到離群點的影響,導致模型的魯棒性較差。本文用T分布來代替正態(tài)分布,在PPLS的基礎上提出一種魯棒RPPLS方法,由于T分布能調(diào)節(jié)參數(shù)自由度的大小從而改變拖尾寬度,使模型對離群點的魯棒性更好。 為了驗證T分布對含離群點數(shù)據(jù)的擬合效果更好,下面給出一個分別用正態(tài)分布和T分布擬合離群點數(shù)據(jù)的仿真例子:首先隨機生成一組滿足μ=0,σ=0的標準正態(tài)分布數(shù)據(jù)X∈R1×100,然后在概率空間右半邊分別添加 1%、3%、5%、7%的離群點,再分別用正態(tài)分布和T分布去擬合添加了離群點的數(shù)據(jù),擬合曲線受離群點影響變化如圖1、圖2所示。 圖1 正態(tài)分布擬合離群點數(shù)據(jù)的效果Fig.1 Fitting chart of outliers by normal distribution 圖2 T分布擬合離群點數(shù)據(jù)的效果Fig.2 Fitting chart of different outliers by T distribution 比較圖1、圖2可得:當用正態(tài)分布去擬合含有離群點數(shù)據(jù)時,隨著離群點的增加,曲線向右移動并且變得矮胖,經(jīng)計算可以得到μ1=0.1884,σ1=1.2029,μ2=0.5332,σ2=2.8396,μ3=0.9983,σ3=4.4623,μ4=1.1813,σ4=4.6438,說明正態(tài)分布只能通過調(diào)整均值和方差才能擬合含離群點數(shù)據(jù),這樣必然導致擬合效果不好;而用T分布去擬合含有離群點數(shù)據(jù)時,T分布可以通過調(diào)整自由度v1=6.0222,v2=2.5099,v3=1.7787,v4=1.5550,使擬合曲線即使在含較多離群點時,依然能夠得到較好的擬合效果,這就表明T分布比正態(tài)分布的魯棒性更好。 3.1 對主元空間的監(jiān)控 主元反映了影響過程變化的主要因素,RPPLS模型根據(jù)對主元的監(jiān)控,來判斷過程的受控狀態(tài),類似于PLS監(jiān)控算法中的T2監(jiān)控指標。參考文獻[21],按照T2定義一個T2的擴展監(jiān)控指標GT2,這里采用 tn后驗的期望值〈tn〉= E(tn|zn,un; Θ)= BWTΦ-1(zn-μ)來代替tn。而由式(23)可得tn服從N(0,IK/un),其中un是隨機變量,這里采用期望值〈un〉代替,由式(20)及伽馬分布的性質(zhì)可得〈un〉=1,故tn近似服從N(0,IK),并用其標準差進行規(guī)范化,則GT2定義如下 3.2 對殘差空間的監(jiān)控 殘差反映了過程變量與模型的擬合程度,本文通過對殘差空間的監(jiān)控,來判斷過程工作情況,類似PLS監(jiān)控算法中的SPE監(jiān)控指標。同樣仿效文獻[21],定義一個基于馬氏距離的SPE的擴展監(jiān)控指標 GSPE[22],這里同樣可以用 en的期望值〈en〉= E(en|zn,un; Θ)=(I-WBWTΦ-1)(zn-μ)代替en,則GSPE可以定義如下 田納西-伊斯曼過程(TEP)是基于真實工業(yè)過程的仿真平臺,因其能對各種監(jiān)控方法有效性進行評價而被廣泛應用。該過程包括過程變量、成分變量和控制變量共52個可測量變量以及21種預設定的故障模式,TE過程的詳細介紹見文獻[23]。本文建立模型的500組正常數(shù)據(jù)是通過每次仿真運行25 h,每間隔3 min對變量采樣一次得到;采用同樣的采樣率,而每次仿真運行48 h,得到960組用于監(jiān)控的故障數(shù)據(jù)。本文以故障 5為例,對 PPLS和RPPLS的監(jiān)控效果進行比較。故障5在采樣時刻160處引入,首先冷凝器冷卻水入口溫度產(chǎn)生一個階躍變化,然后冷凝器冷卻水流量受到影響也產(chǎn)生階躍變化,使冷凝器出口流量增加,進而導致汽液分離器的溫度和分離器冷卻水出口溫度均升高。當故障發(fā)生后,控制回路能做出反應,通過調(diào)節(jié)控制器使分離器中的溫度返回到正常值。當達到新的穩(wěn)定狀態(tài)后,故障檢測指標不能保持,而是要回到正常狀態(tài)。 在建立PPLS和RPPLS模型時,TE過程共有52個測量變量,其中過程測量變量 XMEAS(1)~XMEAS(23)表示A進料(流1)、D進料(流2)、E進料(流3)等過程參數(shù),成分測量變量XMEAS(22)~XMEAS(41)分別表示流6、流9和流11的進料成分,操作測量變量XMV(1)~XMV(11)表示D進料量(流2)、E進料(流3)、A進料(流1)等控制參數(shù)。參考文獻[24],本文選取 XMEAS(1)~XMEAS(36)和XMV(1)~XMV(11)共47個為輸入變量X,而選取流11的成分變量XMEAS(37)~XMEAS(41)共5個為輸出變量 Y。由交叉驗證方法,這里主元個數(shù)都選取為14個。為了驗證RPPLS模型的魯棒性,首先,將500個正常數(shù)據(jù)歸一化,然后在隨機選取3% 共15個正常數(shù)據(jù)樣本點,并使每個變量在該15個樣本點原值的基礎上擴大10倍得到15個離群點。本文根據(jù)“3σ準則”定義離群點:與平均值的偏差超過3倍標準差的測定值稱為離群值。這里僅畫出變量x1的正常數(shù)據(jù)和離群數(shù)據(jù)如圖3所示。 圖3(a)為正常數(shù)據(jù)的分布情況,數(shù)據(jù)規(guī)律分布,上下波動不大;而當加入離群點之后,數(shù)據(jù)如圖3(b)所示,在原數(shù)據(jù)基礎上放大10倍后得到15個數(shù)據(jù)點不僅遠離正常數(shù)據(jù),而且超過3倍的標準差,即得到了15個離群點。對每個變量做同樣處理,得到含離群值數(shù)據(jù)。 然后分別用正常數(shù)據(jù)和含有離群點的數(shù)據(jù)建立PPLS和RPPLS模型。為了便于比較兩種情況下PPLS和RPPLS模型的魯棒性,本文定義回歸系數(shù)矩陣M的均方根誤差(RMSE)表達式如下 式中,M0表示用含離群點建立模型的回歸系數(shù)矩陣;M1表示用正常數(shù)據(jù)建立模型的系數(shù)矩陣;RMSE表示模型的穩(wěn)定程度,RMSE越小,模型的穩(wěn)定性越高,魯棒性越好。 首先分別應用正常數(shù)據(jù)和含離群值數(shù)據(jù)建立PPLS和RPPLS模型,得到正常數(shù)據(jù)和含離群值數(shù)據(jù)模型下的系數(shù)回歸矩陣,最后將回歸矩陣代入式(44),得到表1。 表1 PPLS和RPPLS在3%離群點時回歸系數(shù)矩陣M的RMSETable 1 RMSE of matrix M by PPLS and RPPLS with 3% outliers 由表1可得,RPPLS在離群點為0和3%情況下回歸系數(shù)矩陣M的RMSE遠遠小于PPLS,表明RPPLS在離群點情況下建立的模型和正常數(shù)據(jù)建立的模型偏離程度較小,即離群點對RPPLS影響較??;而PPLS在離群點情況下建立的模型和正常數(shù)據(jù)建立的模型偏離程度較大,即離群點對PPLS影響較大,也就是RPPLS比PPLS魯棒性更好。 圖3 變量x1正常數(shù)據(jù)和含離群點數(shù)據(jù)Fig.3 Data charts for variable x1with normal data and outliers data 然后將含 3%離群點數(shù)據(jù)建立的 PPLS和RPPLS模型應用于TE過程監(jiān)控。將960組故障數(shù)據(jù)歸一化后分別代入式(42)、式(43),得到PPLS和RPPLS模型的監(jiān)控圖分別如圖4、圖5所示。 比較圖4、圖5可得:圖4(a)中GT2值和圖4(b) 中GSPE值分別在采樣時刻175和179超過控制線,而雖然圖5(a)中GT2值也是在175超過控制線,但是圖5(b)中GSPE值在采樣時刻163超過控制線,故障5的故障引入是在采樣時刻160,這就表明RPPLS模型能較及時準確地判斷故障的發(fā)生。圖4(a)的漏報率為0.8177,圖4(b)的漏報率為0.8402,而圖 5(a)的漏報率為 0.7453,圖 5(b)的漏報率為0.7715,由此可得相較于PPLS模型,RPPLS能顯著降低漏報率。從故障持續(xù)時間來看,圖4(a)為146,圖4(b)為128,而圖5(a)為204,圖5(b)為183,RPPLS的故障的持續(xù)時間比PPLS多出大約 50個采樣時間,RPPLS故障持續(xù)時間更長,有利于現(xiàn)場監(jiān)控人員及時找出故障原因,實現(xiàn)故障診斷。 圖4 基于PPLS對故障五的監(jiān)控Fig.4 Monitoring charts for fault 5 based on PPLS 圖5 基于RPPLS對故障五的監(jiān)控Fig.5 Monitoring charts for fault 5 based on RPPLS 表3 TE過程故障描述Table 2 Process fault description in TE process 最后分別用PPLS、RPPCA和RPPLS對TE過程前13種故障模式進行監(jiān)控,故障描述見表2,故障均在采樣時刻160引入,監(jiān)控效果如表3、表4、表 5所示,表中綜合了兩個監(jiān)控指標的檢測時間(DT)、漏報率(MAR)和故障持續(xù)時間(FDT)3個方面。在13種故障中,故障3和9難以檢測且對過程影響較小,PPLS難以檢測出來,而RPPLS雖然漏報率很高,但卻能較準確檢測出來。而對于故障1、2、4、6、7、13,RPPLS比PPLS漏報率更低,但不明顯。對于故障5、8,RPPLS比PPLS的漏報率降低6%,而對于故障10、11、12的漏報率更是降低高達10%以上。同樣比較RPPCA與PPLS模型的監(jiān)控效果,也能得出采用 T分布的 RPPCA比PPLS的檢測效果更好。而對比采用T分布的RPPLS 和T分布的RPPCA,由于都采用T分布,故模型對離群數(shù)據(jù)處理的效果都比較好,但是 RPPLS的GT2指標要優(yōu)于RPPCA。 表3 基于PPLS對TE過程的監(jiān)控結(jié)果Table 3 Monitoring results in TE process based on PPLS 表4 基于RPPCA對TE過程的監(jiān)控結(jié)果Table 4 Monitoring results in TE process based on RPPCA 表5 基于RPPLS對TE過程的監(jiān)控結(jié)果Table 5 Monitoring results in TE process based on RPPLS 考慮離群點對模型的影響,本文在PPLS模型中引入T分布,提出RPPLS模型,能夠較好地克服離群點對模型的影響,提高了模型的魯棒性。通過PPLS和RPPLS在TE過程中的監(jiān)控應用表明,采用EM算法能夠較準確地估計模型的未知參數(shù)(主元和誤差的均值、方差和自由度)。本文提出GT2和GSPE兩個監(jiān)控指標,能夠準確及時地反映出監(jiān)控過程的受控狀態(tài)以及模型關系的變化。 References [1] KANO M, NAKAGAWA Y. Data-based process monitoring process control and quality improvement: recent developments and applications in steel industry[J]. Computers & Chemical Engineering, 2008, 32(1/2): 12-24. DOI: 10.1016/j.compchemeng.2007.07.005. [2] 李秀喜, 袁延江. 基于流程模擬的化工故障檢測技術[J].化工學報, 2014, 65(11): 4472-4476.DOI: 10.3969/j.issn.0438-1157.2014.11036. LI X X, YUAN Y J. Chemical process fault detection technology based on process simulation[J].CIESC Journal, 2014, 65(11): 4472-4476.DOI: 10.3969/j.issn.0438-1157.2014.11.036. [3] SIMOGLOU A, MARTIN E B, MORRIS A J. Multivariate statistical process control of an industrial process fluidised-bed reactor[J]. Control Engineering Practice, 2000, 8(8): 893-909. DOI: 10.1016/S0967-0661(00)00015-0. [4] 王海清, 宋執(zhí)環(huán), 王慧. PCA過程監(jiān)測方法的故障檢測行為分析[J].化 工 學 報 , 2002, 53(3): 297-301.DOI: 10.3321/j.issn: 0438-1157.2002.03.016. WANG H Q, SONG Z H, WANG H. Fault detection behavior analysis of PCA based process monimring approach[J]. Journal of Chemical Industry and Engineering(China), 2002, 53(3): 297-301.DOI: 10.3321/j.issn: 0438-1157. 2002.03.016. [5] WOLD S, SJ?STR?MA M, ERIKSSONB L. PLS-regression: a basic tool of chemometrics[J]. Chemometrics and Intelligent Laboratory Systems, 2001, 58(2): 109-130. DOI: 10.1016/S0169-7439(01)00155-1. [6] MEHMOOD T, LILAND K H, SNIPEN L, et al. A review of variable selection methods in partial least squares regression[J]. Chemometrics and Intelligent Laboratory Systems, 2012, 118: 62-69. DOI: 10.1016/j.chemolab.2012.07.010. [7] LI S, GAO J, NYAGILO J O, et al. Probabilistic partial least square regression: a robust model for quantitative analysis of Raman spectroscopy data[C]// IEEE International Conference on Bioinformatics and Biomedicine. Atlanta: IEEE, 2011: 526-530. [8] LANGE K L, LITTLE R J A, TAYLOR J M G. Robust statistical modeling using the t distribution[J]. Journal of the American Statistical Association, 1989, 84(408): 881-896. DOI: 10.1080/01621459.1989.10478852. [9] SHOHAM S. Robust clustering by deterministic agglomeration EM of mixtures of multivariate t-distributions[J]. Pattern Recognition Society, 2002, 35(5): 1127-1142. DOI: 10.1016/S0031-3203(01)00080-2. [10] ARCHAMBEAU C, DELANNAY N, VERLEYSEN M. Robust probabilistic projections[C]//Proceedings of 23rd International Conference on Machine Learning. New York: ACM, 2006: 33-40. [11] ARCHAMBEAU C, DELANNAY N, VERLEYSEN M. Mixtures of robust probabilistic principal component analyzers[J]. Neurocomputing, 2008, 71(7/8/9): 1274-1282. DOI: 10.1016/j. neucom.2007.11.029. [12] CHEN T, MARTIN E, MONTAGUE G. Robust probabilistic PCA with missing data and contribution analysis for outlier detection[J]. Computational Statistics and Data Analysis, 2009, 53(10): 3706-3716. DOI: 10.1016/j.csda.2009.03.014. [13] ZHU J L, GE Z Q, SONG Z H. Robust modeling of mixture probabilistic principal component analysis and process monitoring application[J]. AIChE Journal, 2014, 60(6): 2143-2157. DOI: 10.1002/aic.14419. [14] SILVA R, SCHEINES R, GLYMOURl C, et al. Learning the structure of linear latent variable models[J]. Machine Learning Research, 2006, 7(2): 191-246. [15] KOURTI T. Application of latent variable methods to process control and multivariate statistical process control in industry[J]. International Journal of Adaptive Control and Signal Processing, 2005, 19(4): 213-246. DOI: 10.1002/acs.859. [16] STOICA P, XU L Z, LI J. A new type of parameter estimation algorithm for missing data problems[J]. Statistics & Probability Letters, 2005, 75(3): 219-229. DOI: 10.1016/j.spl.2005.05.018. [17] WU C F. On the convergence properties of the EM algorithm[J]. The Annals of Statistics, 1983, 11(1): 95-103. [18] MURPHY K P. Machine Learning: A Probabilistic Perspective[M]. London: MIT Press, 2012: 46-49. [19] LIU C H, RUBIN D B. ML estimation of the t distribution using EM and its extensions, ECM and ECME[J]. Statistica Sinica, 1995, 5(1): 19-39. [20] BISHOP C M. Pattern Recognition and Machine Learning[M]. New York : Springer Press, 2006: 91-93. [21] KIM D, LEE I B. Process monitoring based on probabilistic PCA[J]. Chemometrics and Intelligent Laboratory Systems, 2003, 67(2): 109-123. DOI: 10.1016/S0169-7439(03)00063-7. [22] 馬賀賀, 胡益, 侍洪波.基于馬氏距離局部離群因子方法的復雜化工過程故障檢測[J].化工學報, 2013, 64(5): 1675-1682.DOI: 10.3969/j.issn.0438-1157.2013.05.02. MA H H, HU Y, SHI H B. Fault detection of complex chemical processes using Mahalanobis distance-based local outlier factor[J].CIESC Journal, 2013, 64(5): 1675-1682. DOI: 10.3969/j.issn. 0438-1157.2013.05.02. [23] CHIANG L H, RUSSELL E L, BRAATZ R D. Fault Detection and Diagnosis in Industrial Systems[M]. London: Springer London, 2001: 99-106. [24] QIN S J, ZHENG Y Y. Quality-relevant and process-relevant fault monitoring with concurrent projection to latent structures[J]. AIChE Journal, 2013, 59(2): 496-504.DOI: 10.1002/aic.13959. 2015-09-11收到初稿,2016-04-29收到修改稿。 聯(lián)系人:趙忠蓋。第一作者:陳家益(1990—),男,碩士研究生。 Received date: 2015-09-11. 中圖分類號:TP 277 文獻標志碼:A 文章編號:0438—1157(2016)07—2907—09 DOI:10.11949/j.issn.0438-1157.20151439 基金項目:國家自然科學基金項目(61573169);江蘇省六大人才高峰項目(2014-ZBZZ-010)。 Corresponding author:ZHAO Zhonggai,gaizihao@ jiangnan.edu.cn supported by the National Natural Science Foundation of China (61573169) and the Six Talent Peaks Project of Jiangsu Province (2014-ZBZZ-010). Robust PPLS model and its applications in process monitoring CHEN Jiayi, ZHAO Zhonggai, LIU Fei Abstract:A probability model can be developed by probabilistic partial least squares (PPLS) under the conditions that both principal components and errors satisfy Gaussian distribution. However, the expectation and variance of the Gaussian distribution is susceptible to outliers. As a result, the model is not robust for the real industrial process. This paper improves the robustness of the PPLS model based on the assumption that the raw data satisfy T distribution rather than Gaussian distribution. By adjusting the freedom degree of T distribution, the proposed robust probabilistic partial least squares (RPPLS) model can overcome the shortcomings of PPLS model. Furthermore, on the basis of RPPLS model, two monitoring indicators GT2and GSPE are proposed to monitor the process state and the model changes, respectively. Comparing the monitoring performance in the TE process based on PPLS and RPPLS shows that RPPLS is more effective than PPLS in terms of the fault accuracy and the missing alarm rate. Key words:robust probabilistic partial least squares algorithm;T distribution;parameter estimation;monitoring indices;model2 RPPLS 模型
3 基于RPPLS模型的監(jiān)控
4 仿真實例
5 結(jié) 論
(Key Laboratory of Advanced Process Control for Light Industry (Ministry of Education), Institute of Automation, Jiangnan University, Wuxi 214122, Jiangsu, China)