胡永兵高學金李亞芬齊詠生5,王普
(1北京工業(yè)大學電子信息與控制工程學院,北京 100124;2數(shù)字社區(qū)教育部工程研究中心,北京 100124;3城市軌道交通北京實驗室,北京 100124;4計算智能與智能系統(tǒng)北京市重點實驗室,北京 100124;5內(nèi)蒙古工業(yè)大學電力學院,內(nèi)蒙古 呼和浩特 010051)
?
基于仿射傳播聚類子集主元分析的間歇過程監(jiān)測方法
胡永兵1,2,3,4,高學金1,2,3,4,李亞芬1,2,3,4,齊詠生5,王普1,2,3,4
(1北京工業(yè)大學電子信息與控制工程學院,北京 100124;2數(shù)字社區(qū)教育部工程研究中心,北京 100124;3城市軌道交通北京實驗室,北京 100124;4計算智能與智能系統(tǒng)北京市重點實驗室,北京 100124;5內(nèi)蒙古工業(yè)大學電力學院,內(nèi)蒙古 呼和浩特 010051)
針對間歇過程固有的多階段特性,也為了克服傳統(tǒng)階段劃分方法嚴格按照物理時刻順序?qū)⒉蓸狱c硬性分割而不能使其尋找數(shù)據(jù)特征最為相近的聚類中心的嚴重缺陷,提出基于仿射傳播聚類(AP)的子集多向主元分析(subset-MPCA)監(jiān)測新方法:采用全新的亂序聚類思想,將時間片矩陣打亂用AP進行無約束亂序聚類,使樣本突破時間順序的約束自由找尋與其特征最為相近的聚類中心,獲得聚類子集,建立精確的子集MPCA監(jiān)控模型。在線監(jiān)控時,引入信息度傳遞實現(xiàn)實時采樣點的階段歸屬判斷,解決階段不等長批次的最佳模型選擇問題。對青霉素仿真數(shù)據(jù)的實驗表明,該方法較傳統(tǒng)方法可有效降低故障的漏報和誤報,有著更加可靠的監(jiān)控性能。
間歇過程;子集聚類;過程監(jiān)測;階段歸屬;子集多向主元分析
DOI:10.11949/j.issn.0438-1157.20151454
間歇式生產(chǎn)是精細化工、生物制藥和食品生產(chǎn)行業(yè)中的主要生產(chǎn)方式[1],其將有限量的物料,按規(guī)定的加工順序在設(shè)備中加工,以獲得有限量的產(chǎn)品。間歇過程較連續(xù)過程有著明顯的區(qū)別,其中多階段特性是其區(qū)別于連續(xù)過程的明顯特征之一[2]。由于間歇過程復(fù)雜的機理特性,要實現(xiàn)生產(chǎn)過程的安全穩(wěn)定運行依然存在著諸多挑戰(zhàn)[3-5]。目前常用于間歇過程故障監(jiān)測的方法有多向主成分分析(multiway principal component analysis,MPCA)[6-7]、多向獨立成分分析(multiway independent component analysis,MICA)[8-9]以及多向偏最小二乘(multiway partial least squares,MPLS)[10-11]。
由于多階段特性的存在,使得間歇過程在不同的階段內(nèi)都有著各自不同的主導變量和階段特性[12],如采用傳統(tǒng)單一建模方式實現(xiàn)整個批次過程的監(jiān)控,那么勢必會造成模型在不同階段內(nèi)的精度損失,從而導致出現(xiàn)大量的故障誤報和漏報。針對間歇過程監(jiān)測所面臨的多階段特征問題,國內(nèi)外學者已經(jīng)做出了諸多突破性的研究。Wold等[13]將三維數(shù)據(jù)展開后分割得到多個子塊,并基于子塊建模提出了分層多模塊PCA方法。Lu等[14]于2004年提出了基于K-means的間歇過程子階段劃分方法,將采樣點數(shù)據(jù)沿時間順序歸類并建立監(jiān)控模型。Zhao等[15]和齊詠生等[12]分別在2007年和2011年在過程批次實現(xiàn)穩(wěn)定時段劃分的基礎(chǔ)上,提出了改進的階段劃分方法,進一步將生產(chǎn)過程劃分為穩(wěn)定階段和過渡階段,考慮了各個穩(wěn)定階段之間進行切換時的瞬態(tài)特性。以上方法均考慮了批次過程的階段特性,并在子階段內(nèi)建立過程的監(jiān)控模型,提高了監(jiān)控性能。但是,以上方法的階段劃分方式是在時間軸上確立若干個孤立分割點,在此基礎(chǔ)上將整個生產(chǎn)過程截取為幾個階段。這樣做的缺陷是劃分過程需首先保證采樣點在時間軸上的連續(xù)性,而并不能使得各個采樣點尋找到數(shù)據(jù)特征或相關(guān)性最為相近的聚類中心,進而導致建模時精度的損失,造成監(jiān)控性能的下降。此外,以上方法均是嚴格按照采樣時刻順序硬性將采樣點劃分到某一類中,這就默認接受了在線實時采樣點與離線階段劃分對應(yīng)時刻數(shù)據(jù)屬于同一階段的假設(shè),從而認為批次內(nèi)階段是等長的。但實際生產(chǎn)過程并非如此,不同批次的生產(chǎn)由于條件的不同,導致不同批次間的階段長度會有所差異。所以,離線階段劃分和不同階段模型建立之后,基于時刻對應(yīng)關(guān)系決定新時刻采樣點的階段所屬存在極大的弊端,這也是當下亟待解決的重要問題。針對這一問題的解決,基于聯(lián)合統(tǒng)計量的相似度判斷指標、方差計算、后驗概率和距離相似度的方法得以應(yīng)用,但最大的問題是這些方法與階段劃分時采用了不同的標準,不能保證所選監(jiān)控模型的殘差最小化。
綜上,為避免采樣點物理時刻連續(xù)性對采樣點找尋數(shù)據(jù)特征最為相近聚類中心的束縛,本文提出一種全新的亂序聚類思想,即基于仿射傳播聚類(affinity propagation clustering,AP)的子集聚類方法。該方法基本思路是:首先,將原始批次數(shù)據(jù)按采樣時刻切片,然后將時間片數(shù)據(jù)隨機排序后采用AP聚類算法進行亂序聚類,以此得到時間片數(shù)據(jù)的幾個子集而不是子階段;然后,對各子集數(shù)據(jù)建立子集subset-MPCA監(jiān)控模型。在線監(jiān)控時,為解決批次內(nèi)階段不等長現(xiàn)實下采樣點如何選擇最佳監(jiān)控模型的問題,提出通過吸收度與歸屬度的信息傳遞判斷實時采樣點的階段歸屬,以此選擇最適合的監(jiān)控模型實現(xiàn)過程的在線監(jiān)控。
1.1AP聚類算法
,任意成對樣本點xi和xk間的相似度(,)sik定義如下
AP的聚類過程需要傳遞兩種不同類型的信息:吸收度(,)rik與歸屬度(,)aik。(,)rik表示從點i發(fā)送到候選聚類中心k的數(shù)值消息,反映k點是否適合作為i點的聚類中心。(,)aik則表示從候選聚類中心k發(fā)送到i的數(shù)值消息,反映i點是否選擇k作為其聚類中心。(,)rik與(,)aik越強,則k點作為聚類中心的可能性就越大,并且i點隸屬于以k點為聚類中心的聚類的可能性也越大。AP聚類算法通過不斷迭代更新每一個樣本點的吸引度和歸屬度值,直到產(chǎn)生C個高質(zhì)量的聚類中心,同時將其他樣本點分配到相應(yīng)的類集中。兩種信息的更新規(guī)則如下
其中,當ik=時,(,)skk定義為偏向參數(shù)()Pk,所有的(,)skk落于相似度矩陣的對角線元上,其表征k點成為聚類中心的可能性大小,聚類數(shù)目受偏向參數(shù)的影響。
最終,AP聚類算法通過信息度與歸屬度的更新迭代,各數(shù)據(jù)點間不斷的進行信息交換,競爭得到具有代表性的聚類中心。迭代過程中,r(i,k)和a(i,k)的更新結(jié)果均為迭代過程中的當前值與上一步迭代結(jié)果的加權(quán)。在第t次迭代過程中,r(i,k)和a(i,k)的加權(quán)更新公式如下為阻尼系數(shù),主要起收斂作用,可以人為調(diào)節(jié)。
1.2子集聚類
傳統(tǒng)階段劃分方法均是在不改變采樣序列時間順序的前提下,對整個生產(chǎn)過程批次進行截取得到子階段,這在很大程度上限制了數(shù)據(jù)點找尋與其具有最大相關(guān)程度數(shù)據(jù)特征的聚類中心,影響最優(yōu)聚類結(jié)果的產(chǎn)生。為消除這一弊端,本文在聚類時創(chuàng)新性地采用了樣本點的隨機序列實現(xiàn)聚類中心的迭代競爭,使得樣本點的迭代競爭過程不受物理時間序列的約束,可以充分進行信息的傳遞過程,自由選擇數(shù)據(jù)特征最為相近的類集。
圖1所示為本文提出的基于AP的亂序子集聚類算法的流程示意圖。具體步驟如下:
(1)將訓練批次數(shù)據(jù)X沿時間軸方向切片,得到K個時間片矩陣;
(2)采用隨機算法對K個時間片矩陣進行隨機排序,打亂原有的采樣時刻順序,得到由所有時間片矩陣組成的亂序樣本集;
其中,
圖1 基于AP的亂序子集聚類Fig.1 Random order clustering based on AP
(3)按照式(1)計算亂序樣本集中各時間片樣本點之間的相似度(,)sik,由此組成相似度矩陣S;
(4)將相似度矩陣S輸入AP聚類算法,實現(xiàn)亂序樣本集中隨機采樣點序列的聚類,得到亂序樣本集的C個聚類子集,同時輸出各子集的聚類中心exemplar,
2.1吸收度與歸屬度
吸收度(responsibility)與歸屬度(availability)是AP聚類算法中最為核心的信息,數(shù)據(jù)點間的信息傳遞關(guān)系如圖2所示。
對于任意兩個樣本點ix和kx而言,吸收度(,)rik和歸屬度(,)aik分別表征kx適合作為ix聚類中心的程度及ix選擇kx作為其聚類中心的適合程度,信息傳遞過程如圖3所示。
圖2 信息傳遞關(guān)系Fig.2 Relationship of information transmission
圖3 信息傳遞過程Fig.3 Process of information transmission
2.2階段歸屬判斷
基于吸收度與歸屬度的信息傳遞過程以及所表征的物理意義,本文將其引入用以實現(xiàn)采樣點的階段歸屬判斷,進而選擇最佳模型用于在線監(jiān)控。該階段歸屬判斷方法與子集聚類時所傳遞的信息指標一致,因此可以最大程度上將樣本點劃分到數(shù)據(jù)特征最為相近的階段,保證所選擇模型的誤差最小化。同時,該方法避免了傳統(tǒng)方法中按照在線時刻與離線時刻對應(yīng)位置去選擇階段,進而選擇監(jiān)控模型的盲目性。
基于信息度傳遞的階段歸屬判斷流程示意圖如圖4所示,主要步驟如下。
圖4 階段歸屬判斷流程示意圖Fig.4 Flow chart of judgement for stage attribution
(2)在線監(jiān)控時,隨著生產(chǎn)過程的持續(xù),實時采集當前時刻新的過程數(shù)據(jù)
(3)按式(2)計算在線實時采樣點new,jtx與離線所獲得的各子集聚類中心exemplari之間所傳遞的信息值,即吸收度值及歸屬度值。然后依據(jù)式(3)中吸收度與歸屬度的信息傳遞過程,在當前時刻在線采樣點與各子集聚類中心間進行信息的競爭傳遞,傳遞次數(shù)為N(可人為設(shè)定)。
圖5所示為基于仿射傳播聚類的子集多向主元分析監(jiān)測方法的整體框圖。亂序子集聚類和基于信息度傳遞的階段歸屬判斷分別在第1、2節(jié)論述。在完成亂序聚類得到C個原始數(shù)據(jù)的子集之后,要針對各個子集建立不同的MPCA模型,獲取不同的均值、方差和控制限,用于后續(xù)的過程在線監(jiān)控。
3.1三維數(shù)據(jù)預(yù)處理
3.2子集subset-MPCA離線建模
子集聚類將具有高度相似數(shù)據(jù)特征的樣本點放入同一子集,且聚類過程不再受到時間序列連續(xù)性的限制。在完成子集聚類劃分之后,針對各子集圖6三步展開策略
圖5 基于仿射傳播聚類的子集多向主元分析監(jiān)測方法Fig.5 Subset multiway principal component analysis monitoring method based on affinity propagation clustering
Fig.6Three step unfolding strategy
中的數(shù)據(jù)樣本建立子集subset-MPCA模型。
(1)將各個子集中的所有時間片矩陣進行重新排列,得到三維矩陣,然后采用3.1節(jié)中的三步展開策略對其進行預(yù)處理,最終得到二維矩陣。其中,c表示第c個子集,ck表示第c個子集中包含的采樣時刻數(shù)目。
其中,T為得分矩陣,P為負載矩陣,e為模型殘差矩陣。
(3)分別基于T2和SPE統(tǒng)計量所遵循的統(tǒng)計概率分布求取監(jiān)控統(tǒng)計量的置信控制限[12]。
3.3子集subset-MPCA在線監(jiān)測
(2)按照第3節(jié)所述基于信息度傳遞的階段歸屬判斷過程,依據(jù)當前k時刻采樣值與各子集聚類中心exemplari間的信息傳遞值決定其所屬子集,并據(jù)此選擇監(jiān)控模型。
(3)根據(jù)當前選擇的監(jiān)控模型參數(shù),計算該時刻采樣值的T2和SPE統(tǒng)計量,計算公式[20-21]
如下
其中,new,kt為new,kx的得分向量,對角陣1c-S為對應(yīng)子集中得分矩陣T的協(xié)方差矩陣的逆陣,N為對應(yīng)子集中的樣本點數(shù)目,α為置信度,km和kv分別是對應(yīng)子集建模過程中所求SPE的估計均值和方差。
(4)將所求得的T2和SPE統(tǒng)計量輸入到統(tǒng)計量監(jiān)控圖中,比較統(tǒng)計量與控制限的大小,如果統(tǒng)計量的值超出了控制限,則說明生產(chǎn)過程出現(xiàn)了異常,反之,則生產(chǎn)過程正常。
青霉素(penicillin,或音譯盤尼西林)是一種常見的臨床抗菌藥品,其生產(chǎn)制備過程具有典型的多階段、階段不等長等特性。本文基于美國Illinois州立理工學院Cinar教授研究開發(fā)的具有廣泛國際影響力的Pensim仿真平臺[18]對間歇過程進行在線監(jiān)測仿真研究。青霉素發(fā)酵過程的生產(chǎn)批次持續(xù)時間為400 h,采樣間隔為1 h。在線監(jiān)控時,選取10個主要的過程變量用于監(jiān)控過程的運行狀況,選取的過程變量如表1所示。
表1 R主要過程變量Table 1 Main process variables
發(fā)酵仿真在相近的初始條件下共產(chǎn)生40批次正常的過程數(shù)據(jù)用于子集的劃分和子集subset-PCA訓練建模,同時用作與subset-PCA作對比的傳統(tǒng)MPCA和子階段MPCA的訓練樣本,表示為三維矩陣。為了保證仿真環(huán)境與實際生產(chǎn)現(xiàn)場環(huán)境的一致性,對訓練樣本集加入了一定的白噪聲干擾。
為了驗證本文方法用于過程監(jiān)控的有效性,文中分別選取了正常批次樣本和故障批次樣本進行對比分析驗證。為進一步表明本文方法的優(yōu)越性,本文還將所提方法的監(jiān)控效果與傳統(tǒng)方法進行了對比分析,用于對比分析的方法選用了具有典型代表性的傳統(tǒng)不進行階段劃分對整批次數(shù)據(jù)建立一個統(tǒng)一MPCA模型的方法和基于ISODATA聚類算法劃分階段后建立子階段MPCA方法。其中,基于ISODATA劃分得到的子階段是嚴格依照時間序列順序劃分的,其將整個生產(chǎn)過程劃分為3個階段。
圖7、圖8所示分別為傳統(tǒng)MPCA方法、基于ISODATA聚類算法的子階段MPCA方法對正常生產(chǎn)批次的監(jiān)控結(jié)果。從圖7可以看出傳統(tǒng)MPCA在監(jiān)控過程中存在非常普遍的誤報警現(xiàn)象,而圖8中的基于ISODATA聚類算法的子階段MPCA較其相比有了明顯改善,漏報警率有了明顯的下降。但是由于基于ISODATA聚類算法的子階段MPCA方法中的階段劃分是嚴格沿時刻順序?qū)Σ蓸訒r刻截取進行的,因此時刻的連續(xù)性在一定程度上限制了各采樣點找尋與其數(shù)據(jù)相關(guān)關(guān)系特征最為相近的類集,從而導致建立的監(jiān)控模型存在一定的誤差,最終使得部分采樣點產(chǎn)生誤報。
圖7 傳統(tǒng)MPCA對正常批次的監(jiān)控結(jié)果Fig.7 Traditional MPCA monitoring result for normal batch
圖9所示為本文提出的子集subset-MPCA方法對正常批次的監(jiān)控結(jié)果示意圖。試驗中,AP聚類的偏向參數(shù)設(shè)置為相似度矩陣S的中值,最大迭代次數(shù)為1000,迭代阻尼系數(shù)0.9λ=,最終將過程劃分為17個子集。階段歸屬判斷信息傳遞次數(shù)100N=。從圖中可以看到,本文方法的誤報警率較上述兩種方法都有顯著的降低,對此將3種方法用于正常批次監(jiān)控的誤報警率統(tǒng)計如表2所示。
圖8 基于ISODATA聚類算法的子階段MPCA對正常批次的監(jiān)控結(jié)果Fig.8 Sub-stage MPCA monitoring result for normal batch based on ISODATA
表2 R3種方法對正常批次的監(jiān)控誤報警率對比Table 2 Comparison for false alarm rate of normal batch
圖10、圖11分別是傳統(tǒng)MPCA方法、基于ISODATA聚類算法的子階段MPCA方法對故障生產(chǎn)批次的監(jiān)控結(jié)果。故障批次是由底物流加速率在200時刻引入1%的斜坡故障產(chǎn)生,延續(xù)至反應(yīng)結(jié)束。從圖中可以看出,傳統(tǒng)MPCA依然存在大量的誤警率,且其對故障不敏感,對故障的檢測存在一定的延遲。而基于ISODATA聚類算法的子階段MPCA在降低誤警率的同時,其T2統(tǒng)計量在故障檢測的實時性上得到了一定的提高,但是其SPE統(tǒng)計量對故障的檢測依然存在較大的滯后性。
圖9 subset-MPCA對正常批次的監(jiān)控結(jié)果Fig.9 Subset-MPCA monitoring result for normal batch
圖12所示為本文subset-MPCA方法對故障批次的監(jiān)控結(jié)果。本文中,subset-MPCA方法由于在聚類過程中不受時間序列的約束,可以保證最終獲得的子集中,各采樣點間的數(shù)據(jù)相關(guān)關(guān)系特征是極其相近的,因此所建立的子集subset-MPCA模型誤差足夠小,得到的監(jiān)控效果最為理想。在線監(jiān)控時,獲得的實時采樣點并不是按照時刻的對應(yīng)關(guān)系進行監(jiān)控模型的選擇,而是充分考慮樣本點間吸收度和歸屬度的聚類信息,通過信息的傳遞合理地選擇最優(yōu)監(jiān)控模型,這進一步減小了模型誤差。從監(jiān)控結(jié)果中,可以看出T2統(tǒng)計量已完全消除了誤報警的出現(xiàn),而且T2的故障漏報率較傳統(tǒng)MPCA有了明顯提高。與此同時,SPE統(tǒng)計量的誤報警率和漏報警率也都優(yōu)于前述兩種方法。3種方法用于故障批次監(jiān)測時,T2統(tǒng)計量和SPE統(tǒng)計量誤報警率和漏報警率的對比分析結(jié)果如表3所示。
圖10 傳統(tǒng)MPCA對故障批次的監(jiān)控結(jié)果Fig.10 Traditional MPCA monitoring result for false batch
圖11 基于ISODATA聚類算法的子階段MPCA對故障批次的監(jiān)控結(jié)果Fig.11 Sub-stage MPCA monitoring result for false batch based on ISODATA
圖12 subset-MPCA對故障批次的監(jiān)控結(jié)果Fig.12 Subset-MPCA monitoring result for false batch
傳統(tǒng)的聚類方法均是嚴格按照物理時序進行階段的劃分,通過在時間軸上找到適度的分割點截取得到子階段,由于樣本點在找尋與其數(shù)據(jù)特征最為相近的類集時受到時序的約束,這在很大程度上限制了其找尋最佳的歸屬類集。為了解決這一嚴重弊端,本文提出了基于AP的subset-MPCA方法。該方法完全不考慮采樣時序,通過構(gòu)造亂序樣本集實現(xiàn)無約束的亂序子集聚類,然后針對不同子集建立相互獨立的子集MPCA模型,子集內(nèi)數(shù)據(jù)相關(guān)特性相近,保證了較小的模型誤差。在線監(jiān)控時,充分考慮聚類過程中的吸收度和歸屬度信息,通過信息的傳遞決定實時采樣點的子集所屬,以此選擇最為合理的監(jiān)控模型,避免了依賴時刻對應(yīng)關(guān)系進行監(jiān)控模型選擇的弊端,且一定程度上解決了階段不等長及批次不等長在線監(jiān)控的現(xiàn)實問題,進一步保證了模型誤差最小化。最后,該方法在青霉素發(fā)酵過程中的仿真應(yīng)用,表明了其具有良好的監(jiān)控性能。
表3 R3種方法對故障批次的監(jiān)控結(jié)果對比/%Table 3 Comparison for monitoring results of false batch
References
[1]賈潤達, 毛志忠, 王福利. 基于KPLS模型的間歇過程產(chǎn)品質(zhì)量控制 [J]. 化工學報, 2013, 64 (4): 1332-1339. DOI: 10.3969/j.issn.0438-1157.2013. 04. 029. JIA R D, MAO Z Z, WANG F L. KPLS model based product quality control for batch processes [J]. CIESC Journal, 2013, 64 (4):1332-1339. DOI: 10.3969/j.issn.0438-1157.2013.04.029.
[2]QIN S J. Survey on data-driven industrial process monitoring and diagnosis [J]. Annual Reviews in Control, 2012, 36 (2): 220-234. DOI:10.1016/j.arcontrol.2012.09.004.
[3]張子羿, 胡益, 侍洪波. 一種基于聚類方法的多階段間歇過程監(jiān)控方法 [J]. 化工學報, 2013, 64 (12): 4522-4528. DOI:10.3969/j.issn. 0438-1157.2013.12.038. ZHANG Z Y, HU Y, SHI H B. Multi-stage batch process monitoring based on a clustering method [J]. CIESC Journal, 2013, 64 (12):4522-4528. DOI: 10.3969/j.issn.0438-1157.2013.12.038.
[4]QIN S J. Process data analytics in the era of big data [J]. AIChE Journal, 2014, 60 (9): 3092-3100. DOI: 10.1002/aic.14523.
[5]GE Z Q, SONG Z H, GAO F R. Review of recent research on data-based process monitoring [J]. Industrial and Engineering Chemistry Research, 2013, 52 (10): 3543-3562. DOI: 10.1021/ie302069q
[6]NOMIKOS P, MACGREGOR J F. Monitoring batch processes using multiway principal component analysis [J]. AIChE Journal, 1994, 40(8): 1361-1375.
[7]常玉清, 王姝, 譚帥, 等. 基于多時段MPCA模型的間歇過程監(jiān)測方法研究 [J]. 自動化學報, 2010, 36 (9): 1312-1320. DOI:10.3724/SP.J.1004. 2010. 01312. CHANG Y Q, WANG S, TAN S, et al. Research on multistage-based MPCA modeling and monitoring method for batch processes [J]. Acta Automatica Sinica, 2010, 36 (9): 1312-1320. DOI: 10.3724/SP.J.1004. 2010.01312.
[8]GUO H, LI H G. On-line batch process monitoring with improved multi-way independent component analysis [J]. Chinese Journal of Chemical Engineering, 2013, 21 (3): 263-270. DOI: 10.1016/S1004-9541(13)60485-4.
[9]CAI L F, TIAN X M, CHEN S. A process monitoring method based on noisy independent component analysis [J]. Neurocomputing, 2014,127: 231-246. DOI: 10.1016/j.neucom.2013.07.029.
[10]NOMIKOS P, MACGREGOR J F. Multiway partial least squares in monitoring batch progresses [J]. Chemometrics and Intelligent Laboratory Systems, 1995, 30 (1): 97-108.
[11]GE Z Q, SONG Z H, ZHAO L P, et al. Two-level PLS model for quality prediction of multiphase batch processes [J]. Chemometrics and Intelligent Laboratory Systems, 2014, 130: 29-36. DOI:10.1016/j.chemolab. 2013. 09. 008.
[12]齊詠生, 王普, 高學金, 等. 一種新的多階段間歇過程在線監(jiān)控策略 [J]. 儀器儀表學報, 2011, 32 (6): 1290-1297. QI Y S, WANG P, GAO X J, et al. Novel online monitoring strategy for multiphase batch processes [J]. Chinese Journal of Scientific Instrument, 2011, 32 (6): 1290-1297.
[13]WOLD S, KETTANEH N, TJESSEM K. Hierarchical multiblock PLS and PC models for easier model interpretation and as an alternative to variable selection [J]. Journal of Chemometrics, 1996,10 (5/6): 463-482. DOI: 10.1002/(SICI)1099-128X(199609)10:5/6<463:AID-CEM445>3.0.CO.
[14]LU N Y, GAO F R, WANG F L. Sub-PCA modeling and on-line monitoring strategy for batch processes [J]. AIChE Journal, 2004, 50(1): 255-259. DOI: 10.1002/aic.10024.
[15]ZHAO C H, WANG F L, LU N Y, et al. Stage-based soft-transition multiple PCA modeling and on-line monitoring strategy for batch processes [J]. Journal of Process Control, 2007, 17 (9): 728-741. DOI:10. 1016/j.jprocont.2007.02.005.
[16]FREY B J, DUECK D. Clustering by passing messages between data points [J]. Science, 2007, 315 (5814): 972-976.
[17]RANNAR S, MACGREGOR J F, WOLD S. Adaptive batch monitoring using hierarchical PCA [J]. Chemometrics and Intelligent Laboratory Systems, 1998, 41 (1): 73-81. DOI: 10. 1016/S0169-7439(98)00024-0.
[18]BIROL G, üNDEY C, INAR A. A modular simulation package for fed-batch fermentation: penicillin production [J]. Computers & Chemical Engineering, 2002, 26 (11): 1553-1565. DOI:10.1016/S0098-1354(02)00127-8.
[19]常鵬, 王普, 高學金, 等. 基于核熵投影技術(shù)的多階段間歇過程監(jiān)測研究 [J]. 儀器儀表學報, 2014, 35 (7): 1654-1661. CHANG P, WANG P, GAO X J, et al. Research on batch process monitoring based on multi-stage kernel pattern entropy projection technology [J]. Chinese Journal of Scientific Instrument, 2014, 35 (7):1654-1661.
[20]STUBBS S, ZHANG J, MORRIS J. Multiway interval partial least squares for batch process performance monitoring [J]. Industrial & Engineering Chemistry Research, 2013, 52 (35): 12399-12407. DOI:10.1021/ie303562t.
[21]VANLAER J, GINS G, VAN IMPE J F M. Quality assessment of a variance estimator for Partial Least Squares prediction of batch-end quality [J]. Computers & Chemical Engineering, 2013, 52: 230-239. DOI: 10.1016/j.compchemeng.2013.01.012.
Subset multiway principal component analysis monitoring for batch process based on affinity propagation clustering
HU Yongbing1,2,3,4, GAO Xuejin1,2,3,4, LI Yafen1,2,3,4, QI Yongsheng5, WANG Pu1,2,3,4
(1College of Electronic Information and Control Engineering, Beijing University of Technology, Beijing 100124, China;2Engineering Research Center of Digital Community, Ministry of Education, Beijing 100124, China;3Beijing Laboratory for Urban Mass Transit, Beijing 100124, China;4Beijing Key Laboratory of Computational Intelligence and Intelligent System, Beijing 100124,China;5School of Electric Power, Inner Mongolia University of Technology, Huhhot 010051, Inner Mongolia, China)
For the multiphase property inherent in the batch process, and in order to overcome the serious deficiency that the traditional stage partition method divided the sampling points into several categories strictly according to the sampling time sequence and cannot make it look for the clustering center with the most similar data characteristics, a novel subset-MPCA method based on affinity propagation (AP) clustering is proposed. Using a new idea of random order clustering, this method disrupts the order of the time slice and AP is used to cluster with the random order. Thus, each data point can break the restriction of the time sequence and find the clustering center which has the most similar data characteristics with it, obtaining clustering subset and establishing the precise model. For online monitoring, information transmission is introduced to determine the stage attribution of real time sampling points to solve the problem of optimal model selection for unequal length batch. Experiments on penicillin simulation data show that this method can effectively reduce the leaking alarms and nuisance alarms than the traditional method, having more reliable monitoring performance.
date: 2015-09-16.
GAO Xuejin, gaoxuejin@bjut.edu.cn
supported by the National Natural Science Foundation of China (61174109, 61364009).
batch process; subset clustering; process monitoring; stage attribution; subset MPCA
TP 277
A
0438—1157(2016)05—1989—09
2015-09-16收到初稿,2015-12-09收到修改稿。
聯(lián)系人:高學金。第一作者:胡永兵(1989—),男,碩士研究生。
國家自然科學基金項目(61174109,61364009)。