熊偉麗,李妍君
?
選擇性集成LTDGPR模型的自適應(yīng)軟測量建模方法
熊偉麗1,2,李妍君1
(1江南大學(xué)物聯(lián)網(wǎng)工程學(xué)院自動(dòng)化研究所,江蘇無錫214122;2輕工過程先進(jìn)控制教育部重點(diǎn)實(shí)驗(yàn)室,江蘇無錫214122)
隨著時(shí)間的增加,傳統(tǒng)時(shí)間差(TD)模型會(huì)出現(xiàn)性能顯著下降的問題。為了提高TD模型的可靠性和預(yù)測精度,同時(shí)考慮過程的時(shí)滯特征,基于一種選擇性集成策略,提出一種局部時(shí)間差高斯過程回歸(LTDGPR)模型的自適應(yīng)軟測量建模方法。首先,提取出數(shù)據(jù)庫中的時(shí)滯動(dòng)態(tài)信息,對建模數(shù)據(jù)進(jìn)行重構(gòu);然后,采取局部化策略對差分后的重構(gòu)樣本進(jìn)行統(tǒng)計(jì)劃分,得到LTDGPR模型集。對于新來的輸入樣本,選擇部分泛化能力強(qiáng)的LTDGPR模型進(jìn)行集成,估計(jì)出含一定時(shí)間差的主導(dǎo)變量動(dòng)態(tài)偏移值;最后,基于TD模型思想對當(dāng)前時(shí)刻主導(dǎo)變量值進(jìn)行在線預(yù)測。通過脫丁烷塔過程的數(shù)據(jù)建模仿真研究,驗(yàn)證了所提方法的有效性和精度。
選擇性集成;時(shí)間差模型;參數(shù)識(shí)別;動(dòng)態(tài)建模;化學(xué)過程
在化工生產(chǎn)過程中,為了對關(guān)乎質(zhì)量指標(biāo)的變量實(shí)現(xiàn)實(shí)時(shí)有效的控制,可通過軟測量的方式建立易測輔助變量集和難測主導(dǎo)變量之間的預(yù)測模型而進(jìn)行估計(jì)和推斷,來滿足當(dāng)今工業(yè)應(yīng)用中日益增長的產(chǎn)品質(zhì)量控制要求[1-8]。若希望所建立的軟測量模型高效且準(zhǔn)確,需要選擇過程中與難測主導(dǎo)變量最相關(guān)的輔助輸入變量來建立。傳統(tǒng)上對于軟測量模型的建立方式,不論離線或在線,大多數(shù)方法都考慮建模數(shù)據(jù)的零時(shí)滯特性,即建模數(shù)據(jù)按數(shù)據(jù)庫采集時(shí)刻一一對應(yīng)。然而,通過在線儀表獲得的主導(dǎo)變量值通常伴隨著較長的測量周期和分析時(shí)間,如果繼續(xù)采用穩(wěn)態(tài)情況下的建模方法,模型將不能準(zhǔn)確地解釋過程特性[9-12]。因此,有必要對過程時(shí)滯信息進(jìn)行挖掘,對建模數(shù)據(jù)進(jìn)行合理的時(shí)序匹配。同時(shí),隨著分布式控制系統(tǒng)的廣泛應(yīng)用,過程數(shù)據(jù)庫能夠連續(xù)地采集和存儲(chǔ)大量的過程變量信息,若能充分地利用數(shù)據(jù)中的動(dòng)態(tài)信息,對于軟測量模型的建立和后期維護(hù)是非常有利的。
當(dāng)軟測量模型投入在線使用時(shí),由于過程特性的漂移其性能會(huì)隨時(shí)間而顯著下降,建立自適應(yīng)跟蹤過程動(dòng)態(tài)的模型可以延長其使用周期[13-15]。在這種情況下,基于MW策略[16-17]、迭代策略[18-19]和JITL策略[20-21]的方法都有了許多成功的工業(yè)應(yīng)用。但是前兩種方法通常不能有效地處理操作點(diǎn)的突然變化,除非在新的操作條件下采集到足夠多的樣本;另外,基于JITL策略的模型需要不斷地根據(jù)相似性指標(biāo)進(jìn)行即時(shí)學(xué)習(xí),模型重建較為頻繁,不利于方法的在線應(yīng)用。區(qū)別于傳統(tǒng)學(xué)習(xí)輸入變量與輸出變量關(guān)系的建模策略,時(shí)間差(time difference,TD)模型[22-24]通過對輸入輸出數(shù)據(jù)的時(shí)間差分進(jìn)行學(xué)習(xí)從而構(gòu)建模型,能夠很好地處理過程輸入輸出變量的漂移,具有不需要更新模型的優(yōu)點(diǎn)。然而,TD模型的精度通常會(huì)隨著時(shí)間差階次的增加而顯著下降,而且,如果在建模過程中僅建立一個(gè)全局的TD模型,在過程時(shí)變特性和噪聲的影響下,全局的TD模型也可能不再適應(yīng)當(dāng)前工況,出現(xiàn)模型老化的現(xiàn)象,造成精度降低。
近年來,選擇性集成策略有著廣泛運(yùn)用[25-27],這一策略的突出特點(diǎn)是:在離線學(xué)習(xí)時(shí),不需要預(yù)設(shè)局部模型的數(shù)量,隨著對象連續(xù)地運(yùn)行,代表新過程狀態(tài)的模型不需要從頭訓(xùn)練獲得,可以容易地從歷史訓(xùn)練數(shù)據(jù)中提取出來;當(dāng)新測量樣本到來時(shí),可以從離線模型集中選擇部分模型來進(jìn)行集成估計(jì)。目前已有的策略如:選擇性集成局部偏最小二乘模型[28],選擇性集成高斯過程回歸模型[29]等,這些方法在局部模型的建立方面,大多考慮對過程的輸入輸出樣本進(jìn)行訓(xùn)練,并進(jìn)行統(tǒng)計(jì)意義的劃分。然而,對輸入輸出動(dòng)態(tài)漂移信息進(jìn)行學(xué)習(xí)并建立局部模型集的研究尚有空間。
因此,為了提高傳統(tǒng)全局時(shí)間差模型的可靠性和精度,本文中采取了一種選擇性集成局部時(shí)間差高斯過程回歸(local time difference Gaussian process regression,LTDGPR)模型的自適應(yīng)軟測量建模方法。在離線階段,該方法不僅充分考慮了數(shù)據(jù)庫中隱含的變量時(shí)滯信息和動(dòng)態(tài)信息,而且能夠根據(jù)統(tǒng)計(jì)特性變化自適應(yīng)地建立多個(gè)LTDGPR模型來劃分過程操作區(qū)域,描述過程各個(gè)階段的動(dòng)態(tài)特性;當(dāng)新的輸入數(shù)據(jù)到來時(shí),僅需選擇離線LTDGPR模型集中泛化能力較好的部分模型進(jìn)行集成估計(jì),得到當(dāng)前時(shí)刻相對于一定時(shí)刻前的主導(dǎo)變量動(dòng)態(tài)偏移值;最后,基于TD模型思想能夠?qū)Ξ?dāng)前時(shí)刻主導(dǎo)變量值進(jìn)行在線預(yù)測。在仿真部分,通過對脫丁烷塔過程對象的建模研究,驗(yàn)證了所提方法的有效性和精度。
化工過程呈現(xiàn)時(shí)變、非線性以及顯著的時(shí)滯特性,大多現(xiàn)有的軟測量算法僅關(guān)注對前兩種特征進(jìn)行自適應(yīng)建模。然而,過程時(shí)滯特性不容忽視,不考慮時(shí)滯特性會(huì)導(dǎo)致建模數(shù)據(jù)時(shí)序不匹配,模型精度必然會(huì)受到影響。另外,由于化工過程變量不斷時(shí)變,會(huì)出現(xiàn)新的動(dòng)態(tài),為了使得模型預(yù)測能力增強(qiáng),選擇性集成多個(gè)離線模型的策略可以有效提高預(yù)測精度,但是現(xiàn)有文獻(xiàn)中選擇性集成全局自適應(yīng)模型如TD模型的方法并不多見。
本文針對傳統(tǒng)TDGPR模型在新的時(shí)間差動(dòng)態(tài)下性能欠佳的問題,并兼顧過程時(shí)序重匹配,來建立考慮時(shí)滯的自適應(yīng)選擇集成局部時(shí)間差動(dòng)態(tài)的軟測量模型。為實(shí)現(xiàn)局部時(shí)間差動(dòng)態(tài)模型的自適應(yīng)在線選擇集成,需要訓(xùn)練局部TDGPR離線模型庫。模型庫的建立過程主要分為建模數(shù)據(jù)預(yù)處理(主要處理時(shí)滯問題)和時(shí)間差數(shù)據(jù)自適應(yīng)局部化(用于建立局部時(shí)間差動(dòng)態(tài)模型庫)兩個(gè)部分。
1.1 建模數(shù)據(jù)預(yù)處理
對于不考慮時(shí)滯的傳統(tǒng)建模理論[圖1(a)],其假設(shè)時(shí)刻采集的主導(dǎo)變量值()對應(yīng)的輔助變量分別為1(),2(), …,x()(為輔助變量個(gè)數(shù))。然而,這樣的“一一對應(yīng)假設(shè)”并不符合時(shí)滯過程機(jī)理。因此,需要挖掘出如圖1(b) 所示{1(-1),2(-2),…,x(-d);()}指代的“最優(yōu)時(shí)滯輸入輸出樣本對”來替代原始“實(shí)時(shí)建模數(shù)據(jù)對”進(jìn)行軟測量模型的建立,以提高模型預(yù)測精度。
為了使時(shí)序匹配可靠,需要準(zhǔn)確地估計(jì)出上述各變量最優(yōu)時(shí)滯參數(shù)d,=1,2,…,。本文中采用模糊曲線分析的方法將變量時(shí)滯信息引入軟測量模型中。模糊曲線方法(fuzzy curve analysis,F(xiàn)CA)最早由Lin等[30]提出并用于簡化模糊規(guī)則,確定模糊神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu),這種方法的特點(diǎn)是計(jì)算復(fù)雜度較低同時(shí)易于理解,能夠直觀有效地確定輸入變量的重要性程度。本文中時(shí)滯估計(jì)和時(shí)序重匹配算法實(shí)現(xiàn)過程如下。
(1)采集過程輸入輸出樣本集,將過程原始的維“實(shí)時(shí)輸入變量集”以式(1)方式對每個(gè)變量分別擴(kuò)展,并假定各變量存在的最大延遲參數(shù)為max,式中0≤d≤max,d為自然數(shù)。
(2)對于x擴(kuò)展而來的輸入變量集(記為{x(-),=0,1,…,max})和輸出變量,假設(shè)時(shí)刻采集的輸入輸出對應(yīng)關(guān)系為{x(-),()},=max+1,…,},為訓(xùn)練樣本個(gè)數(shù),將x(-)在時(shí)刻的模糊隸屬度函數(shù)定義為
(2)
對每一個(gè)x(-),{,()}提供一條模糊規(guī)則,取變量x(-)值域范圍的20%,=[1,1,…,1]T,為序列(-)的長度。x,表示(-)序列在時(shí)刻的采樣值,(-)為時(shí)延變量序列。在模糊隸屬度函數(shù)中,每個(gè)點(diǎn)對應(yīng)的(x(-),())處有=1。
(3)通過式(3)對擴(kuò)展后的(max+1)個(gè)新變量質(zhì)心去模糊化,可得第個(gè)變量時(shí)延值為條件下的模糊曲線,。如式(4)所示,d為使模糊曲線,覆蓋范圍最大的,,()max和,()min為模糊曲線上點(diǎn)值域的最大值和最小值。
(4)
若,()范圍越接近的范圍,那么輸入變量x(-)的重要性越高,因此對,()覆蓋范圍排序,可以得到各自的重要性?;谠撛恚疚睦肍CA方法提取最優(yōu)時(shí)滯參數(shù)d,并重新匹配輸入樣本時(shí)序,得到時(shí)滯輸入樣本集:X()=[1(-1),2(-2),…,x(-d)]。
由于在實(shí)際工業(yè)過程中通過在線分析儀表得到主導(dǎo)變量值的速度較慢,而輔助變量獲得過程較快,歷史數(shù)據(jù)庫中包含著豐富的主導(dǎo)變量動(dòng)態(tài)信息。因此,本文中考慮將時(shí)刻待測主導(dǎo)變量的歷史測量結(jié)果(-1),(-2)引入軟測量模型的輸入變量集,這樣一來,輸入輸出之間更加相關(guān),過程動(dòng)態(tài)特性也可以被引入模型,可將重構(gòu)時(shí)滯動(dòng)態(tài)信息后的樣本記為[dd,],其中,dd()=[d(),(-1),(-2)]。
上述過程完成了對模型輸入的合理時(shí)滯重組和擴(kuò)展,接著,依照式(5)對[dd,]作時(shí)間差分處理,為差分階次。至此步驟,訓(xùn)練數(shù)據(jù)的預(yù)處理流程結(jié)束,為下一步時(shí)間差模型的訓(xùn)練奠定了基礎(chǔ)。
1.2 時(shí)間差數(shù)據(jù)的自適應(yīng)局部化
建立局部模型前,需要將整個(gè)過程狀態(tài)劃分為符合過程階段特性的局部模型區(qū)域。在局部模型區(qū)域劃分的過程中,本文以滑動(dòng)窗和統(tǒng)計(jì)假設(shè)檢驗(yàn)為工具[28],對差分重組數(shù)據(jù)[Ddd,D]進(jìn)行了訓(xùn)練;同時(shí),采用高斯過程回歸(GPR)建模方法來描述過程的動(dòng)態(tài)信息。GPR算法原理及建模步驟可參考文獻(xiàn)[5,31]。本文改進(jìn)的自適應(yīng)局部化算法示意圖如圖2所示,算法步驟描述如下。
(1)建立具有個(gè)連續(xù)時(shí)間差分樣本的初始滑動(dòng)窗口ini=[Ddd,ini,Dini],基于該窗口構(gòu)建初始LTDGPR模型ini,并計(jì)算殘差ini[式(6)],殘差均值以及殘差標(biāo)準(zhǔn)差ini。設(shè)置初始模型個(gè)數(shù)=1,令{W,f}={ini,ini},sft=W,轉(zhuǎn)入步驟(2)。
(2)獲取{Ddd,D}初始窗口后的一組新時(shí)間差分樣本,將滑動(dòng)窗sft向前移動(dòng)一步,得到新的滑動(dòng)窗sft=[Ddd,Dsft],計(jì)算該窗口上數(shù)據(jù)關(guān)于ini的sft[式(7)],殘差均值以及殘差標(biāo)準(zhǔn)差sft。
(7)
(3)對于給定的顯著性水平t, a,通過,分別計(jì)算統(tǒng)計(jì)量和2統(tǒng)計(jì)量,檢驗(yàn)是否同時(shí)滿足{||<t}=1-t,{2<l}=1- a。若滿足,則認(rèn)為sft與ini差異不顯著,返回步驟(2);否則,將sft向前移動(dòng)一步,開辟新的sft,轉(zhuǎn)入步驟(4)。
(4)在sft上建立一個(gè)新的LTDGPR模型new,計(jì)算新模型殘差向量new[式(8)]及相應(yīng)的,new;同時(shí)計(jì)算[式(9)],, 1≤≤-1。
(9)
(5)對于1≤≤-1,分別建立T和統(tǒng)計(jì)量,。
(6)判斷是否存在,使得{|T|<t}=1-t,{2<l}=1- a同時(shí)成立;若存在,則丟棄冗余模型{new,new};否則,令=+1,將{W,f}={sft,new}加入LTDGPR模型集。
(7)設(shè)置ini=sft,ini=new,,ini=new,返回步驟(2),繼續(xù)確定下一個(gè)局部模型。
假設(shè)對時(shí)間差數(shù)據(jù)的自適應(yīng)局部化階段訓(xùn)練結(jié)束時(shí),數(shù)據(jù)庫中共儲(chǔ)存了(≥1)個(gè)LTDGPR模型。對于新的輸入樣本,為了實(shí)時(shí)估計(jì)其對應(yīng)的主導(dǎo)變量變化情況,基于文獻(xiàn)[28]的算法,本文中提出一種基于選擇性集成策略的LTDGPR模型,對主導(dǎo)變量輸出動(dòng)態(tài)差分值進(jìn)行預(yù)測,算法流程如圖3所示。
對于過程新測量得到的輸入數(shù)據(jù),經(jīng)過離線時(shí)滯動(dòng)態(tài)信息重組并差分后記為Ddd,q,Ddd,k表示Ddd,q的第個(gè)近鄰,1≤≤。對于當(dāng)前差分重組輸入數(shù)據(jù)與其個(gè)近鄰之間的相似性,本文采用=exp(-·d(Ddd,q,Ddd,k))加以描述,其中,d(.,.)為歐氏距離算子。相對于Ddd,q,Ddd,q-1為其上一個(gè)進(jìn)行差分重組的樣本,在式(10)和式(11)中,e,l和e-1,l分別代表Ddd,k和Ddd,q-1對應(yīng)離線模型集中第個(gè)LTDGPR模型的預(yù)測誤差平方
(11)
Dy和Dy-1分別為Ddd,k和Ddd,q-1對應(yīng)的差分輸出真實(shí)值,如式(12)所示,加權(quán)因子=exp(-·d(Ddd,q,Ddd,q-1)),第個(gè)局部模型對于Ddd,q的泛化能力通過()表示,1≤≤。然后,通過式(13)將()進(jìn)行歸一化,可以得到g()。由于()值的大小一定程度上代表了模型泛化能力的強(qiáng)弱,被選擇集成的模型需要滿足某一個(gè)特定指標(biāo),才能夠有效地跟蹤時(shí)間差動(dòng)態(tài)。本文中挑選出離線模型集中所有滿足{|g()≥}的LTDGPR模型來集成估計(jì)Ddd,q對應(yīng)的輸出差分預(yù)測值。
(13)
為了提高傳統(tǒng)時(shí)間差模型的可靠性和精度,提出一種選擇性集成LTDGPR模型的自適應(yīng)軟測量建模方法,具體分為離線和在線兩個(gè)階段,具體實(shí)現(xiàn)步驟如下。
離線階段:
(1)獲取過程數(shù)據(jù)庫輸入輸出樣本集[,],=(1,2,…,x)∈R×m,∈R×1,為采集樣本的個(gè)數(shù),為輸入樣本的維數(shù);
(2)通過1.1節(jié)數(shù)據(jù)預(yù)處理步驟,使用FCA方法引入過程時(shí)滯信息,獲得與()序列最相關(guān)的時(shí)滯輸入序列d(),同時(shí)考慮主導(dǎo)變量動(dòng)態(tài)信息,將訓(xùn)練輸入樣本集進(jìn)行重構(gòu),記為[dd,];
(3)對[dd,]進(jìn)行次差分處理,對差分后的樣本集[Ddd,D]利用1.2節(jié)中的局部化自適應(yīng)策略,直到滑動(dòng)窗滑動(dòng)至[Ddd,D]的最后一個(gè)樣本,此時(shí)訓(xùn)練結(jié)束,離線模型集中共儲(chǔ)存了個(gè)獨(dú)立的LTDGPR模型。
在線階段:
(1)當(dāng)新輸入樣本=(x1,x2,…,x)到來時(shí),利用離線階段獲得的時(shí)滯參數(shù)和動(dòng)態(tài)信息對其進(jìn)行重構(gòu),采用式(4)進(jìn)行時(shí)間差階次為的差分處理;
(2)按照第2節(jié)的方法計(jì)算Ddd,q對應(yīng)于離線局部模型集中各LTDGPR模型的泛化性能指標(biāo)(),=1,2,…,;
(3)通過式(13)將泛化指標(biāo)歸一化,設(shè)定泛化指標(biāo)閾值。對于新獲得的差分重組輸入數(shù)據(jù)Ddd,q,在時(shí)間差分階次為時(shí),為了估計(jì)出其對應(yīng)的輸出差分預(yù)測值,可從離線建立的局部TDGPR模型集中挑選出滿足{g()≥,=1,2,…,}的S個(gè)子模型(分別記為f1,f2,…,f)進(jìn)行選擇性集成,集成方式如式(14)所示
(4)當(dāng)時(shí)間差階次為時(shí),基于時(shí)刻前存在的y-j,對應(yīng)的主導(dǎo)變量最終估計(jì)值計(jì)算方程為
(15)
本文選擇均方根誤差(RMSE)指標(biāo)來評價(jià)模型的綜合預(yù)測能力,式(16)中,y為第個(gè)測試樣本的主導(dǎo)變量真實(shí)值,為測試樣本的個(gè)數(shù)。
脫丁烷塔過程是石油煉制生產(chǎn)過程中脫硫和石腦油分離裝置的重要組成部分,其目標(biāo)為最小化塔底丁烷濃度的同時(shí)使得提純汽油產(chǎn)量最大化,過程工藝的簡要示意圖如圖4所示。該過程包含7個(gè)輔助變量,分別為:1塔頂溫度;2塔頂壓力;3塔頂回流量;4塔頂產(chǎn)品流出量;5第6層塔板溫度;6塔底溫度1;7塔底溫度2;1個(gè)主導(dǎo)變量為塔底丁烷濃度,其值不能直接檢測,需要通過在線儀表分析獲得。過程數(shù)據(jù)來源于對真實(shí)過程的實(shí)時(shí)采樣,以6 min作為采樣間隔共采集了2394組樣本。但是,在線儀表的測量周期和安裝位置使得各輔助變量與主導(dǎo)變量間存在45~90 min的滯后[2],則文中各變量最優(yōu)時(shí)滯參數(shù)d的范圍為8~15。仿照文獻(xiàn)[11]中的做法,在仿真中將2個(gè)塔底溫度變量取平均后作為1個(gè)輔助變量,同時(shí),設(shè)置輔助變量可能存在的最大時(shí)延值max為19,由此可以得到120個(gè)待分析的擴(kuò)展時(shí)滯變量。
采集過程的前1519組輸入輸出樣本用于模型訓(xùn)練,首先,利用FCA方法提取出訓(xùn)練樣本集中的變量時(shí)滯參數(shù)來對過程的原變量進(jìn)行時(shí)滯信息重構(gòu),經(jīng)過這一步驟,得到的最優(yōu)時(shí)滯變量分別為1(-14),2(-16),3(-10),4(-17),5(-14),6(-19)。以過程第1、3、5個(gè)輔助變量為例,原變量與時(shí)滯重組的變量模糊曲線分布如圖5所示??梢园l(fā)現(xiàn),經(jīng)過時(shí)滯參數(shù)提取并重組后的各輸入變量模糊曲線覆蓋范圍(range 2)顯著增大,為主導(dǎo)變量序列引入了更加相關(guān)的輸入樣本。然后,對時(shí)滯輸入樣本引入主導(dǎo)變量歷史信息重構(gòu),共得到1500組樣本,記為[dd,],dd∈1500×8,進(jìn)行次差分得到[Ddd,D]。
在仿真研究中,將滑動(dòng)窗大小設(shè)置為145,顯著性水平設(shè)置為t=0.05,a=0.05,對脫丁烷塔過程時(shí)滯重組差分?jǐn)?shù)據(jù)[Ddd,D]進(jìn)行了LTDGPR模型集的提取,在離線局部化區(qū)域劃分和模型建立結(jié)束后,不同時(shí)間差階次大小情況下得到的局部化模型個(gè)數(shù)變化趨勢如圖6所示??梢园l(fā)現(xiàn),當(dāng)時(shí)間差階次在[1,10]區(qū)間變化時(shí),得到的值相對于窗口滑動(dòng)的次數(shù)來說是非常小的,意味著在線建模的時(shí)間和計(jì)算負(fù)荷都很小,復(fù)雜程度低,適合投入在線使用。
對于脫丁烷塔過程,為了驗(yàn)證選擇性集成LTDGPR模型的軟測量方法用于實(shí)時(shí)估計(jì)的有效性,本文選取2394組數(shù)據(jù)的最后875組連續(xù)時(shí)間樣本用于模型的在線測試。分別通過4種基于TD思想的建模方法對丁烷濃度進(jìn)行了在線預(yù)測,各方法的預(yù)測性能指標(biāo)為RMSE,仿真結(jié)果對比如表1所示。其中,方法1為傳統(tǒng)不考慮時(shí)滯的TDGPR方法(記為t-TDGPR),方法2為引入時(shí)滯分析的TDGPR方法(記為FCA-TDGPR),方法3為考慮時(shí)滯和動(dòng)態(tài)信息的TDGPR方法(記為DFCA-TDGPR),方法4為本文方法(記為SE-LTDGPR)。論文中的相關(guān)仿真參數(shù)設(shè)置如下:t=0.05, a=0.05,=145,=1.824,=0.305,=4.378,=100。
由表1可知,傳統(tǒng)的t-TDGPR方法在依次引入時(shí)滯信息、時(shí)滯動(dòng)態(tài)信息、選擇性集成的差分時(shí)滯動(dòng)態(tài)信息后,模型的精度一步步地有了明顯提高。同時(shí),在時(shí)間差逐漸增加的過程中,各方法的模型精度受時(shí)間差變化的影響程度依次顯著下降。為了更加直觀地體現(xiàn)模型性能的提升程度,各方法在不同時(shí)間差階次取值下的均方根誤差走勢情況如圖7所示。隨著時(shí)間差階次的增加,可以看出,傳統(tǒng)的t-TDGPR方法在加入模糊曲線分析方法后,RMSE幅值整體向下平移一段。在此基礎(chǔ)上,模型加入主導(dǎo)變量的歷史二階動(dòng)態(tài)信息后,模型解釋過程動(dòng)態(tài)的能力增強(qiáng),因此RMSE指標(biāo)隨時(shí)間差階次增加程度變得很緩慢,但是依然有上升的趨勢。接著,本文方法在DFCA-TDGPR方法的基礎(chǔ)上繼續(xù)提升,選取泛化性能好的LTDGPR模型進(jìn)行在線選擇性集成,來預(yù)測當(dāng)前時(shí)刻相對于時(shí)刻前的主導(dǎo)變量動(dòng)態(tài)偏移量,促使TD模型對時(shí)間差的增加變得不敏感,RMSE指標(biāo)走勢趨近于一條水平線,即使基于很長時(shí)間前的主導(dǎo)變量測量值,也能夠得到具有較高精度的當(dāng)前時(shí)刻主導(dǎo)變量預(yù)測結(jié)果。
本文方法建立的軟測量模型在離線訓(xùn)練過程中對時(shí)間差重組數(shù)據(jù)劃分局部模型區(qū)域,需要建立的局部模型個(gè)數(shù)很少且趨勢穩(wěn)定,表明該方法的離線訓(xùn)練階段快速可靠,適宜模型后續(xù)的在線應(yīng)用。同時(shí),在線階段通過選擇部分合適的LTDGPR模型集進(jìn)行集成預(yù)測的策略,很好地解決了TD模型隨時(shí)間差增加帶來的預(yù)測精度下降的問題。
表1 不同TD模型的sRMSE對比
針對具有時(shí)滯特性、非線性和時(shí)變特性的化工生產(chǎn)過程對象,本文提出了一種自適應(yīng)軟測量建模方法,即選擇性集成局部時(shí)間差高斯過程回歸模型的軟測量建模方法。該方法在離線階段通過有效地挖掘歷史數(shù)據(jù)庫中的時(shí)滯動(dòng)態(tài)信息,能夠?qū)^程差分動(dòng)態(tài)特征進(jìn)行局部學(xué)習(xí);當(dāng)在線實(shí)時(shí)測量的新輸入數(shù)據(jù)到來時(shí),利用離線估計(jì)的時(shí)滯動(dòng)態(tài)信息對新輸入樣本進(jìn)行重構(gòu),然后選擇泛化性能好的LTDGPR模型集來集成預(yù)測相對于一定時(shí)刻前的當(dāng)前時(shí)刻主導(dǎo)變量動(dòng)態(tài)偏移值,最后基于TD模型思想得到當(dāng)前時(shí)刻的主導(dǎo)變量預(yù)測值。本文通過實(shí)際工業(yè)脫丁烷塔過程采集的數(shù)據(jù)對所提方法進(jìn)行了仿真研究,驗(yàn)證了其相對于傳統(tǒng)幾種TD建模方法的有效性和精度。選擇性集成LTDGPR模型的方法,由于只需建立較少的局部模型,適合投入在線使用;同時(shí),該方法顯著地提高了傳統(tǒng)TDGPR模型的精度和可靠性,一定程度上解決了傳統(tǒng)TD模型隨時(shí)間差增加帶來的精度下降的問題,為類似的時(shí)滯非線性時(shí)變過程的在線軟測量建模問題提供了一種新思路。
[1] KADLEC P, GABRYS B, STRANDT S. Data-driven soft sensors in the process industry[J]. Computers & Chemical Engineering, 2009, 33(4): 795-814.
[2] FORTUNA L, GRAZIANI S, RIZZO A,. Soft Sensors for Monitoring and Control of Industrial Processes[M]. Berlin: Springer Science & Business Media, 2007: 15-39.
[3] KHATIBISEPEHR S, HUANG B, KHARE S. Design of inferential sensors in the process industry: a review of Bayesian methods[J]. Journal of Process Control, 2013, 23(10): 1575-1596.
[4] YUAN X, GE Z, YE L,. Supervised neighborhood preserving embedding for feature extraction and its application for soft sensor modeling[J]. Journal of Chemometrics, 2016, 30(8): 430-441.
[5] 熊偉麗, 李妍君, 姚樂, 等. 一種動(dòng)態(tài)校正的 AGMM-GPR 多模型軟測量建模方法[J]. 大連理工大學(xué)學(xué)報(bào), 2016, 56(1): 77-85. XIONG W L, LI Y J, YAO L,. A dynamically corrected AGMM-GPR multi-model soft sensor modeling method[J]. Journal of Dalian University of Technology, 2016, 56(1): 77-85.
[6] 張偉, 熊偉麗, 徐保國. 基于實(shí)時(shí)學(xué)習(xí)的高斯過程回歸多模型融合建模[J]. 信息與控制, 2015, 44(4): 487-492. ZHANG W, XIONG W L, XU B G. Multi-model combination modeling based on just-in-time learning using Gaussian process regression[J]. Information and Control, 2015, 44(4): 487-492.
[7] YUAN X F, YE L J, BAO L,. Nonlinear feature extraction for soft sensor modeling based on weighted probabilistic PCA[J]. Chemometrics and Intelligent Laboratory Systems, 2015, 147(2015): 167-175.
[8] KADLEC P, GABRYS B. Local learning-based adaptive soft sensor for catalyst activation prediction[J]. AIChE Journal, 2011, 57(5): 1288-1301.
[9] KOMULAINEN T, SOURANDER M, J?MS?-JOUNELA S L. An online application of dynamic PLS to a dearomatization process[J]. Computers & Chemical Engineering, 2004, 28(12): 2611-2619.
[10] ZHANG J, JIN Q B, XU Y M. Inferential estimation of polymer melt index using sequentially trained bootstrap aggregated neural networks[J]. Chemical Engineering and Technology, 2006, 29(4): 442-448.
[11] 阮宏鎂, 田學(xué)民, 王平. 基于聯(lián)合互信息的動(dòng)態(tài)軟測量方法[J]. 化工學(xué)報(bào), 2014, 65(11): 4497-4502. RUAN H M, TIAN X M, WANG P. Dynamic soft sensor method based on joint mutual information[J]. CIESC Journal, 2014, 65(11): 4497-4502.
[12] RAHMAN M M, IMTIAZ S A, HAWBOLDT K. A hybrid input variable selection method for building soft sensor from correlated process variables[J]. Chemometrics and Intelligent Laboratory Systems, 2016, 157(2016): 67-77.
[13] KIM S, KANO M, HASEBE S,. Long-term industrial applications of inferential control based on just-in-time soft-sensors: economical impact and challenges[J]. Industrial & Engineering Chemistry Research, 2013, 52(35): 12346-12356.
[14] KADLEC P, GRBIC R, GABRYS B. Review of adaptation mechanisms for data-driven soft sensors[J]. Computers & Chemical Engineering,2011, 35(1): 1-24.
[15] KANEKO H, OKADA T, FUNATSU K. Selective use of adaptive soft sensors based on process state[J]. Industrial & Engineering Chemistry Research, 2014, 53(41): 15962-15968.
[16] ZHANG W, LI Y, XIONG W,. Adaptive soft sensor for online prediction based on enhanced moving window GPR[C]//Control, Automation and Information Sciences (ICCAIS), 2015 International Conference on. IEEE, 2015: 291-296.
[17] XU O G, LIU J F, FU Y F,. Dual updating strategy for moving-window partial least-squares based on model performance assessment[J]. Industrial & Engineering Chemistry Research, 2015, 54(19): 5273-5284.
[18] DAYAL B S, MACGREGOR J F. Recursive exponentially weighted PLS and its applications to adaptive control and prediction[J]. Journal of Process Control1997, 7(3): 169-179.
[19] MATIAS T, SOUZA F, ARAUJO R,. On-line sequential extreme learning machine based on recursive partial least squares[J]. Journal of Process Control, 2015, 27: 15-21.
[20] LIU Y Q, HUANG D P, LI Y. Development of interval soft sensors using enhanced just-in-time learning and inductive confidence predictor[J]. Industrial & Engineering Chemistry research, 2012, 51(8): 3356-3367.
[21] FUJIWARA K, KANO M, HASEBE S,. Soft-sensor development using correlation-based just-in-time modeling[J]. AIChE Journal, 2009, 55(7): 1754-1765.
[22] KANEKO H, FUNATSU K. Moving window and just-in-time soft sensor model based on time differences considering a small number of measurements[J]. Industrial & Engineering Chemistry Research, 2015, 54(2): 700-704.
[23] KANEKO H, FUNATSU K. Classification of the degradation of soft sensor models and discussion on adaptive models[J]. AIChE Journal, 2013, 59(7): 2339-2347.
[24] 袁小鋒, 葛志強(qiáng), 宋執(zhí)環(huán). 基于時(shí)間差分和局部加權(quán)偏最小二乘算法的過程自適應(yīng)軟測量建模[J]. 化工學(xué)報(bào), 2016, 67(3): 724-728. YUAN X F, GE Z Q, SONG Z H. Adaptive soft sensor based on time difference model and locally weighted partial least squares regression[J]. CIESC Journal, 2016, 67(3): 724-728.
[25] WANG L, JIN H, CHEN X,. Soft sensor development based on the hierarchical ensemble of Gaussian process regression models for nonlinear and non-Gaussian chemical processes[J]. Industrial & Engineering Chemistry Research, 2016, 55(28): 7704-7719.
[26] YANG K, JIN H, CHEN X,. Soft sensor development for online quality prediction of industrial batch rubber mixing process using ensemble just-in-time Gaussian process regression models[J]. Chemometrics and Intelligent Laboratory Systems, 2016, 155(2016): 170-182.
[27] JIN H, CHEN X, WANG L,. Dual learning-based online ensemble regression approach for adaptive soft sensor modeling of nonlinear time-varying processes[J]. Chemometrics and Intelligent Laboratory Systems, 2016, 151(2016): 228-244.
[28] SHAO W M, TIAN X M. Adaptive soft sensor for quality prediction of chemical processes based on selective ensemble of local partial least squares models[J]. Chemical Engineering Research & Design, 2015, 95(2015): 113-132.
[29] JIN H, CHEN X ,WANG L,. Adaptive soft sensor development based on online ensemble Gaussian process regression for nonlinear time-varying batch processes[J]. Industrial & Engineering Chemistry Research, 2015, 54(30): 7320-7345.
[30] LIN Y, CUNNINGHAM G A. A new approach to fuzzy-neural system modeling[J]. IEEE Transactions on Fuzzy Systems, 1995, 3(2): 190-198.
[31] RASMUSSEN C E, WILLIAMS C K I. Gaussian Processes for Machine Learning[M]. Cambridge: The MIT Press, 2006: 8-29.
Adaptive soft sensor based on selective ensemble of LTDGPR models
XIONG Weili1,2, LI Yanjun1
(1,,,214122,,;2(),,214122,)
Traditional time difference (TD) model may deteriorate as time increases. In order to enhance reliability and prediction accuracy of TD model, an adaptive soft sensor was proposed on the basis of a selective ensemble of local time difference Gaussian process regression ( LTDGPR ) models and consideration of process time-delay characteristics. First, data for modelling was reconstructed by time delay and dynamic information extracted from database. Then, an adaptive localization step was used to statistically classify the reconstructed time-difference dataset and to establish an LTDGPR model set. For new input samples, prediction of dynamic drift for primary variables at certain time lapse was achieved through selective ensemble of LTDGPR models which had strong generalization capability. Finally, spontaneous online prediction of primary variable was achieved on the basis of TD model theory. Simulation results of a real debutanizer process indicated the effectiveness and accuracy of the proposed soft sensor.
selective ensemble; TD model; parameter identification; dynamic modelling; chemical processes
10.11949/j.issn.0438-1157.20161570
TP 391.9
A
0438—1157(2017)03—0984—08
國家自然科學(xué)基金項(xiàng)目(21206053, 21276111);江蘇省“六大人才高峰”項(xiàng)目(2013-DZXX-043)。
2016-11-09收到初稿,2016-11-17收到修改稿。
聯(lián)系人及第一作者:熊偉麗(1978—),女,教授。
2016-11-07.
Prof. XIONG Weili, weili_xiong @jiangnan.edu.cn
supported by the National Natural Science Foundation of China (21206053, 21276111) and the Six Talent Peaks Project in Jiangsu Province (2013-DZXX-043).