汪世杰,王振雷,王昕
?
基于JIT-MOSVR的軟測(cè)量方法及應(yīng)用
汪世杰1,王振雷1,王昕2
(1華東理工大學(xué)化工過(guò)程先進(jìn) 控制和優(yōu)化技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,上海200237;2上海交通大學(xué)電工與電子技術(shù)中心,上海200240)
針對(duì)傳統(tǒng)多模型軟測(cè)量方法在面對(duì)復(fù)雜、多變工況時(shí)缺少在線更新機(jī)制、更新時(shí)輸出精度降低等問(wèn)題,提出了一種基于即時(shí)學(xué)習(xí)算法(JIT)的多模型在線軟測(cè)量方法(MOSVR)。離線階段首先采用模糊均值聚類(FCM)對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行聚類,接著采用SVR建立初始模型集。在線部分以多模型輸出作為主要輸出,當(dāng)出現(xiàn)新工況時(shí),通過(guò)在線模型更新策略(OSMU)將輸出模式切換為JIT,同時(shí)多模型集進(jìn)行在線更新。該方法不僅擁有多模型輸出的快速性、精確性,而且在模型更新時(shí)通過(guò)JIT模式還能保證輸出的連續(xù)性、穩(wěn)定性、精確性。最后將該軟測(cè)量方法進(jìn)行了數(shù)值仿真并運(yùn)用到乙烷濃度軟測(cè)量中,驗(yàn)證了該方法的有效性。
軟測(cè)量;動(dòng)態(tài)建模;過(guò)程系統(tǒng);模型;即時(shí)學(xué)習(xí)
軟測(cè)量能夠?qū)ιa(chǎn)過(guò)程中一些復(fù)雜、難測(cè)、但又十分重要的變量進(jìn)行實(shí)時(shí)的測(cè)量,這一方法已經(jīng)被廣泛運(yùn)用在工業(yè)建模中[1-5]。
由于生產(chǎn)過(guò)程復(fù)雜多變,經(jīng)常運(yùn)行在不同操作點(diǎn),傳統(tǒng)的軟測(cè)量建模方法效果并不理想,存在過(guò)程特性匹配不佳以及預(yù)測(cè)精度差等問(wèn)題。多模型軟測(cè)量方法通過(guò)將過(guò)程變量樣本空間進(jìn)行分類后分別建立子模型,最大程度地涵蓋操作變量特征,提高了預(yù)測(cè)精度和泛化能力[6]。Tian等[7]將多模型最小二乘支持向量機(jī)(LSSVM)用于回轉(zhuǎn)窯煅燒帶的溫度測(cè)量,證明了多模型具有很高的學(xué)習(xí)速度、良好的逼近能力和泛化能力。熊偉麗等[8]采用自回歸積分滑動(dòng)平均模型(ARIMA) 對(duì)GPR子模型進(jìn)行動(dòng)態(tài)校正,改善了離線模型的動(dòng)態(tài)性能,提高了多模型的抗干擾能力。然而,由于多模型建模常采用離線聚類方法,導(dǎo)致模型只能涵蓋某些已知特征,當(dāng)數(shù)據(jù)出現(xiàn)新特征時(shí),模型的預(yù)測(cè)效果會(huì)變差。因此,在面對(duì)新工況數(shù)據(jù)時(shí)多模型方法預(yù)測(cè)精度可能下降,所以軟測(cè)量系統(tǒng)需要具有在線更新的能力,保證預(yù)測(cè)精度。
自適應(yīng)是改善軟測(cè)量模型在實(shí)際過(guò)程中精度退化的有效方法[9-10]。軟測(cè)量中自適應(yīng)的方法主要分為3種:①本地模型的更新;② 模型權(quán)重的更新;③ 在線添加和刪除模型。王春鵬等[11]采用移動(dòng)窗法(moving window,MW)對(duì)聚丙烯熔融指數(shù)測(cè)量過(guò)程進(jìn)行建模,實(shí)時(shí)控制數(shù)據(jù)塊的數(shù)據(jù)量,不斷地更新模型集。Liu等[12]給出了一種即時(shí)學(xué)習(xí)法(just-in-time,JIT),通過(guò)對(duì)歷史數(shù)據(jù)的學(xué)習(xí)來(lái)建立模型,由于采用近似數(shù)據(jù)提取特征,所以實(shí)時(shí)性較強(qiáng)。李奇安等[13]提出了一種在線支持向量機(jī)(OSVM),采用增量式支持向量機(jī)(ISVM)建立軟測(cè)量模型,采用近似線性條件(ALD)更新模型。ALD條件用于選取獨(dú)立數(shù)據(jù),避免無(wú)用的更新加重計(jì)算負(fù)荷。ISVM通過(guò)直接增減支持向量來(lái)改變模型,實(shí)現(xiàn)對(duì)數(shù)據(jù)的實(shí)時(shí)更新。自適應(yīng)方法可以有效解決工況變化時(shí)模型更新的問(wèn)題。但這些方法在強(qiáng)調(diào)自適應(yīng)效果的時(shí)候并沒(méi)有考慮下列實(shí)際應(yīng)用的問(wèn)題:①如何保證更新后的效果。可能更新過(guò)程中會(huì)有含噪聲的數(shù)據(jù)導(dǎo)致更新模型是有偏差的?;蛘吒潞蠊r又變回了更新前狀態(tài),對(duì)于類似MW和ISVM算法,局部擬合能力強(qiáng),而全局性較差;②更新過(guò)程中模型是否持續(xù)、穩(wěn)定、有效輸出。在連續(xù)控制中,不能容忍更新軟測(cè)量而暫停輸出或者輸出偏差太大。
因此,本文提出了一種JIT-MOSVR軟測(cè)量方法。該方法包括多模型輸出和JIT輸出兩種模式,以在線模型更新策略(OSMU)為切換條件。首先通過(guò)模糊均值聚類,多模型可以快速、精確地預(yù)測(cè)和歷史數(shù)據(jù)相近的數(shù)據(jù),所以多模型部分的輸出是軟測(cè)量主輸出。為了保證軟測(cè)量模型能不斷地更新,并且輸出保持精確性、實(shí)時(shí)性、穩(wěn)定性,采用JIT模型作為更新時(shí)的替代模型;然后采用OSMU作為判斷模型需要更新的條件和兩種模式切換的條件。當(dāng)新工況數(shù)據(jù)出現(xiàn)時(shí),OSMU通過(guò)概率統(tǒng)計(jì)的方法判別是否需要進(jìn)行模型的更新。如果需要更新,則將輸出切換到JIT模式,然后更新多模型集。當(dāng)更新結(jié)束時(shí),OSMU將JIT模型作為標(biāo)準(zhǔn)對(duì)更新后的模型集進(jìn)行輸出比對(duì)驗(yàn)證。如果通過(guò)驗(yàn)證則將輸出切換到多模型,否則重新更新;最后將本文提出的方法進(jìn)行了數(shù)值仿真,并在乙烯精餾塔乙烷濃度軟測(cè)量中進(jìn)行應(yīng)用。
1.1 支持向量回歸機(jī)
支持向量回歸機(jī)(support vector regression,SVR)是基于支持向量機(jī)(support vector machine,SVM)的原理,將決策規(guī)則改成回歸函數(shù)來(lái)進(jìn)行數(shù)值預(yù)測(cè)[14-17]。SVR從結(jié)構(gòu)上來(lái)看類似于單層的神經(jīng)網(wǎng)絡(luò),如圖1所示。但由于它同時(shí)關(guān)注經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信風(fēng)險(xiǎn),所以有更好的泛化能力,特別在小樣本訓(xùn)練中有很好的效果。圖1中的(·)=exp(--2/2)是針對(duì)非線性數(shù)據(jù)引入的高斯核函數(shù)。SVR訓(xùn)練的目標(biāo)就是使得下列函數(shù)極小化
通過(guò)引入a,a≥0朗日乘子求解上述有約束問(wèn)題,最后求得式(2)中的最優(yōu)的支持向量和常數(shù)項(xiàng)。
()=·+(2)
1.2 多模型支持向量回歸機(jī)
采用多模型策略可以提高支持向量回歸機(jī)對(duì)不同工況數(shù)據(jù)的學(xué)習(xí)能力,使軟測(cè)量模型能最大化地涵蓋訓(xùn)練數(shù)據(jù)特征,從而具有更好的預(yù)測(cè)精度和泛化能力[18-20]。
多模型支持向量回歸機(jī)(multi-model support vector regression,MSVR)一般分為3步:數(shù)據(jù)的聚類、子模型的建立和模型集的輸出。目前數(shù)據(jù)的聚類方法主要有AP仿射聚類、均值聚類和模糊均值聚類等,本文采用的是模糊均值聚類。該聚類方法相較于傳統(tǒng)的聚類方法增加了模糊的概念,不需要設(shè)定初始的聚類條件,只依靠數(shù)據(jù)之間的特征通過(guò)迭代計(jì)算聚類中心和隸屬度的方式使得準(zhǔn)則函數(shù)達(dá)到最小。
聚類中心計(jì)算公式
式中,=1,2,…,,是訓(xùn)練樣本,μ是模糊隸屬度,是預(yù)先設(shè)定的隸屬度的冪指數(shù),一般取=2。
隸屬度計(jì)算公式
式中
=1,2,…,,=1,2,…,,
設(shè)準(zhǔn)則函數(shù)為
則停止條件可以選取為當(dāng)準(zhǔn)則函數(shù)小于設(shè)定閾值時(shí),或設(shè)定某個(gè)迭代終止步數(shù)。
為了選擇較優(yōu)的類別數(shù),本文采用如下的聚類效果指標(biāo)對(duì)聚類結(jié)果進(jìn)行評(píng)價(jià)
該指標(biāo)是一個(gè)[0,1]區(qū)間內(nèi)的數(shù),越靠近1說(shuō)明聚類效果越好,這時(shí)的類別數(shù)就是最優(yōu)的。
樣本數(shù)據(jù)被聚類后就可以采用SVR的方法建立每個(gè)類的子模型,由此構(gòu)成模型集。MSVR的輸出可以通過(guò)多模型集切換或者加權(quán)的方式獲得[21]。本文由于測(cè)試數(shù)據(jù)含有較為明顯的獨(dú)立特征,所以采用切換的方法,這樣可以快速地將待測(cè)數(shù)據(jù)進(jìn)行歸類并選擇模型輸出。
2.1 即時(shí)學(xué)習(xí)算法
由于一些生產(chǎn)過(guò)程會(huì)隨著時(shí)間的推移產(chǎn)生變化,或者在不同的時(shí)刻有新工況出現(xiàn),一般的軟測(cè)量模型只能選擇更新模型才能保證輸出的準(zhǔn)確性。對(duì)于一些需要連續(xù)控制的情況,經(jīng)常更新模型可能會(huì)導(dǎo)致控制不及時(shí)。如果更新后模型不適用,不僅會(huì)導(dǎo)致模型逼近效果變差,更有可能因?yàn)樵斐煽刂葡到y(tǒng)波動(dòng)。即時(shí)學(xué)習(xí)算法(just-in-time,JIT)是一種基于“相似輸入產(chǎn)生相似輸出”原則的算法,可以有效地應(yīng)對(duì)過(guò)程緩變或者過(guò)程突變的情況[22-24]。當(dāng)出現(xiàn)新數(shù)據(jù)時(shí),它能將數(shù)據(jù)庫(kù)中與新數(shù)據(jù)相近的數(shù)據(jù)選擇出來(lái)進(jìn)行建模。相較于離線模型有較強(qiáng)的在線跟蹤能力,一般的JIT算法步驟如下。
(1)計(jì)算歷史數(shù)據(jù)庫(kù)中的數(shù)據(jù)(1,1), (2,2),…,(,y)與待測(cè)數(shù)據(jù)(new,new)的相似度。相似度計(jì)算一般可以采用距離、夾角余弦或者相似系數(shù),距離公式如下
式中,當(dāng)=2時(shí),該公式為歐氏距離。
(2)選擇相似度較高的數(shù)據(jù)組成訓(xùn)練數(shù)據(jù)集(1,1), (2,2),…,(,y),用SVR進(jìn)行訓(xùn)練。模型集的大小可以根據(jù)實(shí)際的需求設(shè)定,效果示意圖見(jiàn)圖2。
(3)模型輸出和放棄模型。采用訓(xùn)練完畢的JIT-SVR模型對(duì)新數(shù)據(jù)進(jìn)行預(yù)測(cè)。預(yù)測(cè)完以后把這組數(shù)據(jù)存入數(shù)據(jù)庫(kù),當(dāng)前模型作廢。直到有新數(shù)據(jù)再次到來(lái)時(shí),重新執(zhí)行步驟(1)。
JIT算法的實(shí)時(shí)性和跟蹤能力是建立在大量數(shù)值計(jì)算的基礎(chǔ)上的。雖然有很好的跟蹤逼近能力,但是如果直接采用這種方法,對(duì)計(jì)算機(jī)會(huì)造成較大的計(jì)算負(fù)擔(dān)。隨著歷史數(shù)據(jù)庫(kù)的增加,訓(xùn)練時(shí)間會(huì)增加。而且在工況不發(fā)生變化的時(shí)候,過(guò)于頻繁地更新模型是沒(méi)有必要的。所以JIT算法不適合單獨(dú)作為一種軟測(cè)量的方法在復(fù)雜工況中應(yīng)用。
2.2 JIT-MOSVR方法
2.2.1 兩種輸出模式 該方法采用兩種輸出模式,JIT和多模型。多模型是主要輸出模式,利用已建立的模型集進(jìn)行軟測(cè)量。在模型集不需要更新時(shí),多模型可以實(shí)現(xiàn)較為穩(wěn)定、快速和精確的輸出。當(dāng)多模型模式預(yù)測(cè)偏差增大而無(wú)法滿足系統(tǒng)要求時(shí),模型集需要更新。傳統(tǒng)的更新方式有離線更新和在線校正兩種方式[25-26],這些方法可以改善更新后的模型輸出,但是由于原模型集并不完備,更新時(shí)可能沒(méi)有輸出或者輸出與實(shí)際有很大偏差,這對(duì)于生產(chǎn)控制是不利的。所以本文采用JIT模式作為多模型輸出模式的補(bǔ)充。
2.2.2 在線模型更新策略 上述的兩種輸出模式可以有效地針對(duì)不同的工況,但如果缺少合適的切換機(jī)制,兩種模式的特點(diǎn)可能達(dá)不到預(yù)期效果。所以本文提出了一種在線模型更新策略(online strategy of model updating,OSMU)用于切換兩種輸出模式。它主要通過(guò)統(tǒng)計(jì)學(xué)的方法驗(yàn)證包括模型需要更新的條件(condition of model updating,CMU)和模型輸出切換的條件(condition of model switching,CMS)。
CMU是在多模型模式時(shí)實(shí)時(shí)運(yùn)行,判斷工況數(shù)據(jù)變化的條件。根據(jù)設(shè)定的固定檢查步數(shù)按照式(8)進(jìn)行判斷
式中,CMU是設(shè)定檢查步數(shù),CMU是設(shè)定的容許誤差,y是MSVR輸出的實(shí)際值,是預(yù)測(cè)值。
當(dāng)計(jì)算結(jié)果大于CMU時(shí),超過(guò)容許誤差范圍,模型集需要更新。數(shù)據(jù)庫(kù)可以通過(guò)添加離線數(shù)據(jù)或者在線采集的方式添加新訓(xùn)練數(shù)據(jù),然后通過(guò)前文中MSVR的方法更新模型集。
CMS作為模型切換條件,在新模型集建立后,JIT模式需要切換回多模型時(shí)產(chǎn)生作用。當(dāng)CMU判斷成立時(shí),輸出模式將切換到JIT跟蹤輸出;當(dāng)新模型集建立后,首先需要通過(guò)CMS驗(yàn)證,然后才能投入運(yùn)行。驗(yàn)證方法如下。
設(shè)新模型集為new={1,2,…,new},新數(shù)據(jù)產(chǎn)生的模型為new,此時(shí)JIT模型為JIT。在噪聲影響較小的情況下,可以采用如下公式
式中,CMS是設(shè)定檢查步數(shù),CMS是設(shè)定的容許誤差,new是新模型集輸出,yJIT是JIT模型輸出。
當(dāng)計(jì)算結(jié)果小于時(shí),新模型集是有效的。但如果存在一定的噪聲影響,則可以采用T分布的顯著性假設(shè)檢驗(yàn)
通過(guò)式(10) 計(jì)算出的和根據(jù)自由度(-1)、置信水平查表得出的*進(jìn)行比較,如圖3所示。如果落在陰影范圍內(nèi)則拒絕檢驗(yàn),反之則接受檢驗(yàn),如式(11)所示。對(duì)于存在<0的情況,可以采用雙邊檢驗(yàn)。
式中,CMS是設(shè)定的檢驗(yàn)樣本數(shù),CMS是設(shè)定的容許誤差。
當(dāng)滿足式(11)時(shí),說(shuō)明更新后的模型集和JIT模型是匹配的,可以將輸出模式重新切換到多模型。如果不滿足,則說(shuō)明更新數(shù)據(jù)存在一定的問(wèn)題,或者模型更新存在問(wèn)題,CMS不能將輸出切換回多模型,模型集需要繼續(xù)更新。
2.2.3 JIT-MOSVR的執(zhí)行步驟
(1)離線模型集建立
采用模糊均值聚類對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行聚類,用SVR對(duì)聚類數(shù)據(jù)進(jìn)行模型集建立。
(2)模型更新條件(CMU)
① 設(shè)定CMU和CMU。參數(shù)設(shè)定按照實(shí)際工況的特點(diǎn)和生產(chǎn)設(shè)計(jì)的要求進(jìn)行選取。
② 實(shí)時(shí)判斷式(6)是否成立。如果成立就執(zhí)行步驟(3);否則跳到步驟(4)。
(3)多模型輸出模式
① 采用多模型切換的方式對(duì)新數(shù)據(jù)進(jìn)行預(yù)測(cè)。
② 預(yù)測(cè)后新數(shù)據(jù)被加入到歷史數(shù)據(jù)中。
③執(zhí)行步驟(2)。
(4)JIT輸出模式
① 輸出切換到JIT模式,搜尋歷史數(shù)據(jù)庫(kù)中與新數(shù)據(jù)相似程度高的數(shù)據(jù)建模。
② 多模型集運(yùn)用訓(xùn)練數(shù)據(jù)進(jìn)行更新。
(5)輸出切換條件(CMS)
① 保持JIT模式。
② 設(shè)定CMS,CMS,。參數(shù)設(shè)定按照實(shí)際工況的特點(diǎn)和生產(chǎn)設(shè)計(jì)的要求進(jìn)行選取。
為了驗(yàn)證本文方法,利用文獻(xiàn)[27]中的復(fù)雜非線性系統(tǒng)進(jìn)行仿真研究,該系統(tǒng)可用如下非線性方程表示
(13)
(14)
式中,1()和2()是狀態(tài)變量,()和()分別是輸出和輸入。
通過(guò)改變()中的參數(shù)來(lái)改變輸入,從而得到3種不同的工況數(shù)據(jù),其中分別取1、2、4 3種情況。選擇[(-1),(-2),(-3),(-1),(-2),(-)]作為輔助變量,()作為待測(cè)變量。各個(gè)情況取200組數(shù)據(jù),共600組,其中480組用于訓(xùn)練,120組用于預(yù)測(cè)。比較單一模型SVR和MSVR的效果仿真結(jié)果,為了方便顯示,取其中的20組作圖分析,如圖4所示。
比較圖4(a)、(b)可以看出單一模型在面對(duì)少樣本、多工況的情況下預(yù)測(cè)效果、精度沒(méi)有多模型的方法高。為了進(jìn)一步對(duì)單一模型和多模型SVR預(yù)測(cè)結(jié)果進(jìn)行分析,將120組測(cè)試數(shù)據(jù)的均方值和相似度計(jì)算如表1所示。
表1 預(yù)測(cè)數(shù)據(jù)與測(cè)試數(shù)據(jù)的均方差和相似度
表1是根據(jù)預(yù)測(cè)數(shù)據(jù)和訓(xùn)練數(shù)據(jù)的均方誤差和相似度的計(jì)算結(jié)果,可以得到,多模型的方法顯著地減小了均方誤差,有效地提高了模型的泛化能力。所以本文采用的多模型SVR在面對(duì)多工況的情況下具有良好的預(yù)測(cè)效果。
為了驗(yàn)證MSVR和JIT-MOSVR的區(qū)別,更改式(12)為式(16),得到第4種工況。
在測(cè)試數(shù)據(jù)中加入第4種工況測(cè)試數(shù)據(jù),設(shè)定CMU參數(shù)為CMU=10,CMU=0.5。仿真結(jié)果如圖5所示,選取了50個(gè)測(cè)試點(diǎn),前20個(gè)點(diǎn)只包含前3種工況,后30組點(diǎn)出現(xiàn)第4種工況。
圖5 MSVR和JIT-MOSVR預(yù)測(cè)效果比較
Fig.5 Comparison of prediction performance between MSVR andJIT-MOSVR
通過(guò)比較,圖5(a)中的MSVR算法對(duì)于學(xué)習(xí)過(guò)的數(shù)據(jù)仍有不錯(cuò)的精度。但是在新工況出現(xiàn)的時(shí)候(20組數(shù)據(jù)之后),原模型集對(duì)于新數(shù)據(jù)的預(yù)測(cè)能力就變得很差。然而在圖5(b)中,JIT-MOSVR在第30組數(shù)據(jù)時(shí)通過(guò)更新條件發(fā)現(xiàn)新工況,輸出切換至JIT模式,預(yù)測(cè)數(shù)據(jù)逐漸又接近實(shí)際數(shù)據(jù)。圖5(c)中可以明顯發(fā)現(xiàn)前幾個(gè)JIT預(yù)測(cè)點(diǎn)(30組數(shù)據(jù)后的幾個(gè)點(diǎn))由于歷史數(shù)據(jù)中工況4的數(shù)據(jù)較少,初期預(yù)測(cè)結(jié)果存在一定誤差,但隨著新數(shù)據(jù)加入到歷史數(shù)據(jù)庫(kù)中,JIT模型預(yù)測(cè)效果逐漸變好,在50組數(shù)據(jù)的時(shí)候已經(jīng)基本穩(wěn)定、準(zhǔn)確。
JIT模式下,多模型采集數(shù)據(jù)進(jìn)行更新。傳統(tǒng)的多模型方法也可以進(jìn)行更新,但是在更新過(guò)程中沒(méi)有JIT這種有效的輸出模式,所以此時(shí)多模型輸出是不能保證有效的。并且有噪聲的數(shù)據(jù)會(huì)干擾模型的更新,導(dǎo)致建立的新模型預(yù)測(cè)效果不佳。為了驗(yàn)證傳統(tǒng)多模型和JIT-MOSVR在遇到誤差數(shù)據(jù)時(shí)更新的效果,產(chǎn)生一些誤差數(shù)據(jù)進(jìn)行對(duì)比。通過(guò)對(duì)式(16)加入均值為0,方差為1的白噪聲,獲得200組數(shù)據(jù),定義為有噪聲污染的工況4數(shù)據(jù)。將這200組數(shù)據(jù)先對(duì)已有模型進(jìn)行測(cè)試,然后采用這些數(shù)據(jù)進(jìn)行模型更新,更新模型后用不含有誤差的數(shù)據(jù)進(jìn)行測(cè)試,再用不含誤差的數(shù)據(jù)進(jìn)行更新。設(shè)定CMS參數(shù)CMS=10,CMS=0.5,=0.5,每個(gè)階段各取了20組數(shù)據(jù)進(jìn)行展示,結(jié)果如圖6所示。
圖6(a)中,前20組數(shù)據(jù)時(shí)傳統(tǒng)多模型方法正在更新模型集,此時(shí)沒(méi)有有效輸出模型。由于前20組訓(xùn)練數(shù)據(jù)是有噪聲影響的,所以模型集更新完畢后對(duì)于新數(shù)據(jù)的預(yù)測(cè)精確度較差(21~40組),要等到較準(zhǔn)確的訓(xùn)練數(shù)據(jù)更新模型集才能使得預(yù)測(cè)效果變好。但這個(gè)過(guò)程中模型集有很長(zhǎng)一段時(shí)間都是處于預(yù)測(cè)不準(zhǔn)的情況,這對(duì)于連續(xù)、穩(wěn)定的控制有很大的影響。而采用JIT-MOSVR,由圖6(b)可見(jiàn),當(dāng)模型輸出切換到JIT模式后,輸出會(huì)跟隨新的數(shù)據(jù)。在20組訓(xùn)練數(shù)據(jù)過(guò)后,JIT模型作為檢驗(yàn)?zāi)P蛯?duì)更新后的多模型集校驗(yàn),發(fā)現(xiàn)多模型集更新后的預(yù)測(cè)存在偏差,所以不能把輸出切換到多模型模式,JIT模式繼續(xù)輸出。等到下一次更新結(jié)束后,JIT再次校驗(yàn)多模型集,在通過(guò)CMS條件后才將輸出模式切換到多模型。整個(gè)過(guò)程中軟測(cè)量的輸出始終保持連續(xù)、穩(wěn)定、精確。
乙烯精餾過(guò)程是乙烯生產(chǎn)過(guò)程中將乙烯產(chǎn)品和其他雜質(zhì)成分物理分離的過(guò)程[28-30]。該精餾塔一般有100多塊塔板,塔頂1號(hào)板連接冷凝器構(gòu)成回流,塔釜板一般是再沸器,控制加熱量。含有雜質(zhì)的乙烯從入料板進(jìn)入,雜質(zhì)一般主要是乙烷,還有少量丙烷、氫氣等。由于乙烯成品的濃度一般要求在99.95%以上,所以在塔頂設(shè)有乙烷濃度分析儀,用于檢測(cè)雜質(zhì)濃度。目前在線色譜儀測(cè)量有較大的時(shí)滯,不利于實(shí)時(shí)的控制。本文將塔頂?shù)囊彝闈舛葴y(cè)量作為實(shí)驗(yàn)的對(duì)象,采用JIT-MOSVR方法建立軟測(cè)量模型,驗(yàn)證該模型在乙烷濃度測(cè)量中的效果。
軟測(cè)量建模并預(yù)測(cè)的步驟如下。
(1)變量確定:采用現(xiàn)場(chǎng)的工藝參數(shù)建立基于Aspen Plus的乙烯精餾塔模型,如圖7所示。由于塔頂乙烷濃度和很多因素有關(guān),所以先通過(guò)機(jī)理研究和Aspen軟件的靈敏度分析選擇粗略的輔助變量,再通過(guò)主元分析等方法最后確定:靈敏板溫度、回流比、采出量、塔頂壓強(qiáng),這4項(xiàng)作為最終的輔助變量,乙烯產(chǎn)品中的乙烷濃度作為待測(cè)變量。
(2)數(shù)據(jù)選擇與處理:現(xiàn)場(chǎng)采集含有多種工況的800組數(shù)據(jù)。其中200組含有和其他數(shù)據(jù)不同的工況用于驗(yàn)證JIT,600組數(shù)據(jù)中的480組用于訓(xùn)練,建立初始模型集。120組數(shù)據(jù)和含有特殊工況的200組用于驗(yàn)證模型的預(yù)測(cè)效果和更新效果。
(3)離線模型集建立:用模糊均值聚類對(duì)480組數(shù)據(jù)進(jìn)行聚類,在=3時(shí)聚類效果最佳。所以將訓(xùn)練數(shù)據(jù)聚成3類,并求出聚類中心和模糊隸度。采用SVR的方法建立離線的子模型。
(4)參數(shù)設(shè)定見(jiàn)表2。
表2 OSMU參數(shù)設(shè)定
(5)預(yù)測(cè)分析:前60組測(cè)試數(shù)據(jù)的特征包含在訓(xùn)練數(shù)據(jù)中,61~220組數(shù)據(jù)引入新特征,221到最后驗(yàn)證更新后模型,如圖8所示。JIT-MOSVR方法可以有效運(yùn)用在乙烷濃度軟測(cè)量中,前60組數(shù)據(jù)采用的是多模型輸出,通過(guò)480組數(shù)據(jù)的訓(xùn)練,3個(gè)SVR模型可以很精準(zhǔn)地進(jìn)行預(yù)測(cè),這說(shuō)明多模型的策略在應(yīng)對(duì)復(fù)雜、多工況的數(shù)據(jù)時(shí)是有效的。61~220組數(shù)據(jù)時(shí)出現(xiàn)新工況的情況,通過(guò)更新條件判斷后輸出馬上切換到JIT,由圖8(b)和表3中的數(shù)據(jù)可知JIT模式下,誤差值和相關(guān)度仍然保證在一定的有效水平。
表3 3種狀態(tài)的均方值和相似度
在后100組數(shù)據(jù)中,模型集已經(jīng)更新完畢,通過(guò)切換條件檢驗(yàn)后,輸出模式切換到多模型,多模型此時(shí)已經(jīng)學(xué)習(xí)到新的數(shù)據(jù)特征。兩個(gè)模式體現(xiàn)出JIT-MOSVR在面對(duì)變化工況時(shí)的在線更新能力,數(shù)據(jù)表明該方法能夠提供持續(xù)、穩(wěn)定和連續(xù)的輸出。
另一方面,對(duì)這3種狀態(tài)的計(jì)算機(jī)執(zhí)行時(shí)間進(jìn)行了統(tǒng)計(jì),結(jié)果如圖9所示。第2種狀態(tài)(切換到JIT)的預(yù)測(cè)時(shí)間比第1、3種狀態(tài)(多模型狀態(tài))的所用時(shí)間明顯長(zhǎng),這是由于JIT部分的計(jì)算量較大。所以JIT模式在取得精度的同時(shí),需要耗費(fèi)大量的時(shí)間和計(jì)算機(jī)資源。這也是本文中將MSVR算法作為主要輸出,JIT只作為更新輸出的原因。另外,在實(shí)際應(yīng)用中,需要考慮實(shí)際對(duì)象的響應(yīng)時(shí)間。比如,本文的對(duì)象,流程工業(yè)中的精餾塔的響應(yīng)時(shí)間一般是分鐘級(jí)的,采用JIT模式輸出不會(huì)影響實(shí)時(shí)性。但在實(shí)時(shí)性要求比較高的場(chǎng)合,就需要對(duì)該方法進(jìn)行一些改變。
圖9 3種狀態(tài)的時(shí)間統(tǒng)計(jì)
本文提出了一種基于JIT-MOSVR的軟測(cè)量建模方法。該方法通過(guò)JIT-SVR模型與多模型SVR切換輸出的方法對(duì)系統(tǒng)進(jìn)行軟測(cè)量。結(jié)合多模型的輸出速度快、準(zhǔn)確度高,JIT模型的跟蹤性能強(qiáng)、實(shí)時(shí)性好,通過(guò)在線模型更新策略準(zhǔn)確切換輸出模式,有效地解決了傳統(tǒng)的多模型方法在更新時(shí)輸出不連續(xù)、不穩(wěn)定、不精確的問(wèn)題。最后通過(guò)將該方法運(yùn)用到乙烷濃度軟測(cè)量的實(shí)驗(yàn)中,驗(yàn)證了該方法的有效性。
[1] FERNANDEZ D C J, SAZ-OROZCO P D, BARATTI R,. Soft-sensing estimation of plant effluent concentrations in a biological wastewater treatment plant using an optimal neural network[J]. Expert Systems with Applications, 2016, 63: 8-19.
[2] HIROMASA K, KIMITO F. Adaptive soft sensor based on online support vector regression and Bayesian ensemble learning for various states in chemical plants[J]. Chemometrics and Intelligent Laboratory Systems, 2014, 137: 57-66.
[3] SOUZA F, ARAUJO R, MENDES J. Review of soft sensor methods for regression applications[J]. Chemometrics and Intelligent Laboratory Systems, 2016, 152: 69-79.
[4] 曹鵬飛, 羅雄麟. 化工過(guò)程軟測(cè)量建模方法研究進(jìn)展[J]. 化工學(xué)報(bào), 2013, 64(3): 788-800. CAO P F, LUO X L. Modeling of soft sensor for chemical process[J]. CIESC Journal, 2013, 64(3): 788-800.
[5] 唐苦, 王振雷. 一種基于KPCA-BN的軟測(cè)量建模方法[J]. 計(jì)算機(jī)與應(yīng)用化學(xué), 2012, 29(9): 1009-1102. TANG K, WANG Z L. A soft sensing method based on KPCA and BN[J]. Computers and Applied Chemistry, 2012, 29(9): 1009-1102.
[6] 王振雷, 唐苦, 王昕. 一種基于D-S和ARIMA的多模型軟測(cè)量建模方法[J]. 控制與決策, 2014, 29(7): 1160-1166. WANG Z L, TANG K, WANG X. A multi-model soft sensing method based on D-S and ARIMA model[J].Control and Decision, 2014, 29(7): 1160-1166.
[7] TIAN Z D, LI S J, WANG Y H,. A multi-model fusion soft sensor modelling method and its application in rotary kiln calcination zone temperature prediction[J]. Transactions of the Institute of Measurement and Control, 2016, 38(1): 110-124.
[8] 熊偉麗, 李妍君, 姚樂(lè), 等. 一種動(dòng)態(tài)校正的AGMM-GPR多模型軟測(cè)量建模方法[J]. 大連理工大學(xué)學(xué)報(bào), 2016, 56(1): 77-84. XIONG W L, LI Y J, YAO L,. A dynamically corrected AGMM-GPR multi-model soft sensor modeling method[J]. Journal of Dalian University of Technology, 2016, 56(1): 77-84.
[9] JIN H P, CHEN X G, YANG J W,. Multi-model adaptive soft sensor modeling method using local learning and online support vector regression for nonlinear time-variant batch processes[J]. Chemical Engineering Science, 2015, 131: 282-303.
[10] 李喆. 自適應(yīng)多變量統(tǒng)計(jì)過(guò)程監(jiān)控研究[D]. 杭州: 浙江大學(xué), 2015. LI Z. Research on adaptive multivariable statistical process monitoring[D]. Hangzhou: Zhejiang University, 2015.
[11] 王春鵬,于佐軍, 孟凡強(qiáng). 折息移動(dòng)窗遞推PLS算法及其在聚丙烯生產(chǎn)過(guò)程中的應(yīng)用[J]. 化工學(xué)報(bào), 2013, 64(12): 4593-4598. WANG C P, YU Z J, MENG F Q. Discount moving window recursive PLS algorithm and its application to process of polypropylene production[J]. CIESC Journal, 2013, 64(12): 4593-4598.
[12] MIN H, LUO X L. Calibration of soft sensor by using Just-in-time modeling and AdaBoost learning method[J]. Chinese Journal of Chemical Engineering, 2016, 24(8): 1038-1046.
[13] 李奇安, 郭強(qiáng). 基于在線SVM的裂解爐燃料氣熱值軟測(cè)量[J]. 浙江大學(xué)學(xué)報(bào)(工學(xué)版), 2015, 49(3): 457-487. LI Q A, GUO Q. Soft measurement for calorific value of cracking fuel gas based on Online SVM algorithm[J]. Journal of Zhejiang University (Engineering Science), 2015, 49(3): 457-487.
[14] ZHANG M, LIU X G. A real-time model based on optimized least squares support vector machine for industrial polypropylene melt index prediction[J]. Journal of Chemometrics, 2016, 30(6): 324-331.
[15] ZHANG M, LIU X G, ZHANG Z Y. A soft sensor for industrial melt index prediction based on evolutionary extreme learning machine[J]. Chinese Journal of Chemical Engineering, 2016, 24(8): 1013-1019.
[16] HE Y L, GENG Z Q, ZHU Q X. Data driven soft sensor development for complex chemical processes using extreme learning machine[J]. Chemical Engineering Research & Design, 2015, 102:1-11.
[17] 瓦普尼克. 統(tǒng)計(jì)學(xué)習(xí)理論的本質(zhì)[M]. 張學(xué)工, 譯. 北京: 清華大學(xué)出版社, 2000. VLADIMIR N V. The Essence of Statistical Learning Theory[M]. ZHANG X G, trans. Beijing: Tsinghua University Press, 2000.
[18] 唐苦, 王昕, 王振雷. 基于證據(jù)合成規(guī)則的多模型軟測(cè)量[J]. 控制理論與應(yīng)用, 2014, 31(5): 632-637. TANG K, WANG X, WANG Z L. Multi-model soft sensor based on Dempster-Shafer rule[J]. Control Theory & Application, 2014, 31(5): 632-637.
[19] LU Y, YANG H Z. A multi-model approach for soft sensor development based on feature extraction using weighted kernel Fisher criterion[J]. Chinese Journal of Chemical Engineering, 2014, 22(2): 146-152.
[20] SU Z G, WANG P H, SHEN J O,. Multi-model strategy based evidential soft sensor model for predicting evaluation of variables with uncertainty[J]. Applied Soft Computing, 2011, 11(2): 2595-2610.
[21] 龐強(qiáng), 鄒濤, 叢秋梅, 等. 基于高斯混合模型與主元分析的模型切換方法[J]. 化工學(xué)報(bào), 2013, 64(8):2938-2946. PANG Q, ZOU T, CONG Q M,. Multi-model switching based on Guassian mixture model and principal component analysis[J]. CIESC Journal, 2013, 64(8): 2938-2946.
[22] XIONG W L, ZHANG W, XU B G,. JITL based MWGPR soft sensor for multi-mode process with dual-updating strategy[J]. Computers & Chemical Engineering, 2016, 90: 260-267.
[23] ZHANG M X, LI Y, KANO M. Quality prediction in complex batch processes with just-in-time learning model based on non-Gaussian dissimilarity measure[J]. Industrial & Engineering Chemistry Research, 2015, 54(31): 7694-7705.
[24] LIU Y, CHEN J H. Integrated soft sensor using just-in-time support vector regression and probabilistic analysis for quality prediction of multi-grade processes[J]. Journal of Process Control, 2013, 23: 793-804.
[25] 范苗. 基于高斯混合模型的時(shí)變過(guò)程軟測(cè)量建模[D]. 杭州: 浙江大學(xué), 2015. FAN M. Gaussian mixture model-based time-varying soft sensor development[D]. Hangzhou: Zhejiang University, 2015.
[26] HIROMASA K, KIMITO F. Application of online support vector regression for soft sensors[J]. Dept. of Chemical System Engineering, 2014, 60(2): 600-612.
[27] ZENG J, WNG J, GUO J. Local multi-model method based on similarity of vector[J]. Application Research of Computers, 2012, 29(5): 1631-1634.
[28] 羅雄麟, 趙曉鷹, 吳博, 等. 乙烯精餾塔異常工況在線偵測(cè)與控制[J]. 化工學(xué)報(bào), 2014, 65(11): 4517-4523. LUO X L, ZHAO X Y, WU B,. Online detection and control of ethylene column abnormal condition[J].CIESC Journal, 2014, 65(11): 4517-4523.
[29] 陳德呈. 乙烯精餾過(guò)程軟測(cè)量技術(shù)應(yīng)用研究[D]. 上海: 華東理工大學(xué), 2011. CHEN D C. Soft sensing technology in the ethylene distillation process applied research[D]. Shanghai: East China University of Science and Technology, 2011.
[30] LI S J, QIAN F. Application of soft sensors in the estimation of ethylene distillation column composition[C]//Proceedings of the 5th World Congress on Intelligent Control and Automation. Hangzhou, 2004: 426-3430.
Soft-sensor method based on JIT-MOSVR and its application
WANG Shijie1, WANG Zhenlei1, WANG Xin2
(1Key Laboratory of Advanced Control and Optimization for Chemical Processes, Ministry of Education, East China University of Science and Technology, Shanghai 200237, China;2Center of Electrical & Electronic Technology, Shanghai Jiao Tong University, Shanghai 200240, China)
In case of complex and changeable working conditions, traditional multi-model soft-sensor techniques lacked an online update mechanism and decreased accuracy upon updating. A new soft-sensor method based on just-in-time algorithm (JIT) and multi-model online support regression (MOSVR) was proposed. In offline phase, fuzzy C-mean clustering (FCM) was employed to classify training data and SVR was used to build initial model set. In online phase, main output was multi-model SVR works, which would be switched to JIT model by online strategy of model updating (OSMU) and the current model set was updated online simultaneously when new working condition was encountered. The new method not only possessed rapidity and accuracy of multi-model outputs, but also guaranteed continuity, stability and accuracy of JIT outputs at model updating. Method effectiveness was demonstrated by numerical simulation and application in soft-sensor measurement of ethane concentration in ethylene production.
soft-sensor;dynamic modeling; process systems; model; just-in-time
10.11949/j.issn.0438-1157.20161605
TP 273
A
0438—1157(2017)03—0947—09
國(guó)家科技支撐計(jì)劃項(xiàng)目(2015BAF22B02);國(guó)家自然科學(xué)基金面上項(xiàng)目(21276078);上海市自然然科學(xué)基金項(xiàng)目(14ZR1421800);流程工業(yè)綜合自動(dòng)化國(guó)家重點(diǎn)實(shí)驗(yàn)室開(kāi)放課題基金項(xiàng)目(PAL-N201404)。
2016-11-14收到初稿,2016-11-24收到修改稿。
聯(lián)系人:王振雷。第一作者:汪世杰(1993—),男,碩士。
2016-11-14.
Prof. WANG Zhenlei, wangzhen_l@ecust.edu.cn
supported by the National Key Technology R&DProgram(2015BAF22B02), the National Natural Science Foundation of China(2127 6078), the Natural Science Foundation of Shanghai (14ZR1421800) and the State Key Laboratory of Synthetical Automation for Process Industries(PAL -N201404).