余旺, 孫凱(齊魯工業(yè)大學(xué) 電氣工程與自動(dòng)化學(xué)院,濟(jì)南 250353)
基于NNG的軟測(cè)量技術(shù)在空氣分離中的應(yīng)用
余旺, 孫凱
(齊魯工業(yè)大學(xué) 電氣工程與自動(dòng)化學(xué)院,濟(jì)南 250353)
針對(duì)空氣分離裝置,設(shè)計(jì)了一種基于非負(fù)閾值的軟測(cè)量算法。算法以貝葉斯準(zhǔn)則作為模型的評(píng)價(jià)標(biāo)準(zhǔn),以v-fold交叉驗(yàn)證法來確定最優(yōu)非負(fù)閾值系數(shù)。所設(shè)計(jì)算法應(yīng)用于空氣分離裝置的O2濃度檢測(cè),并和最小二乘法進(jìn)行比較。MATLAB仿真結(jié)果表明該算法能夠?qū)崿F(xiàn)O2濃度的精確測(cè)量,并且模型精度上優(yōu)于最小二乘法。
軟測(cè)量; 變量選擇; 非負(fù)閾值算法
在工業(yè)生產(chǎn)中,為獲得更多合格的高質(zhì)量產(chǎn)品,從而提高裝置的經(jīng)濟(jì)效益,就需要對(duì)產(chǎn)品質(zhì)量或與產(chǎn)品質(zhì)量密切相關(guān)的重要過程變量進(jìn)行嚴(yán)格控制。然而在過程控制中,存在許多難以或無法直接使用傳感器進(jìn)行檢測(cè)的變量,如:催化劑活性、干點(diǎn)、某些精餾塔產(chǎn)品成分、反應(yīng)器中反應(yīng)物濃度、高爐鐵水的含硅量等。為了解決這類變量的測(cè)量問題,一般有兩種途徑:一種是研究新型的傳感器以硬件形式實(shí)現(xiàn)過程變量的直接在線測(cè)量;另一種是目前應(yīng)用較為廣泛的軟測(cè)量方法[1-2]。
軟測(cè)量的基本思想是把難以測(cè)量或無法直接測(cè)量的重要變量(主導(dǎo)變量、響應(yīng)變量),選擇另外一些容易測(cè)量的變量(輔助變量、預(yù)測(cè)變量)來構(gòu)造某種數(shù)學(xué)關(guān)系對(duì)主導(dǎo)變量進(jìn)行估計(jì)或預(yù)測(cè),以計(jì)算機(jī)軟件代替?zhèn)鞲衅鞴δ?。因此又稱之為軟儀表技術(shù)。這種方法具有響應(yīng)迅速、投資低、維護(hù)保養(yǎng)簡(jiǎn)單等優(yōu)點(diǎn)。目前工業(yè)過程的軟測(cè)量實(shí)現(xiàn)流程主要包括:輔助變量的選擇、數(shù)據(jù)的采集與處理、軟測(cè)量模型的建立和軟儀表的校正。軟測(cè)量工業(yè)實(shí)現(xiàn)流程,如圖1所示。
輔助變量的選擇要通過機(jī)理分析以及有關(guān)裝置和工藝流程來初步確定影響主導(dǎo)變量的相關(guān)輔助變量,包括變量類型、變量數(shù)目和監(jiān)測(cè)點(diǎn)的選擇。這些方面相互作用,互有影響,是由過程特性決定的。此外,在實(shí)際應(yīng)用中還要考慮經(jīng)濟(jì)性、維護(hù)的難易程度等。應(yīng)用中,對(duì)于線性回歸的變量挑選方法主要有前向選擇算法、后向選澤算法和逐步回歸算法,但當(dāng)備選變量比較多時(shí),枚舉比較的計(jì)算量非常大,導(dǎo)致算法效率太低。當(dāng)前研究較多的是基于系數(shù)壓縮的變量選擇方法,它能同時(shí)進(jìn)行變量選擇和參數(shù)估計(jì),如非負(fù)閾值算法[3-4](Nonnegative garrote,NNG),套索算法(Least absolute shrinkage and selection operator,LASSO)等。
圖1 軟測(cè)量模型
過程數(shù)據(jù)的處理包括數(shù)據(jù)的變換和誤差處理。通過數(shù)據(jù)變換,如數(shù)據(jù)的轉(zhuǎn)換、標(biāo)度的處理和權(quán)函數(shù),可有效改善算法的精度和穩(wěn)定性,降低原數(shù)據(jù)的非線性特性,實(shí)現(xiàn)對(duì)變量動(dòng)態(tài)特性的補(bǔ)償。誤差分為隨機(jī)誤差和過失誤差,前者主要使用濾波的方法解決;后者出現(xiàn)的幾率雖小,但它的存在會(huì)嚴(yán)重惡化數(shù)據(jù)的品質(zhì),甚至導(dǎo)致軟測(cè)量的失敗,這類誤差的處理主要有統(tǒng)計(jì)假設(shè)檢驗(yàn)法、貝葉斯法、硬件冗余法等。
軟測(cè)量的核心問題是建立能夠由輔助變量預(yù)測(cè)主導(dǎo)變量的關(guān)聯(lián)模型。目前,軟測(cè)量建模方法一般可分為:機(jī)理建模、回歸分析、狀態(tài)估計(jì)、人工神經(jīng)網(wǎng)絡(luò)、模糊數(shù)學(xué)、基于支持向量機(jī)和核函數(shù)的方法、過程層析成像和現(xiàn)代非線性系統(tǒng)信息處理技術(shù)等。這些方法各有各的適用范圍且都不同程度地應(yīng)用于軟測(cè)量實(shí)踐中,有些方法在軟測(cè)量實(shí)踐中已有許多成功的應(yīng)用,后面幾種建模方法限于理論研究,目前在過程控制中的應(yīng)用還比較少。
由于工作點(diǎn)和測(cè)量對(duì)象特性的變化,已建立的軟測(cè)量模型也會(huì)發(fā)生相應(yīng)的變化,因此必須對(duì)軟測(cè)量模型進(jìn)行在線校正,才能適應(yīng)新工況。模型結(jié)構(gòu)的校正一般需要重新采集大量數(shù)據(jù),因此比較耗時(shí)難以在線進(jìn)行,為解決模型結(jié)構(gòu)校正耗時(shí)長(zhǎng)和在線校正的矛盾,研究人員提出了短期學(xué)習(xí)和長(zhǎng)期學(xué)習(xí)的校正方法。短期學(xué)習(xí)在不改變模型結(jié)構(gòu)的情況下用新采集的數(shù)據(jù)對(duì)模型中的相關(guān)系數(shù)進(jìn)行更新;而長(zhǎng)期學(xué)習(xí)則利用新采集的數(shù)據(jù)重新建模。
本節(jié)對(duì)空氣分離裝置的工作流程進(jìn)行介紹并列出該裝置的18個(gè)可測(cè)輸入變量。空氣分離裝置的工業(yè)流程,如圖2所示。
圖2 空氣分離裝置工業(yè)流程圖
空氣分離裝置有五個(gè)相互協(xié)調(diào)的蒸餾塔,用來分離壓縮空氣中的N2,O2和Ar。壓縮空氣首先注入主熱交換器(Main heat exchanger,MHE)中然后再注入加壓塔,N2產(chǎn)品流會(huì)從加壓塔的頂部分離出來,加壓塔頂端的產(chǎn)品流經(jīng)過再冷卻系統(tǒng)后又作為粗Ar塔2和純Ar塔的冷凝劑使用,然后經(jīng)過低壓塔降低壓強(qiáng)后和加壓塔流出的剩余N2匯合,其中一部分N2產(chǎn)品流經(jīng)過主冷凝器和再冷凝器得到液化的N2產(chǎn)品,另一部分再次經(jīng)過MHE得到N2產(chǎn)品。
液化O2產(chǎn)品來自于低壓塔底部,經(jīng)過主熱交換系統(tǒng)后用泵進(jìn)行壓縮可分別得到32 kg/cm2的高壓O2產(chǎn)品和12 kg/cm2的中壓O2產(chǎn)品。Ar產(chǎn)品經(jīng)過粗Ar塔1、粗Ar塔2和純Ar塔的3層過濾得到提純的Ar。
液Ar產(chǎn)品存放在特制的容器中,容器中的液Ar反過來流經(jīng)主熱交換器而氣化,以此來降低壓縮空氣的溫度。
在空氣分離設(shè)備中安裝了一個(gè)O2濃度的在線檢測(cè)裝置如圖中A所示。O2濃度監(jiān)測(cè)的目的一方面是為了保證產(chǎn)品的質(zhì)量,另一方面是為了防止粗Ar塔2的N2的泄露。如果O2濃度較低,粗Ar塔1的入口處就會(huì)聚集大量的N2,這時(shí)粗Ar塔2頂端的壓強(qiáng)就會(huì)增大直到把塔內(nèi)N2排除為止。另一方面,如果O2濃度過高,那么Ar的產(chǎn)量就會(huì)因?yàn)锳r濃度的減少而減少。因此,O2濃度在線檢測(cè)裝置的測(cè)量值要保持在一定的范圍之內(nèi),然而,這種在線裝置并不能很好的達(dá)到這些要求,因此需要一種代替在線分析儀表的軟測(cè)量方法。
空氣分離裝置有18個(gè)可測(cè)輸入變量和一個(gè)輸出變量—氧氣濃度。所有的可測(cè)輸入變量,如表1所示。
表1 空氣分離裝置的可測(cè)輸入變量
空氣分離裝置的預(yù)測(cè)模型所使用的數(shù)據(jù)都是在2013年1月1日到6月30日每隔五分鐘測(cè)得的。其中,一半的數(shù)據(jù)用來建立預(yù)測(cè)模型,剩余一半的數(shù)據(jù)用來測(cè)試預(yù)測(cè)模型的精度。
NNG算法是一種穩(wěn)定性好,又能對(duì)候選變量進(jìn)行篩選和系數(shù)壓縮的變量選擇方法[3-4],即它不僅可以壓縮候選變量的個(gè)數(shù),還可以壓縮相應(yīng)變量的系數(shù)。從實(shí)際和仿真的結(jié)果來看,相比傳統(tǒng)的最小二乘回歸,NNG擁有較小的預(yù)測(cè)誤差。對(duì)于一個(gè)回歸方程來說,如果其中一個(gè)數(shù)據(jù)的較小變化不會(huì)引起預(yù)測(cè)方程較大的變動(dòng),那么稱這個(gè)過程是穩(wěn)定的。而子集回歸的缺點(diǎn)之一就是穩(wěn)定性差,例如,N=100,M=40,對(duì)變量進(jìn)行逐步刪除可得到一系列的變量子集{xm;m∈ζk},(|ζk|=k)k=1,…,M?,F(xiàn)在移除一個(gè)變量(yn,xn),再進(jìn)行相同的選擇過程也會(huì)得到一系列新的變量子集{xm;m∈ζk′}。通常情況下,{ζk′}和{ζk}是不同的,參見文獻(xiàn)[6]。也就是說,對(duì)于相同的k,單個(gè)數(shù)據(jù)的擾動(dòng),就會(huì)對(duì)預(yù)測(cè)方程產(chǎn)生巨大的影響。與此相比,如果使用NNG算法,在移除單個(gè)數(shù)據(jù)的情況下,新得到的主導(dǎo)變量的估計(jì)和之前的估計(jì)不會(huì)有較大的偏差[5]。
在統(tǒng)計(jì)分析方法中最常用的就是數(shù)據(jù)的選擇性回歸分析(subset-selection regression)。也就是在給出的如下數(shù)據(jù):{(yn,x1n,…,xMn),n=1,…,N},x1,…,xM中的一些變量被淘汰,剩下的變量將用來構(gòu)造y的預(yù)測(cè)方程。
數(shù)據(jù)的選擇對(duì)于預(yù)測(cè)方程有兩個(gè)方面的好處,一是減小預(yù)測(cè)方程的方差,二是預(yù)測(cè)方程的簡(jiǎn)化。眾所周知,每增加一個(gè)用于構(gòu)造y的預(yù)測(cè)方程的變量都會(huì)增加預(yù)測(cè)方程的方差,因此,預(yù)測(cè)方程中的變量數(shù)越少方差就越小。然而需要注意的是,使用的輔助變量太少可能會(huì)導(dǎo)致預(yù)測(cè)結(jié)果有較大的偏差。但是如果一個(gè)有40個(gè)輔助變量的回歸方程可以把變量數(shù)壓縮到5個(gè)而不影響預(yù)測(cè)方程的精度,那么不僅預(yù)測(cè)方程得到了簡(jiǎn)化而且還可以知道哪些輔助變量對(duì)主導(dǎo)變量y來說是重要的,變量選擇的重要性不言而喻。
2.1 最小二乘法
對(duì)于線性回歸模型,如式(1)。
y=Xβ+e
(1)
(2)
式(2)有唯一最小解的充要條件是XTX或X的秩為p(滿秩)。此時(shí)得到方程(2)的唯一解為式(3)。
(3)
應(yīng)用實(shí)踐表明當(dāng)變量之間的相關(guān)性較高時(shí),最小二乘估計(jì)不是很令人滿意,具體表現(xiàn)為:
(1) 某些回歸系數(shù)估計(jì)值的絕對(duì)值差異較大
(2) 有時(shí)回歸系數(shù)的估計(jì)值符號(hào)與實(shí)際意義相違背
此外,當(dāng)XTX不可逆時(shí),該方法沒有唯一最小二乘估計(jì),且只能應(yīng)用于線性估計(jì)。
2.2 NNG的工作原理
下對(duì){ck}極小化,即解式(4)。
(4)
2.3s的選擇及預(yù)測(cè)誤差
變量選擇的目的就是要找到對(duì)y影響較大的輔助變量,還希望由輔助變量對(duì)y可能出現(xiàn)的情況進(jìn)行預(yù)測(cè)。當(dāng)把預(yù)測(cè)作為我們的主要任務(wù)時(shí),常把預(yù)測(cè)誤差(平方和)PE(prediction error)(式(5))
(5)
(6)
其中的第一項(xiàng)為由噪聲引起的系統(tǒng)本身的固有誤差,第二項(xiàng)為模型誤差ME(model error)。模型誤差的大小反映了不同模型的優(yōu)劣。最佳的s值就是使PE取得最小的s值[16]。然而,在實(shí)踐中由于樣本數(shù)據(jù)的限制,PE的值并不是可直接觀測(cè)到的,我們必須對(duì)數(shù)據(jù)進(jìn)行重用,對(duì)數(shù)據(jù)進(jìn)行多次切分來得到較好的估計(jì)。V折交叉驗(yàn)證法由于其簡(jiǎn)潔性和普遍性被認(rèn)為是一種行之有效的辦法。
V折交叉驗(yàn)證法首先是把數(shù)據(jù)集平均分為V份,每次從V份數(shù)據(jù)集中拿出一份數(shù)據(jù)集作為驗(yàn)證集,剩下的V-1份數(shù)據(jù)集作為訓(xùn)練集,重復(fù)進(jìn)行V次,最后平均V次的結(jié)果作為最后泛化誤差的估計(jì)。通常V的取值為5到10時(shí)能得到較好的結(jié)果,當(dāng)V取值太大時(shí),方差也會(huì)隨之增大;當(dāng)V取值較小時(shí)由于參與訓(xùn)練的樣本數(shù)據(jù)減少會(huì)導(dǎo)致預(yù)測(cè)誤差的增大。本文取V=10,即把樣本數(shù)據(jù)平均分為10份,記為A1,…Av。且對(duì)于任意子集Aj,都有M(Aj)≈n/V,M為第j個(gè)子集中樣本的個(gè)數(shù),PE的估計(jì)值,為式(7)。
(7)
圖3為用NNG算法對(duì)O2濃度的預(yù)測(cè)結(jié)果,結(jié)果表明NNG算法能很好地對(duì)O2濃度進(jìn)行預(yù)測(cè)。
OLS的預(yù)測(cè)結(jié)果,如圖4所示??梢钥闯銎漕A(yù)測(cè)波動(dòng)較大,整體上沒有NNG擬合的好。
使用NNG算法和OLS算法對(duì)空氣分離裝置的O2濃度進(jìn)行預(yù)測(cè)時(shí)的平均均方誤差(Mean Squared Error,MSE),如表2所示。
由表2可知,應(yīng)用NNG算法對(duì)O2濃度進(jìn)行預(yù)測(cè)比OLS算法的預(yù)測(cè)精度高。
圖3 NNG回歸預(yù)測(cè)
圖4 OLS回歸預(yù)測(cè)
表2 NNG和OLS算法對(duì)O2濃度的預(yù)測(cè)精度
為了更直觀的比較兩種方法的預(yù)測(cè)效果,把NNG算法和OLS算法的預(yù)測(cè)誤差進(jìn)行了比較,如圖5所示。
圖5 NNG和OLS的預(yù)測(cè)誤差比較
由圖5可知, NNG的預(yù)測(cè)誤差幾乎處處都比OLS的預(yù)測(cè)誤差小,且預(yù)測(cè)穩(wěn)定性較高。
應(yīng)用NNG算法對(duì)O2濃度進(jìn)行與測(cè)試時(shí)最終篩選出的變量及其相應(yīng)系數(shù),如表3所示。
表3表明:應(yīng)用NNG方法對(duì)O2濃度進(jìn)行與測(cè)試時(shí),在保證預(yù)測(cè)精度的基礎(chǔ)上共從18的候選變量中選出8個(gè)。由系數(shù)可知,對(duì)O2濃度進(jìn)行預(yù)測(cè)時(shí),變量17(低壓塔出口處溫度)的作用最大,其次是變量7(低壓塔流入主熱交換器的液O2流量)和3(總液N2流量)。由現(xiàn)場(chǎng)操作經(jīng)驗(yàn)可知變量17處在采樣點(diǎn)A附近,因此,該變量與O2濃度有很高的對(duì)應(yīng)關(guān)系。實(shí)際上,當(dāng)在線檢測(cè)裝置A出現(xiàn)故障時(shí),操作人員通常是監(jiān)測(cè)低壓塔出口處溫度來保證空氣分離裝置的正常運(yùn)行。當(dāng)溫度太高時(shí),變量4(回流至低壓塔的液N2流量)就會(huì)增加,從而達(dá)到降溫的目的,而變量3(總液N2流量)對(duì)變量4有著直接的影響;相反,當(dāng)A處溫度較低時(shí),變量7(低壓塔流入MHE的液O2流量)就會(huì)減少,從而減少低壓塔的熱量損失而達(dá)到升溫的目的。從空氣分離裝置的工作流程和表2表3可知,NNG算法對(duì)預(yù)測(cè)變量的篩選是十分正確的。
表3 NNG變量選擇結(jié)果
本文首先介紹了軟測(cè)量技術(shù)及其優(yōu)點(diǎn)。其次介紹了NNG算法和最小二乘法并應(yīng)用交叉驗(yàn)證法對(duì)s值進(jìn)行了確定。最后應(yīng)用NNG算法和OLS算法對(duì)空氣分離裝置中的重要過程參數(shù)O2濃度進(jìn)行了預(yù)測(cè)。仿真結(jié)果表明,NNG算法不僅能對(duì)O2濃度進(jìn)行很好的預(yù)測(cè),而且比OLS算法的預(yù)測(cè)精度更高,模型法更簡(jiǎn)單,穩(wěn)定性更好?;贜NG的軟測(cè)量算法克服了普通傳感器價(jià)格昂貴、滯后和維護(hù)保養(yǎng)困難的缺點(diǎn),具有較好的實(shí)用性和經(jīng)濟(jì)性。
[1] 朱學(xué)峰. 軟測(cè)量技術(shù)及其應(yīng)用[J]. 華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版), 2002,30(11): 61-67.
[2] 酈曉雪, 肖伯樂. 軟測(cè)量技術(shù)及其在火電廠的應(yīng)用[J]. 發(fā)電設(shè)備, 2012,26(1): 62-64.
[3] SUN Kai, LIU Jialin, KANG Jialin, et al. Development of a variable selection method for soft sensor using artificial neural network and nonnegative garrote[J]. Journal of Process Control, 24(2014): 1068-1075.
[4] 譚力寧,韓海濤,馬紅光. 基于Nonnegative Garrote的ARX和ARMX模型定階方法[J]. 科學(xué)技術(shù)與工程,2013,13(9): 2509-2512.
[5] Kesavan P, Lee J H, Saucedo V. Partial least squares(PLS) based Monitoring and control of batch digesters[J]. Journal of Process Control, 2000, 10(23): 229-236.
[6] Breiman L. Better subset regression using the nonnegative garrote [J]. Technometrics,1995, 37: 373-384.
TheApplicationofSoftSensorBasedonNonnegativeGarroteintheAirSeparateProcess
Yu Wang, Sun Kai
(School of Electrical Engineering and Automation, Qilu University of Technology, Jinan 250353, China)
This paper developed a new variable selection method for soft sensor applications using the nonnegative garrote (NNG). This paper took Bayesian information criterion as the model evaluation criterion, and the optimal garrote parameter was determined by v-fold cross-validation. The method were applied to a real industrial application for air separation process. Compared to the least square method, the simulation results showed that the nonnegative garrote has better model accuracy and fewer variables selected.
soft sensor; variable selection; nonnegative garrote
國(guó)家自然科學(xué)基金項(xiàng)目(61603203)
余旺(1991-),男,濟(jì)南人,碩士研究生,研究方向:復(fù)雜系統(tǒng)建模。
孫凱(1979-),男,魚臺(tái)人,副教授,博士,碩士生導(dǎo)師,研究方向:過程控制復(fù)雜系統(tǒng)建模。
1007-757X(2017)11-0001-04
TP13
A
2017.04.25)