周 麗,馮 凱,金曉明
(1.浙江中控軟件技術有限公司,浙江 杭州 310053;2.浙江大學智能系統(tǒng)與控制研究所,浙江 杭州 310027)
混合輕烴氣體的分離在石油化工行業(yè)十分常見。其原理是利用被分離組分的揮發(fā)度不同,實現(xiàn)輕重組分的分離。某些煉油加工裝置,例如常減壓、催化裂化或催化重整的后續(xù)裝置常要進行C4-和C5+組分的分離。其中:C4-作為液化氣的基礎組分從塔頂部拔出,C5+作為汽油調和組分從塔底部拔出。對于塔頂組分液化氣,C5+組分作為雜質,需要嚴格控制其含量。因此,獲取塔頂油氣的C5+含量已成為該塔質量控制的關鍵。
以多變量預測控制[1]為代表的先進控制技術和以實時優(yōu)化為關鍵的過程優(yōu)化技術能大大提高工業(yè)裝置的經濟效益。其中,以軟測量技術[2]為核心的產品質量預估技術在先進控制中發(fā)揮著重要作用。本文在某工業(yè)裝置上,采用偏最小二乘法(partial least squares,PLS)建模,實現(xiàn)了對液化氣C5+含量的在線實時計算。
在實際生產過程中,由于在線檢測技術尚未成熟或者設備費用昂貴等原因,許多過程變量尚不能被實時監(jiān)測,如精餾塔產品的組分含量、化學反應的轉化率、反應器中反應物的濃度等。軟測量技術因其容易實現(xiàn)和成本低廉,得到了越來越多的關注和應用。軟測量技術是通過對一些容易測量的變量(稱為輔助變量)構建數(shù)學模型,對生產過程中難以實時監(jiān)測的變量(稱為主導變量)進行估計,從而達到以軟件代替硬件,得到難以測量的變量實時值的目的[3]。軟測量技術主要包括數(shù)據(jù)采集與預處理、輔助變量選擇、軟測量模型和偏差校正等[2]部分。其中,最關鍵的是建立“最優(yōu)”軟測量模型方程。
軟測量模型是軟測量技術的核心。PLS方法的多變量回歸模型由于方法簡單、模型結果易解釋,在工業(yè)的復雜環(huán)境下得到了廣泛的推廣和應用[4-6]。主流的先進控制系列軟件,例如Aspen公司的Aspen IQ、HONEYWELL的Profit Sensor、中控的APC-Sensor都包括PLS方法的基礎用法和功能。在模型結構確定的情況下,對原始數(shù)據(jù)的預處理和對輔助變量的選擇,已成為軟測量模型能否獲得良好效果的關鍵。
輔助變量的選擇直接影響著軟測量模型的準確性和可靠性。選擇合適的輔助變量,不僅可以精確地預測主導變量的變化,還可以簡化運算,消除噪聲[7]。好的輔助變量應該在包含盡可能多的過程信息的同時,利用盡可能少的變量。
輔助變量的選擇可以從機理入手,也可以從分析歷史數(shù)據(jù)入手[7]。機理分析需要熟悉裝置工藝特性,通過對過程的機理、裝置工藝、生產狀態(tài)分析,找出與主導變量有明顯關系的參數(shù);然后,建立軟測量模型,預測主導變量的變化[7]。歷史數(shù)據(jù)分析只需從數(shù)據(jù)出發(fā),選擇對主導變量影響較大的變量,剔除對主導變量影響較小或者含有較多冗余信息的變量[7],再通過回歸等方法建立軟測量模型。本文先運用歷史數(shù)據(jù)分析,挑選出在數(shù)據(jù)上表現(xiàn)良好的輔助變量,再進一步結合工藝分析,對變量進行篩選,最終運用PLS方法建立軟測量模型。
常見的輔助變量選擇方法有逐步剔除法、逐步引入法、逐步回歸法、主成分分析法、貝葉斯變量選擇法和各種智能算法[8]等。
在介紹具體方法前,先給出具體變量的定義。假設主導變量為y,使用變量x1,x2,…,xp對y建模。模型為:
y=a0+a1x1+a2x2+…+apxp
(1)
記x1,x2,…,xp的回歸平方和為SSRp,則:
(2)
式中:n為樣本個數(shù)。
同理,當使用變量x1,x2,…,xi-1,xi+1,…,xp對y建模時,其模型為:
y=b0+b1x1+b2x2+…+bi-1xi-1+
bi+1xi+1+…+bpxp
(3)
記x1,x2,…,xi-1,xi+1,…,xp的回歸平方和SSRp-1為:
(4)
則變量xi的偏回歸平方和Si為:
Si=SSRp-SSRp-1
(5)
對變量xi的偏回歸平方和作F檢驗,以判斷xi是否引入,需構建統(tǒng)計量:
(6)
逐步剔除法的基本步驟是先用所有的自變量建立多元回歸方程,然后選擇偏回歸平方和最小的變量并作F檢驗。若變量不顯著,則將該變量剔除;否則終止剔除,直至所有不顯著變量全部剔除為止。逐步剔除法的缺點是變量一旦被剔除,就再無機會進入回歸方程。
逐步引入法的基本思想是先用每個輔助變量分別建立一元回歸方程,然后選擇偏回歸平方和最大的變量引入回歸方程。再與剩余變量分別建立二元回歸方程,并選擇偏回歸平方和最大的變量進行F檢驗。如果顯著則引入方程,如不顯著則終止引入,如此循環(huán)直到沒有變量可以引入為止。逐步引入法的缺點是一個變量一旦被引入,就再也無法剔除。
逐步回歸流程如圖1所示。
圖1 逐步回歸流程圖
逐步回歸法是一種“有進有出”的變量選擇方法[9]。逐步回歸的每一步,都要選擇偏回歸平方和最大的變量,在特定的顯著性水平下進行F檢驗[10]。如果通過檢驗,則將該變量引入回歸模型。同時,對已經引入的變量重新進行審視,以確定是否會因為新變量的引入而導致原有變量變得不重要。選擇偏回歸平方和最小的變量進行F檢驗,如果不顯著,則剔除該變量。逐步回歸的每一步,不僅需要判斷是否引入或者刪除一個變量,而且需要進行F檢驗,以確保每次引入新的變量后,方程只包含顯著的變量。如此循環(huán),直至沒有變量可以引入和剔除。這里需要注意,引入變量F檢驗的顯著性水平臨界值為αin, 剔除變量F檢驗的顯著性水平臨界值為αout,則需取αin<αout,否則將導致死循環(huán)[11]。
逐步回歸是應用非常廣泛的一種變量選擇方法。它通過不斷“引入”和“剔除”變量,產生一系列的回歸模型,最終建立一個局部“最優(yōu)”的回歸方程,使得所有進入回歸方程的自變量在統(tǒng)計意義上都是顯著的,所有未進入回歸方程的自變量都是不顯著的。
在明確了軟測量任務以后,選定待測變量,也就是主導變量,再通過進一步深入了解過程工藝和裝置特性,初步確定用于軟測量建模的輔助變量集合,稱為軟儀表建模的變量池。由于變量池內變量數(shù)目眾多,且各個變量之間可能存在高度相關性,因此首先利用逐步回歸的數(shù)據(jù)分析方法,挑選出能表征因變量變化的自變量。
在液化氣C5+含量的軟測量建模中,經初步工藝分析,共選取34個變量作為建模的變量池。這34個變量包括前續(xù)和后續(xù)裝置的溫度、壓力和流量工藝參數(shù)。
在逐步回歸建模中,引入變量的顯著性水平為0.05,剔除變量的顯著性水平為0.1,共選用173組數(shù)據(jù)。依次選入回歸模型的輔助變量包括:穩(wěn)定塔塔頂溫度(X5),初餾塔塔頂溫度(X3),穩(wěn)定塔回流流量(X7)。逐步回歸選入變量的步驟如表1所示,數(shù)據(jù)擬合效果如圖2所示。
表1 逐步回歸變量選擇步驟表
圖2 逐步回歸變量選擇擬合效果圖
從顯著性水平可以看出,所有選中的變量都是顯著的。逐步回歸模型為Y=0.301 645×X3+0.593 352×X5-0.488 62×X7-68.981 6。
逐步回歸篩選變量的方法依托經過現(xiàn)場裝置整理的數(shù)據(jù),其本質是一種黑箱模型方法。由于采集的數(shù)據(jù)不可避免地在數(shù)據(jù)預處理過程中存在誤差,例如一些時序匹配或者采樣時間無法精確的問題,僅僅從歷史數(shù)據(jù)分析角度選擇輔助變量可能會因追求過高精度的建模效果而造成過度擬合,故需要對篩選的輔助變量進行工藝分析。
初餾塔是該裝置的前續(xù)工段。初餾塔塔頂物料作為穩(wěn)定塔的進料將長期影響液化氣C5+含量。但是初餾塔塔頂溫度和液化氣C5+含量的采樣檢測點距離太遠,經過對比另外幾組分析數(shù)據(jù),認為將初餾塔塔頂溫度輔助變量更換為穩(wěn)定塔第25層塔盤溫度更為合理。
最終確定的軟測量輔助變量為:穩(wěn)定塔塔頂溫度、穩(wěn)定塔第25層塔盤溫度、穩(wěn)定塔回流流量。建模方法采用PLS回歸。本文收集了100組建模樣本數(shù)據(jù),軟測量模型離線預測效果如圖3所示。
圖3 軟測量模型離線預測效果圖
將軟測量模型配置到分布式控制系統(tǒng)(distributed control system,DCS)上位機,利用OPC接口讀取現(xiàn)場數(shù)據(jù)并且回寫預測值。模型在線計算功能和校正功能通過軟測量系列軟件實現(xiàn)。模型運行約一個月后,采樣間隔時間為1 h,樣本數(shù)據(jù)約4 000組,軟測量模型在線預測效果如圖4所示。
圖4 軟測量模型在線預測效果圖
數(shù)據(jù)表明:軟測量結果能夠準確地預測產品質量的趨勢,在實際應用中可以逐步取代化驗數(shù)據(jù),達到降低化驗頻次的要求。
軟測量技術可以實現(xiàn)組分和物性等特殊變量的在線監(jiān)測,代替在線分析儀表為過程控制提供關鍵參數(shù)
信息。軟測量模型結果更常見的用法是直接作為被控變量用于多變量預測控制。隨著計算機和信息技術的發(fā)展,推斷控制策略將越來越多地應用于實際裝置并為生產實現(xiàn)節(jié)能增效。軟測量技術作為智能煉廠建設的重要的技術手段,必將推廣到更多的應用領域。