冀光峰
中海油天津分公司,天津 300461
近年來,基于數據驅動的軟儀表建模方法在石化過程中得到了越來越多的應用[1]。然而,DCS系統(tǒng)采集的輔助變量的數據非常多,且往往伴隨著噪聲;另外,輔助變量與主導變量之間的關系多呈非線性。針對這兩個問題,本文提出一種基于PCA和OFR的軟儀表建模方法,首先采用PCA提取輸入數據的主成分,對其進行降維,消除噪聲影響;然后采用OFR建立提取到的主成分與輸出之間的非線性關系,最大程度地提高了模型的推廣性能及稀疏性。最后,將該方法應用于柴油沸點的預報,并與其它線性和非線性方法相比較。
PCA的原理[2]簡介如下 :設 X=(x1,x2,xm)為維輸入向量 ,其協方差陣為∑ ,∑的m個特征值為 λ1≥λ2≥… ≥λm≥0,相應的標準化正交化特征向量為 l1,l2,…,lm,則X的第i個主成分ui為:
設非線性模型通過下式辨識[3-4]:
其中 pk(?)是已知的非線性基函數,M為節(jié)點個數,θ(k)、ξ(t)分別為模型參數和誤差項 ,對P進行正交分解 ,即P=WA,得
模型的留一預報誤差可以表示為:
其中 βM(t)=1-w( t)T[WTW]-1w( t )。若向模型中添加第k+1個節(jié)點,那么ξk+1(t),βk+1(t )可以遞推獲取,即
本文提出的方法的軟儀表建模策略如圖1所示。
圖1 基于PCA-OFR的軟儀表建模結果圖
采用本文提出的方法建立輕柴油在50%收率時的沸點軟儀表模型。數據由Soutwest研究所提供 [6]。數據集中的數據已經過預處理,含有401個輔助變量,是典型的高維工業(yè)過程。
分別采用PCA、偏最小二乘(Partial Least Squres,PLS)、最小二乘支持向量機(Least Squares Support Vector Machine,LSSVM)以及本文提出的方法(PCA-OFR)建立柴油沸點軟儀表模型。以均方根誤差(RMSE)、均方根相對誤差(ReRMSE)、最大誤差絕對值(MaxAE)作為衡量不同方法性能的指標。上述四種方法的預報誤差如表1所示。
表1 不同方法對柴油沸點的預報誤差
從表1中可以看出,PCA和PLS這兩種線性方法的預報誤差較大,這是因為柴油沸點和輔助變量間呈非線性關系,所以PCA-OFR和LSSVM這兩種非線性方法有較好的預報結果。而本文提出的方法由于具有更好地稀疏性(建模樣本共113個,而PCA-OFR自動選擇的中心個數僅為45個),因此較LSSVM獲得了更高的預報精度。
PCA-OFR對柴油沸點的預報結果和誤差如圖2所示。
圖2 本文提出的方法對柴油沸點的預報結果和誤差曲線
面向變量維數高的工業(yè)過程,提出一種基于主成分分析和正交前向回歸的軟儀表建模方法,實現以下幾個功能:1)消除數據間的共線性,提取主成分;2)降低噪聲的影響;3)采用非線性模型辨析過程的輸入輸出關系,并實現模型的稀疏性、提高模型的推廣能力。最后通過仿真驗證了本文提出的方法的有效性。
[1]俞金壽,劉愛倫,張克進.軟測量技術及其在石油化工中的應用[M].北京:化學工業(yè)出版社,2000.
[2]常兆光,王清河,杜彩鳳.應用統(tǒng)計方法[M].北京:石油工業(yè)出版社,2009.
[3]S.Chen,X.Hong,B.L.Luk et al.Orthogonalleast-squares regression:A unified approach for data modeling.Neurocomputing,2009,72(10-12):2670-2681.
[4]S.Chen,X.Hong,Harris C J,et al.Sparse modeling using orthogonal forward regression with PRESS statistic and regularization[J].IEEE transaction on system,man and cybernetics-part B:Cybernetics,2004,34(2):898-911.
[5]X.Hong,P.M.Sharkey,K.Warwick.Automatic nonlinear predictive model-construction algorithm using forward regression and the PRESS statistic.IEE.Proc.-Control Theory Appl.,2003,150(3):245-253.
[6]http://www.eigenvector.com/data/SWRI/index.html.