郭麗瑩,郎憲明
(遼寧石油化工大學(xué)信息與控制工程學(xué)院,遼寧 撫順 113001)
常減壓蒸餾過程是一個(gè)復(fù)雜的物理和化學(xué)變化過程,由于產(chǎn)品數(shù)目眾多,很多變量之間耦合嚴(yán)重,造成常減壓裝置控制困難[1-3]。國內(nèi)多數(shù)煉油廠都沒有安裝質(zhì)量分析儀表,只能間隔幾個(gè)小時(shí)對常壓塔側(cè)線產(chǎn)品進(jìn)行抽樣離線化驗(yàn)分析,根本無法實(shí)現(xiàn)對產(chǎn)品質(zhì)量的實(shí)時(shí)監(jiān)控。常壓塔塔頂干點(diǎn)直接影響產(chǎn)品的質(zhì)量、產(chǎn)量以及能源消耗量,采用軟測量方法對篩選的常壓塔塔頂干點(diǎn)實(shí)現(xiàn)在線估計(jì),可實(shí)現(xiàn)對篩選干點(diǎn)的推斷控制[4-5]。
由于軟測量技術(shù)針對過程控制可實(shí)現(xiàn)更為嚴(yán)格的卡邊優(yōu)化控制,近些年對軟測量方法的大量研究成果不斷涌現(xiàn)。多變量統(tǒng)計(jì)建模逐漸發(fā)展成更具有代表性的方法[6],支持向量機(jī)(SVM)[7]與人工神經(jīng)網(wǎng)絡(luò)(ANN)[8]這些方法通過訓(xùn)練對主導(dǎo)變量具有一定的預(yù)測能力和較好的泛化能力。但是,由于常減壓蒸餾過程隨著原油生產(chǎn)方案的變化常常顯示動態(tài)特性,這些建模方法往往在預(yù)測精確度上達(dá)不到要求。高斯過程回歸(Gaussian Process Regression,GPR)作為一種非參數(shù)概率,根據(jù)實(shí)際工況建立基于相似準(zhǔn)則的局部模型,不僅可以給出干點(diǎn)預(yù)測值,還可以得到預(yù)測值對模型的信任值[9-11]。因此,可以使用GPR軟測量模型對常壓塔塔頂汽油干點(diǎn)進(jìn)行預(yù)測。
常減壓蒸餾過程是一項(xiàng)比較復(fù)雜的工藝流程,變量之間的復(fù)雜關(guān)聯(lián)導(dǎo)致所采集的變量數(shù)據(jù)過多,但是對過程控制有用的信息卻很少。因此,基于數(shù)據(jù)驅(qū)動的軟測量方法在建模前一定要對數(shù)據(jù)進(jìn)行預(yù)處理[12-13]。目前解決信息冗余的主要算法有主成分分析法(Principal Component Analysis,PCA)[14]、偏最小二乘法(Partial least squares,PLS)[15]。近年來,很多學(xué)者都致力于二種方法的改進(jìn),在數(shù)據(jù)預(yù)處理中得到了廣泛的應(yīng)用,由于變量數(shù)據(jù)間存在嚴(yán)重的耦合性和非線性,因此核主元算法(KPCA)應(yīng)用較為廣泛[16-18]。本文利用KPCA對過程變量進(jìn)行分析,對過程變量進(jìn)行降維,解決了不同變量之間的非線性相關(guān)性,然后采用GPR建立軟測量模型,進(jìn)而建立了KPCA-GPR常壓塔塔頂汽油干點(diǎn)模型。
設(shè)數(shù)據(jù)樣本集為X={x1,x2,…,xk,…,xn},其中xk∈Rn,n為樣本總數(shù);Φ為一個(gè)非線性映射,對應(yīng)的空間為F,F中的樣本記為Φ(xk),且滿足:
且F空間中樣本的協(xié)方差矩陣為:
式中,N=n-1。
C的特征 值λ和特征 向量V滿 足:
其中,特征向量V可由投影到F空間內(nèi)的樣本映射組成。
式中,Φ(X)=[Φ(x1),Φ(x2),…,Φ(xn)];β=[β1,β2,…,βn]T。由此,式(4)可改寫為:
等式(5)兩端左乘Φ(X)T,即:
引入核函數(shù)Ki,j:
式中,i、j=1,2,…,n。
式(7)用與核矩陣K的特征值λ和特征向量β表示。
即:
對核矩陣進(jìn)行中心化處理,結(jié)果如式(10)所示。
式中,In為所有元素均為的n維矩陣。
本文采用的徑向基函數(shù)為:
式中,σ為方差,σ>0;‖xi-xj‖為歐氏距離。
GPR模型是近幾年發(fā)展起來的一種機(jī)器學(xué)習(xí)回歸方法,并取得了許多研究成果,現(xiàn)已成為研究熱點(diǎn),在許多領(lǐng)域得到了成功應(yīng)用[9-11]。
GPR模型是有限個(gè)數(shù)的任意隨機(jī)變量均具有聯(lián)合高斯分布的集合,其性質(zhì)完全由均值函數(shù)m(x)和協(xié)方差函數(shù)c(x,x')確定。均值函數(shù)m(x)和協(xié)方差函數(shù)c(x,x')的表達(dá)式為:
式中,x、x'∈Rd為任意隨機(jī)變量,因此GPR模型可定義為f(x)?GPR[m(x),c(x,x')],通常對數(shù)據(jù)作預(yù)處理,使其均值函數(shù)等于0。回歸問題模型可表示為:
式中,ε為微小誤差;y為受噪聲影響的觀測值。進(jìn)一步假設(shè)噪聲ε~N(0,δ2n),可得觀測值y的先驗(yàn)分布為y~N[0,c(x,x)+δ2n In]以及觀測值y和預(yù)測值f*的聯(lián)合先驗(yàn)分布:
式中,X為訓(xùn)練集的輸入;x*為測試樣本集的輸入;C(X,X)=Cn=(cij)為n×n階對稱正定協(xié)方差矩陣;C(X,x*)=C(x*,X)T為x*與X之間的n×1階協(xié)方差矩陣;c(x*,x*)為x*自身的協(xié)方差。由此可以計(jì)算預(yù)測值f*的均值和方差。
常減壓蒸餾過程是將不同化學(xué)成分物質(zhì)分離的過程,從蒸餾的結(jié)構(gòu)上看,它是一個(gè)典型的、復(fù)雜的多側(cè)線系統(tǒng)。常減壓蒸餾裝置用于對原油的一次加工,將原油根據(jù)現(xiàn)實(shí)要求分為不同的餾分。常壓塔不同餾分的產(chǎn)品成分與這段時(shí)間內(nèi)進(jìn)料溫度、壓力,塔內(nèi)各處溫度、壓力,回流量等過程變量密切相關(guān),一旦過程變量的變化明顯,則會對產(chǎn)品質(zhì)量造成影響。在實(shí)際生產(chǎn)過程中,通過抽取大量的數(shù)據(jù)樣本在一定時(shí)間間隔內(nèi)進(jìn)行離線化驗(yàn)分析,獲得干點(diǎn)、凝固點(diǎn)、閃點(diǎn)等產(chǎn)品指標(biāo),其滯后性大,難以實(shí)現(xiàn)實(shí)時(shí)的自動控制,使整個(gè)常減壓蒸餾過程的產(chǎn)品質(zhì)量。常減壓蒸餾工藝流程如圖1所示。圖中,M為自控泵。
圖1 常減壓蒸餾工藝流程
采用軟測量建模,從采集到的樣本中選擇具有代表性的、能夠覆蓋正常運(yùn)行工況的適當(dāng)數(shù)據(jù)作為學(xué)習(xí)樣本訓(xùn)練,只要輸入實(shí)時(shí)采集的過程參數(shù),模型就會給出相應(yīng)的質(zhì)量指標(biāo),從而實(shí)現(xiàn)產(chǎn)品質(zhì)量指標(biāo)在線測量的目標(biāo)。
輔助變量的選擇應(yīng)遵循常減壓蒸餾過程的機(jī)理及規(guī)律[14]。通過對撫順石化公司石油二廠操作規(guī)程的了解,結(jié)合現(xiàn)場生產(chǎn)數(shù)據(jù),初步選擇影響常壓塔塔頂干點(diǎn)的14個(gè)輔助變量(見表1)。
表1 影響常壓塔塔頂干點(diǎn)的輔助變量
基于數(shù)據(jù)驅(qū)動的軟測量建模方法是經(jīng)過數(shù)值計(jì)算而實(shí)現(xiàn)的。一個(gè)模型的準(zhǔn)確性和有效性依賴于輸入數(shù)據(jù)中包含的有用信息量。因此,對輸入數(shù)據(jù)的預(yù)處理也是軟測量建模前必不可少的一道工序。在常減壓蒸餾過程中,影響常壓塔塔頂干點(diǎn)的不同變量之間相互關(guān)聯(lián),直接建模會增加問題分析的復(fù)雜性。對模型的輸入進(jìn)行簡化,對輸入數(shù)據(jù)進(jìn)行核主成分分析,可為常壓塔塔頂干點(diǎn)建立模型奠定一定的基礎(chǔ)。
干點(diǎn)影響變量為:
經(jīng)過KPCA處理后的輸入變量為:
汽油干點(diǎn)輸出變量為:
為了驗(yàn)證上述KPCA-GPR模型的有效性,使用某煉油廠的實(shí)際數(shù)據(jù)進(jìn)行系統(tǒng)仿真分析。從現(xiàn)場采集的數(shù)據(jù)雖然擁有大量的原始信息,但是由于所得數(shù)據(jù)易受到測量方法、人為操作因素、環(huán)境因素等因素干擾,需要在進(jìn)行數(shù)據(jù)預(yù)處理之前做好篩選、誤差處理等工作。
將經(jīng)過處理的數(shù)據(jù)分成訓(xùn)練集和測試集。根據(jù)交叉驗(yàn)證法選擇模型參數(shù),經(jīng)過多次實(shí)驗(yàn),最終將其中300組數(shù)據(jù)用于訓(xùn)練,100組數(shù)據(jù)用于測試。在使用KPCA提取數(shù)據(jù)信息時(shí),貢獻(xiàn)率ak表示每個(gè)主成分包含原始總信息量的多少。累計(jì)貢獻(xiàn)率bk表示前k個(gè)主成分對原始信息提取的能力。一般情況下,當(dāng)bk≥85%時(shí),就可以用k個(gè)主成分來表示原有指標(biāo)而不會損失過多信息。貢獻(xiàn)率ak和累計(jì)貢獻(xiàn)率bk表示為:
采用MATLAB軟件進(jìn)行仿真實(shí)驗(yàn),分別使用PCA、KPCA算法計(jì)算貢獻(xiàn)率和累計(jì)貢獻(xiàn)率,計(jì)算結(jié)果如表2所示。表2中,R1-R6表示前6個(gè)主元。
表2 基于PCA、KPCA算法的貢獻(xiàn)率和累積貢獻(xiàn)率
基于離線數(shù)據(jù)訓(xùn)練得到汽油干點(diǎn)軟測量模型,將原始數(shù)據(jù)經(jīng)過PCA、KPCA處理后作為輸入變量,汽油干點(diǎn)化驗(yàn)值作為輸出變量,代入GPR模型中進(jìn)行學(xué)習(xí),保證汽油干點(diǎn)模型能實(shí)時(shí)準(zhǔn)確預(yù)測出當(dāng)前時(shí)刻干點(diǎn)值的均值和方差。為了更好地對比,采用均方根誤差(RMSE)和平均絕對誤差(MAE)作為模型性能評價(jià)準(zhǔn)則。
分別使用GPR、PCA-GPR、KPCA-GPR建立常壓塔塔頂汽油干點(diǎn)軟測量預(yù)測模型,常壓塔塔頂干點(diǎn)預(yù)測均值可視化結(jié)果如圖2所示。GPR、PCAGPR、KPCA-GPR模型性能如表3所示。
圖2 常壓塔塔頂干點(diǎn)預(yù)測均值可視化結(jié)果
表3 GPR、PCA-GPR、KPCA-GPR模型性能
從圖2可以看出,KPCA-GPR與GPR、PCAGPR相比,預(yù)測精度有所提高,基本上能滿足工藝的要求。對比表3的數(shù)據(jù)可知,KPCA-GPR模型性能優(yōu)于GPR、PCA-GPR模型。因此,KPCA-GPR模型具有更好的預(yù)測精度和應(yīng)用前景。
針對常壓塔塔頂干點(diǎn)預(yù)測提出了KPCA-GPR軟測量方法。首先,對數(shù)據(jù)樣本采用核主成分分析進(jìn)行預(yù)處理,解決變量間的非線性問題,降低數(shù)據(jù)的維數(shù),減少噪聲的干擾,提高主成分的穩(wěn)定性;用未經(jīng)預(yù)處理數(shù)據(jù)和經(jīng)過PCA和KPCA處理的數(shù)據(jù)進(jìn)行了分析。結(jié)果表明,KPCA-GPR模型有較高的預(yù)測精度和較好的模型性能。