趙 征,袁 洪,宋選鋒
(華北電力大學(xué)控制與計算機工程學(xué)院,河北 保定 071003)
火力發(fā)電是中國的主要發(fā)電方式,燃煤鍋爐中煤炭燃燒產(chǎn)生的氮氧化物已成為污染環(huán)境的主要因素[1-2]。煙氣在線監(jiān)測系統(tǒng)存在的測量滯后問題,會導(dǎo)致脫硝系統(tǒng)控制效果不理想。軟測量是解決該問題的一種有效方法。
目前,傳統(tǒng)NOx生成量的軟測量方法大多使用靜態(tài)建模,即當前時刻的輸出只與當前時刻的輸入有關(guān)。而在實際機組運行過程中,輸入、輸出變量之間存在明顯的時間滯后,如燃料運送過程產(chǎn)生的時延、信號的測量延遲等[3],導(dǎo)致建模時在同一時間上所選的輸入輸出數(shù)據(jù)不匹配,靜態(tài)建模無法滿足實際需求。對此,學(xué)者們提出了各種算法。文獻[4] 、文獻[5] 使用遞歸最小二乘的方法,估計出輔助變量的遲延;但這種方法存在一定的局限性。文獻[6] 通過相關(guān)系數(shù),分析了輔助變量與主導(dǎo)變量間的時延;但這種方法不適用于非線性過程。
鑒于互信息適用于非線性過程的時延估計,提出基于最小二乘支持向量機(least squares support vector machine,LSSVM)與互信息(mutual information,MI)的NOx生成量動態(tài)軟測量方法。首先,通過主成分分析(principal component analysis,PCA)選擇輔助變量;然后,采用互信息方法確定各輔助變量的時間遲延;最后,引入過去時刻的輸出作為當前時刻模型的輸入,以適應(yīng)工業(yè)過程的動態(tài)性。將包含過程時延信息和動態(tài)信息的新數(shù)據(jù)集作為模型的輸入,基于LSSVM建立NOx生成量的動態(tài)軟測量模型。采集某電廠330MW機組的一段歷史運行數(shù)據(jù),對模型進行驗證。驗證結(jié)果表明:該模型的預(yù)測值超前于LSSVM靜態(tài)模型的預(yù)測值,具有良好的預(yù)測效果。
最小二乘支持向量機是在支持向量機(support vector machine,SVM)的基礎(chǔ)上演變而來。在求解線性方程組的問題上,由于LSSVM引入最小二乘線性系統(tǒng)時使用了二次規(guī)劃方法解決問題,有效避免了SVM的復(fù)雜計算[7]。
yi=f(xi)=〈w,φ(xi)〉+b
(1)
式中:〈,〉為點積;w為權(quán)重向量;φ(xi)為原始變量數(shù)據(jù)映射以后的值;b為偏差。
LSSVM優(yōu)化問題可轉(zhuǎn)化為:
(2)
式中:ζi為誤差變量;c為懲罰參數(shù)。
利用目標函數(shù)和約束條件,建立拉格朗日函數(shù):
(3)
式中:αi(i=1,2,…,m)為乘子。
(4)
(5)
式(4)的另一種表示方式為:
(6)
式中:I=[1,2,…,l]T;L為m×m階單位矩陣;Ωij=φ(xi)Tφ(xj)=K(xi,xj)為核函數(shù);α=[α1,α2,…,αm]T為乘子;y=[y1,y2,…,ym]T。計算LSSVM估計函數(shù)的公式為:
(7)
式中:K(x,xi)=〈φ(x),φ(xi)〉為核函數(shù)。
(8)
互信息方法可以計算2個變量之間的關(guān)聯(lián)性,從而可應(yīng)用于計算復(fù)雜生產(chǎn)過程中輔助變量與目標變量的遲延時間。信息論中,熵可以度量變量間的不確定性,設(shè)X、Y為2個變量,X的概率密度分布函數(shù)為μ(x),則變量X的熵表示它的不確定性[9],定義為:
(9)
由此可得互信息定義為:
(10)
式中:μ(x,y)為X、Y的聯(lián)合概率密度;μx(x)、μy(y)分別為X、Y的概率密度分布函數(shù)。
根據(jù)熵的定義,互信息的計算可表示為:
MI(X,Y)=H(X)+H(Y)-H(X,Y)
(11)
互信息越大,表明變量X包含關(guān)于變量Y的信息越多。
以概率密度估計為基礎(chǔ)的直方圖法、核方法,在計算高維數(shù)據(jù)時的可靠性與估計精度會降低,不適用于高維數(shù)據(jù)計算[10]。而K-近鄰互信息估計方法有效避免了直接進行概率密度估計,簡化了高維互信息的計算。
K-近鄰互信息算法思想為:在X、Y構(gòu)成的空間Z=(X,Y)中,將每一個點Z(i)=(Xi,Yi)與其他點的距離進行排序。設(shè)0.5εi為點zI=(xi,yi)到其K-近鄰的距離,0.5εx(i)為點zi=(xi,yi)到X軸上的相應(yīng)點的距離,同理可得0.5εy(i)。
統(tǒng)計可知,點xi的距離小于0.5ε的樣本點數(shù)目nx(i)。對變量yi作相同的處理得到ny(i),通過式(11)計算變量X與Y之間的互信息。
MI(X,Y)=φ(k)-〈φ(nx+1)+φ(ny+1)〉+
φ(N)
(12)
則m維變量(X1,X2,…,Xm)之間的互信息為:
MI(X1,X2,…,Xm)=φ(k)-〈φ(nx1)+…+φ(nxm)〉+(m-1)φ(N)
(13)
燃煤機組NOx的生成量影響因素眾多,而單變量互信息(single variable MI,SMI)只考慮到了單個變量與主導(dǎo)變量之間的關(guān)系。因此,采用式(14),將可以計算出每個輔助變量對NOx的生成量的信息貢獻。
MI(x1,x2,…,xm;y)=MI(x1,x2,…,xm;y)-
MI(x1,x2,…,xm)
(14)
通常,電站鍋爐采集的NOx測量值y(k)與輔助變量在時間上存在滯后關(guān)系,使模型的輸入輸出在k時刻并非一一對應(yīng)。當前k時刻的y(k)值往往與輔助變量di時刻之前的歷史數(shù)據(jù)xi(k-di)有關(guān)。其中:di是輔助變量xi的時間延遲。實際生產(chǎn)過程中,y(k)的值還與自身前幾個時刻的值有關(guān)。因此,本文采用 LSSVM 與互信息相結(jié)合的軟測量方法,對NOx的生成量進行預(yù)測。動態(tài)軟測量模型結(jié)構(gòu)如圖1所示。
圖1 動態(tài)軟測量模型結(jié)構(gòu)圖
圖1中:U為對象的控制輸入;y為對象的可測輸出變量;y1為實際測量值。
該動態(tài)軟測量模型的建模步驟如下。
①通過PCA方法,選擇影響燃煤機組NOx生成量的主要因素。
②采用互信息的方法,確定各輔助變量xi的時延估計值di,并根據(jù)經(jīng)驗得出NOx生成量測量數(shù)據(jù)的遲延m。
③把含有工業(yè)過程的動態(tài)時延信息引入軟測量模型。即使用信息集{xi(k-d1),x2(k-d2),…,xi(k-di),y(k-m),y(k)},建立最小二乘支持向量機模型。
其中:模型輸入的選取與訓(xùn)練樣本數(shù)據(jù)的預(yù)處理是整個方案實現(xiàn)的前提;時間遲延的確定與LSSVM模型的建立是整個方案的關(guān)鍵。
通過文獻[11] 、文獻[12] 及NOx的生成機理,初步確定輔助變量為二次風(fēng)總風(fēng)量、總煤量、總風(fēng)量、各層二次風(fēng)擋板開度、煙氣溫度和煙氣含氧量。根據(jù)所確定的14個輔助變量,采集某電廠330 MW機組廠級監(jiān)控信息系統(tǒng)(supervisory information system,SIS)中的實際運行數(shù)據(jù),采樣間隔為10 s,共7 150組數(shù)據(jù)點。將前6 900組數(shù)據(jù)作為模型訓(xùn)練,后250組數(shù)據(jù)作為模型測試。
采用拉依達法則對原始歷史數(shù)據(jù)存在的異常值進行預(yù)處理,使處理后的數(shù)據(jù)更具完整性和準確性,并通過歸一化使樣本處于同一量綱。利用相關(guān)性分析得到輸入變量間的Pearson相關(guān)系數(shù)如圖2所示。
圖2 Pearson相關(guān)系數(shù)
由圖2可知,各個變量之間存在正相關(guān)或負相關(guān),若將所有輔助變量作為輸入進行建模,會增加模型的復(fù)雜度。使用PCA進行變量選擇,可以刪除冗余的輔助變量,降低了模型的復(fù)雜程度。經(jīng)過PCA后的主成分貢獻率及累計貢獻率如圖3所示。
圖3 主成分貢獻率及累計貢獻率
設(shè)累計貢獻率的要求為80%,選擇前4個主元進行分析,依次計算每個主元的載荷,最終確定所選的輔助變量。通過載荷計算,主元1的得分如圖4所示。
圖4 主元1得分
由圖4可知,在主元1得分較高的變量序號為1、7與8,其代表的變量分別為總煤量、D層與E層二次風(fēng)擋板開度。通過計算4個主元上的主元得分率最終所選輔助變量為:總煤量、總風(fēng)量、A層、B層、D層、E層和AA層二次風(fēng)擋板開度。
通過計算互信息MI,以當前k時刻的y值依次向前搜尋d時刻與y值最大的互信息量,d即為各輔助變量的遲延時間。各輔助變量的時間遲延di如圖5所示。
圖5 各輔助變量時間遲延
根據(jù)實際情況,估計出脫硝系統(tǒng)入口NOx測量值存在20~70 s滯后。將測量遲延與圖5得出的時間遲延引入到模型的輸入,確定最終的輸入變量集為:{x1(k),x2(k-4),x3(k-4),x4(k),x5(k),x6(k-3),x7(k-5),x8(k-5),y(k-3)}。
通過以上輸入變量集,建立LSSVM的動態(tài)軟測量模型。訓(xùn)練模型對比及局部放大圖如圖6所示,測試模型對比如圖7所示。
圖6 訓(xùn)練模型對比圖及局部放大圖
圖7 測試模型對比圖
從圖6和圖7可以看出,基于MI-LSSVM模型比單獨使用LSSVM的預(yù)測結(jié)果超前約1~2個采樣點(10~20 s)。
基于MI-LSSVM的模型與單獨使用LSSVM的預(yù)測誤差的對比如表1所示。
表1 不同模型預(yù)測誤差對比
由表1可以看出,基于MI-LSSVM模型的平均相對誤差和均方根誤差均低于單獨使用LSSVM的誤差,而且決定系數(shù)有明顯提高,表明基于MI-LSSVM模型具有更好的泛化能力。
本文所建立NOx生成量的動態(tài)軟測量模型中,測試模型較訓(xùn)練模型誤差偏大。這主要與選擇訓(xùn)練樣本的數(shù)量、輔助變量、涵蓋的工況以及測試樣本的數(shù)量有關(guān),同時還與延遲時間的準確性有關(guān)。如果能夠在每個環(huán)節(jié)都做到詳細而精確的測量,就能相對提高測試模型的誤差。
最小二乘具有較好的泛化能力以及互信息能力,適用于高維數(shù)據(jù)變量問題的選擇。本文提出基于MI-LSSVM的燃煤機組NOx生成量動態(tài)軟測量模型。首先,分析了影響燃煤機組NOx生成量的因素。其次,通過互信息確定了各輔助變量的時間遲延與歷史數(shù)據(jù)長度。最后,將包含過程時延信息和動態(tài)信息的新數(shù)據(jù)集作為LSSVM的輸入建立模型。
MI-LSSVM模型與LSSVM模型的預(yù)測結(jié)果對比表明:將過去時刻的輸入、輸出數(shù)據(jù)作為當前時刻模型的輸入,提高了模型的動態(tài)性,使模型的預(yù)測值超前于單獨使用LSSVM的預(yù)測值。另外,遲延時間的確定提高了模型的預(yù)測精度,證明了該方法的有效性。