溫 鑫, 錢玉良, 彭道剛, 馬 浩, 石 憲
(1.上海電力大學(xué), 上海 200090; 2.華能上海石洞口第一電廠, 上海 200942)
近年來,隨著我國經(jīng)濟(jì)的發(fā)展,能源消費(fèi)中所帶來的環(huán)境污染也越來越嚴(yán)重。氮氧化物(NOx)是主要的大氣污染物之一,伴隨著耗電量的增加,燃煤電廠的煙氣濃度排放成為重點(diǎn)關(guān)注對象[1-4]。我國對氮氧化物排放控制標(biāo)準(zhǔn)的要求越來越嚴(yán)格,為了控制火電廠尾氣中氮氧化物的排放,燃煤電廠廣泛使用選擇性催化還原法(Selective Catalytic Reduction,SCR)煙氣脫硝系統(tǒng),因此各電廠對 SCR 系統(tǒng)優(yōu)化控制技術(shù)的需求十分迫切[5]。準(zhǔn)確的模型是系統(tǒng)優(yōu)化控制的基礎(chǔ),選擇合適的輸入變量是建立模型的重要前提。
隨著人工智能技術(shù)的迅速發(fā)展,數(shù)據(jù)建模方法得到了廣泛研究[6]。周洪煜等人[7]采用徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)建立了SCR脫硝系統(tǒng)模型并優(yōu)化出口煙氣NH3/NOx比值;MEHMOOD T等人[8]對常用的變量選擇方法進(jìn)行了詳細(xì)論述;徐富強(qiáng)等人[9]建立了最優(yōu)徑向基函數(shù)模型,通過平均影響值算法來進(jìn)行變量處理。劉吉臻等人[10]采用點(diǎn)互信息進(jìn)行了變量選擇并建立了脫硝系統(tǒng)模型。
本文采用遺傳算法(Genetic Algorithm,GA)對SCR系統(tǒng)運(yùn)行數(shù)據(jù)進(jìn)行優(yōu)化計(jì)算,經(jīng)過主元分析選出重要的獨(dú)立變量;然后將變量選擇結(jié)果作為廣義回歸神經(jīng)網(wǎng)絡(luò)(Generalized Regression Neural Network,GRNN)模型輸入變量,通過交叉驗(yàn)證的方法訓(xùn)練GRNN,利用數(shù)據(jù)挖掘技術(shù)建立SCR系統(tǒng)的GRNN優(yōu)化控制數(shù)據(jù)模型;最后基于上海華能某電廠機(jī)組SCR系統(tǒng)運(yùn)行數(shù)據(jù)進(jìn)行了驗(yàn)證。
結(jié)果表明,該方法建立的模型具有擬合度高、復(fù)雜度低、泛化能力強(qiáng)等優(yōu)點(diǎn),能準(zhǔn)確反映SCR系統(tǒng)的變化過程,在電廠SCR系統(tǒng)升級建設(shè)中具有較高的實(shí)用價(jià)值。
圖1為上海華能某電廠燃煤機(jī)組采用的SCR煙氣脫硝系統(tǒng)。
圖1 SCR煙氣脫硝系統(tǒng)示意
SCR脫硝裝置布局在鍋爐省煤器和空氣預(yù)熱器的中間,設(shè)計(jì)為高灰型,安裝上SCR反應(yīng)器,煙氣擋板分別裝在反應(yīng)器兩側(cè)進(jìn)口煙道以及省煤器旁路。SCR脫硝系統(tǒng)采用TiO2作為催化劑,用尿素制備脫硝還原劑。熱解爐中的氨氣還原劑由熱解噴槍噴出尿素溶液蒸發(fā)而來,空氣/氨氣混合物通過熱解爐出口的母管分散進(jìn)入各分支管,混合氣體通過分支管的噴氨柵格進(jìn)入煙道,靜態(tài)混合器將煙氣與氨氣進(jìn)行充分混合后送入催化反應(yīng)器。催化氧化還原反應(yīng)在氨氣與NOx達(dá)到相應(yīng)溫度時(shí)開始發(fā)生,這樣NOx就被還原為N2和H2O,以實(shí)現(xiàn)煙氣脫硝[11]。其脫硝效率受氨氮比、煙氣含氧量、鍋爐溫度、進(jìn)風(fēng)量、反應(yīng)時(shí)間等一系列因素的影響[12]。
SCR脫硝過程發(fā)生的主要化學(xué)反應(yīng)如下:
4NO+4NH3+O2→4N2+6H2O
(1)
NO+NO2+2NH3→2N2+3H2O
(2)
6NO2+8NH3→7N2+12H2O
(3)
4NH3+3O2→2N2+6H2O
(4)
4NH3+5O2→4NO+6H2O
(5)
在SCR系統(tǒng)數(shù)據(jù)建模時(shí),既要考慮全工況,又要考慮各種影響因素。發(fā)電機(jī)組動(dòng)態(tài)工況下各變量特性不穩(wěn)定,模型的準(zhǔn)確度與其息息相關(guān)。其中,關(guān)聯(lián)度最大的有機(jī)組負(fù)荷、入口煙氣NOx含量、入口煙氣溫度、入口煙氣含氧量、噴氨量、SCR反應(yīng)器1層壓力差、SCR反應(yīng)器2層壓力差、SCR反應(yīng)器3層壓力差、進(jìn)入反應(yīng)器前總壓力、總煤量、總風(fēng)量、出口煙氣含氧量共12個(gè)變量。系統(tǒng)輸出為煙囪入口NOx含量。在建立系統(tǒng)數(shù)據(jù)模型時(shí),加入過多關(guān)聯(lián)性小的輸入變量會加劇模型建立的復(fù)雜度,因此對變量影響因素進(jìn)行主元分析,選擇出重要的獨(dú)立變量是提高模型精度的重要環(huán)節(jié)。12個(gè)輸入變量及序號如表1所示。
表1 12個(gè)變量及序號
其中,機(jī)組負(fù)荷與煙囪入口煙氣NOx含量變化關(guān)系如圖2所示。
由圖2可知,在機(jī)組負(fù)荷上升時(shí),煙囪出口煙氣NOx含量也隨之升高,即噴氨調(diào)節(jié)的延遲會造成排放超標(biāo),噴氨量加大。為了達(dá)到排放標(biāo)準(zhǔn),電廠會進(jìn)行過量噴氨,導(dǎo)致氨逃逸的發(fā)生。因此,通過數(shù)據(jù)挖掘技術(shù)建立準(zhǔn)確的SCR數(shù)據(jù)優(yōu)化模型是電廠改造形勢所需。
圖2 機(jī)組負(fù)荷與入口煙氣NOx含量變化關(guān)系
GA最初由美國的HOLLAND J教授提出,它通過模擬種群自然選擇和基因遺傳中發(fā)生的復(fù)制、交叉和變異等現(xiàn)象,通過選擇、交叉和變異進(jìn)而得到最適應(yīng)此環(huán)境的個(gè)體,從而能夠求得變量選擇最優(yōu)解[13]。
所需的N個(gè)初始串結(jié)構(gòu)數(shù)據(jù)系統(tǒng)隨機(jī)產(chǎn)生,一個(gè)串結(jié)構(gòu)數(shù)據(jù)對應(yīng)一個(gè)種群個(gè)體,分為0/1兩個(gè)值。適應(yīng)度是GA用來度量群體中每個(gè)個(gè)體在優(yōu)化計(jì)算中達(dá)到最優(yōu)解的程度,X為相應(yīng)個(gè)體,用適應(yīng)度函數(shù)來度量每個(gè)個(gè)體適應(yīng)度的大小。本文取測試數(shù)據(jù)誤差平方和的倒數(shù)為適應(yīng)度函數(shù),即
(6)
T——測試集的真實(shí)值,T={t1,t2,t3,…,tn};
n——測試集的數(shù)目。
選擇操作選用比例選擇算子,代表被選中的個(gè)體能遺傳到下一代種群的概率與該個(gè)體適應(yīng)度大小成正比。
計(jì)算種群中所有個(gè)體的適應(yīng)度值之和
(7)
式中:nr——個(gè)體特征總數(shù);
k——個(gè)體特征;
Xk——種群中的各個(gè)個(gè)體。
計(jì)算每個(gè)個(gè)體的相對適應(yīng)度,并將其作為該個(gè)體被選中然后能遺傳到下一代種群的概率,即
(8)
式中:F——種群中所有個(gè)體的適應(yīng)度之和。
用模擬輪盤賭操作,產(chǎn)生0~1之間的隨機(jī)數(shù),確定個(gè)體被選中的次數(shù)。個(gè)體的適應(yīng)度越大,被選中的概率也就越大,其基因也就會在種群中逐漸擴(kuò)大。
交叉操作采用單點(diǎn)交叉算子。先進(jìn)行種群中個(gè)體的兩兩隨機(jī)配對,然后選出配對個(gè)體的基因交叉點(diǎn),再交換兩個(gè)個(gè)體的部分染色體,產(chǎn)生兩個(gè)新個(gè)體,其原理如圖3所示。
圖3 單點(diǎn)交叉算子操作示意
變異操作采用單點(diǎn)交叉算子。先隨機(jī)產(chǎn)生變異點(diǎn),然后改變對應(yīng)基因座上的基因值,其原理如圖4所示。
圖4 單點(diǎn)變異算子示意
經(jīng)過不斷的迭代操作后,當(dāng)達(dá)到迭代截止條件時(shí),得到的末代種群即為篩選出的重要輸入變量。
GRNN是美國學(xué)者SPECHT D F提出的一種徑向基神經(jīng)網(wǎng)絡(luò)。其優(yōu)點(diǎn)是非線性映射能力強(qiáng)、柔性網(wǎng)絡(luò)結(jié)構(gòu)以及超高的容錯(cuò)性和魯棒性,多用于解決非線性問題。
GRNN網(wǎng)絡(luò)結(jié)構(gòu)由輸入層、模式層、求和層和輸出層4層構(gòu)成,如圖5所示[14]。
GRNN的理論基礎(chǔ)是非線性回歸分析,通過計(jì)算含有最大概率值的y來進(jìn)行非獨(dú)立變量Y于獨(dú)立變量x的回歸分析。設(shè)f(x,y)表示隨機(jī)變量x和y的聯(lián)合概率密度函數(shù),已知x的觀測值為X,y是相對于X的回歸,條件均值為
(9)
圖5 GRNN網(wǎng)絡(luò)結(jié)構(gòu)
(10)
式中:p——隨機(jī)變量x的維數(shù);
σ——Gaussian函數(shù)的密度系數(shù);
Xi,Yi——隨機(jī)變量x和y的觀測值。
(11)
(12)
數(shù),所有Yi的權(quán)重因子是其樣本Xi與X兩者Euclid距離平方的指數(shù)。當(dāng)σ取合適值時(shí),便能考慮所有訓(xùn)練數(shù)據(jù)的因變量,加大與預(yù)測點(diǎn)最近的樣本點(diǎn)所對應(yīng)因變量的權(quán)值。
數(shù)據(jù)挖掘技術(shù)是一種數(shù)據(jù)庫知識的發(fā)現(xiàn),是從采集的海量數(shù)據(jù)中通過算法搜索隱藏其中的信息和規(guī)律的過程,主要包括三大流程:數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘算法以及知識表示和評估。
首先,GA變量選擇是利用GA進(jìn)行優(yōu)化計(jì)算,編碼長度設(shè)計(jì)為N,種群大小為M,最大進(jìn)化代數(shù)設(shè)為X,染色體每一位對應(yīng)一個(gè)輸入變量。每一位基因只能取“0”和“1”兩種情況:如果某一位是“1”,其對應(yīng)的輸入變量參與最后的建模;若為“0”,則不參與最后建模。取測試樣本集和方差的倒數(shù)為遺傳算法適應(yīng)度函數(shù),選擇運(yùn)算采用比例選擇算子,交叉運(yùn)算采用單點(diǎn)交叉算子,變異運(yùn)算采用單點(diǎn)變異算子,經(jīng)過大量數(shù)據(jù)的不斷迭代進(jìn)化。當(dāng)滿足迭代終止條件(最大進(jìn)化代數(shù))時(shí),篩選出最優(yōu)變量作為建模的輸入變量{w1,w2,w3,…,wi}。
因一般神經(jīng)網(wǎng)絡(luò)在函數(shù)逼近時(shí)存在收斂速度慢和局部極小等一系列缺點(diǎn),而GRNN數(shù)據(jù)挖掘技術(shù)在逼近能力、分類能力和學(xué)習(xí)速度方面具有較強(qiáng)優(yōu)勢,網(wǎng)絡(luò)最后收斂于樣本量積累最多的優(yōu)化回歸面,并且可以處理不穩(wěn)定的數(shù)據(jù),因此將其用于基于數(shù)據(jù)的系統(tǒng)模型的建立。
以GA篩選出的{w1,w2,w3,…,wi}作為網(wǎng)絡(luò)輸入,構(gòu)建GRNN模型,利用大量數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,采用交叉驗(yàn)證的方法訓(xùn)練GRNN。當(dāng)SPREAD值(即徑向基函數(shù)的擴(kuò)展速度,默認(rèn)值為1)較小時(shí),網(wǎng)絡(luò)對樣本的逼近能力較強(qiáng);當(dāng)SPREAD值越大時(shí),網(wǎng)絡(luò)對樣本的近似越平滑,誤差也變大。
在建模過程中,為了得出最佳的SPREAD值,通常用循環(huán)訓(xùn)練法找出最佳值,并以此最佳方法建立GRNN,從而達(dá)到最好的預(yù)測效果。利用GA變量選擇優(yōu)化GRNN建模的流程如圖6所示。
圖6 利用GA變量選擇優(yōu)化GRNN建模的流程
通過采集華能上海某火電廠1#機(jī)組SCR系統(tǒng)的實(shí)際運(yùn)行數(shù)據(jù),來驗(yàn)證本文提出的基于GA-GRNN數(shù)據(jù)挖掘技術(shù)的建模方法的有效性。選取正常運(yùn)行下1#機(jī)組負(fù)荷變化較大的某一周,間隔1 min進(jìn)行采樣,處理掉異常數(shù)據(jù),選取720組歷史運(yùn)行數(shù)據(jù)作為研究樣本,其中600組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),剩余120組作為測試數(shù)據(jù)。原始12個(gè)輸入變量如表1所示。
先將所有數(shù)據(jù)樣本進(jìn)行平滑處理,歸一化到[-1,1]范圍內(nèi),利用GA進(jìn)行變量選擇,編碼長度為12,種群大小為20個(gè),最大進(jìn)化代數(shù)設(shè)為60代,選取測試樣本均方誤差倒數(shù)為GA適應(yīng)度函數(shù),經(jīng)過數(shù)據(jù)挖掘不斷迭代篩選出最優(yōu)輸入變量[15]。
模型精度評價(jià)指標(biāo)采用均方根誤差(Root Mean Square Error,RMSE)和平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE),計(jì)算公式為
(13)
(14)
GA適應(yīng)度函數(shù)進(jìn)化曲線如圖7所示。變量選擇結(jié)果如圖8所示。
篩選出的最優(yōu)變量結(jié)果為“1”,由圖8得原始變量序號為1,2,5,8,9,10,12,即為機(jī)組負(fù)荷、入口煙氣NOx含量、噴氨量、SCR反應(yīng)器3層壓力差、進(jìn)入反應(yīng)器前總壓力、總煤量、出口煙氣含氧量。
圖7 適應(yīng)度函數(shù)進(jìn)化曲線
圖8 變量選擇結(jié)果
通過基于GA變量選擇得出的7個(gè)輸入變量以及輸出變量煙囪入口煙氣NOx含量構(gòu)建GRNN模型。采用交叉驗(yàn)證方法訓(xùn)練GRNN,并循環(huán)找出最佳SPREAD值,利用數(shù)據(jù)挖掘GRNN對SCR脫硝系統(tǒng)進(jìn)行優(yōu)化建模,結(jié)果如圖9所示。
運(yùn)行顯示,最佳SPREAD值為0.1,GRNN模型計(jì)算值大致在實(shí)際測量值附近,說明模型能很好地反映SCR脫硝系統(tǒng)出口煙氣NOx含量的動(dòng)態(tài)變化,具有很好的精度以及較強(qiáng)的學(xué)習(xí)能力和泛化能力。
圖9 GAGRNN模型計(jì)算結(jié)果
將本文提出的方法與其他方法進(jìn)行對比。利用數(shù)據(jù)挖掘技術(shù),首先通過原始12個(gè)輸入變量進(jìn)行BP神經(jīng)網(wǎng)絡(luò)建模,然后通過GA變量選擇得出的7個(gè)輸入變量進(jìn)行BP神經(jīng)網(wǎng)絡(luò)建模以驗(yàn)證變量選擇對模型精度的影響,并將7個(gè)輸入變量用于Elman建模與GRNN模型進(jìn)行比較。其中原變量BP模型計(jì)算結(jié)果如圖10所示,GA-BP模型計(jì)算結(jié)果如圖11所示,GA-Elman模型計(jì)算結(jié)果如圖12所示。不同建模方法下各指標(biāo)比較如表2所示。
圖10 原變量BP模型計(jì)算結(jié)果
圖11 GABP模型計(jì)算結(jié)果
圖12 GAElman模型計(jì)算結(jié)果
表2 不同建模方法比較
通過圖9~圖12和表2可以發(fā)現(xiàn),BP神經(jīng)網(wǎng)絡(luò)泛化能力最差;利用GA-BP,GA-GRNN,GA-Elman模型與BP模型進(jìn)行對比發(fā)現(xiàn),變量選擇能提高模型精度,降低模型復(fù)雜度,證明GA變量選擇算法在該系統(tǒng)中的適應(yīng)性;通過對比GA-BP,GA-GRNN,GA-Elman 3種模型發(fā)現(xiàn),GRNN的擬合效果最好,測試樣本計(jì)算結(jié)果誤差最小,MAPE只有4.568 7%,模型精度大幅提高,建模時(shí)間縮短,說明GRNN算法提高了模型的準(zhǔn)確性和魯棒性,能夠滿足工程優(yōu)化需要。
本文采用數(shù)據(jù)挖掘技術(shù),通過GA優(yōu)化計(jì)算進(jìn)行變量選擇,在連續(xù)迭代演化后,篩選出最具代表性的輸入自變量參與建模。然后將最優(yōu)輸入變量作為GRNN的輸入,采用交叉驗(yàn)證方法訓(xùn)練GRNN,通過循環(huán)找到最佳SPREAD,最終建立SCR脫硝系統(tǒng)數(shù)據(jù)模型。實(shí)例分析表明,通過GA變量選擇減少輸入變量的數(shù)量可以有效地降低模型的難度和復(fù)雜性,建立的GRNN模型具有模型泛化能力強(qiáng)、精度高等優(yōu)點(diǎn),能夠進(jìn)一步實(shí)現(xiàn)SCR脫硝系統(tǒng)優(yōu)化控制以及智能電廠的建設(shè)與改造。