步紅麗,李永華
(華北電力大學(xué)能源動(dòng)力與機(jī)械工程學(xué)院,河北保定071003)
混合SPSS-PSO-SVM 模型在電廠NOx排放預(yù)測中的應(yīng)用
步紅麗,李永華
(華北電力大學(xué)能源動(dòng)力與機(jī)械工程學(xué)院,河北保定071003)
針對(duì)電廠NOx排放進(jìn)行預(yù)測,在滿足當(dāng)前NOx排放限額的條件下,致力于優(yōu)化脫銷系統(tǒng)的噴氨量,防止其過多或過少。為提升電廠排放NOx的預(yù)測精度,提出SPSS-PSO-SVM預(yù)測模型。電廠采集數(shù)據(jù)類型繁多,變量之間較多存在相關(guān)性和耦合性,而統(tǒng)計(jì)軟件SPSS的引入能較為直觀地觀測和分析變量間的關(guān)聯(lián),并通過因子分析計(jì)算主成分矩陣,以降低輸入變量的維數(shù)和消除相關(guān)性?;谀?80 MW熱力電廠的實(shí)時(shí)數(shù)據(jù),通過SPSS特征提取和MATLAB仿真模擬,并將此模型性能與PSO-SVM模型進(jìn)行比較,結(jié)果表明該模型在電廠NOx排放預(yù)測中應(yīng)用具有一定的有效性。
SPSS特征提取;粒子群優(yōu)化;支持向量機(jī);混合建模;氮氧化物排放
我國煤炭資源豐富,燃煤過程會(huì)產(chǎn)生大量NOx氣體,因此限制和降低NOx排放意義重大[1]。隨著電力行業(yè)的發(fā)展,火電行業(yè)的燃煤消耗進(jìn)一步增大,目前,火電行業(yè)運(yùn)行中排放的NOx量已超全國排放總量的1/2,所以控制火電行業(yè)的NOx排放量已上升為國家的研究重點(diǎn)[2]。
目前,國內(nèi)外針對(duì)控制NOx排放方面的研究大致可分為鍋爐燃燒技術(shù)的改進(jìn)、無催化情況下向爐內(nèi)噴氨水、有催化物的氨水噴射系統(tǒng)這三個(gè)方面[3]。本文所屬為噴氨系統(tǒng)研究,即第二、三方面,這方面已有很多專家學(xué)者提出不同的實(shí)施方案。李昌海等人將串級(jí)前饋控制方法應(yīng)用于脫銷系統(tǒng),此PID設(shè)定值SP是根據(jù)負(fù)荷的變動(dòng)來控制噴氨量,無法應(yīng)對(duì)變量波動(dòng)復(fù)雜的工況,局限性大[4]。劉芳等人將人工神經(jīng)網(wǎng)絡(luò)(ANN)應(yīng)用于小樣本下NOx排放預(yù)測,在大數(shù)據(jù)下易產(chǎn)生局部極小值導(dǎo)致過擬合等現(xiàn)象[5]。呂游等人將偏最小二乘法(PLS)提取與最小二乘支持向量機(jī)(LS-SVM)結(jié)合的NOx排放預(yù)測模型具有一定的優(yōu)勢,但其采用的交叉驗(yàn)證法參數(shù)尋優(yōu)法在給定參數(shù)集固定時(shí)易出現(xiàn)最優(yōu)組合不再給定范圍之內(nèi)的問題[6-7]。SPSS中的多元線性回歸思想和PLS回歸都具有主成分提取和消除相關(guān)性的作用,因此提出本文的建模方式。
支持向量機(jī)是由Vapnik提出的統(tǒng)計(jì)學(xué)方法[8-9],隨著研究的深入,將二次損失函數(shù)替換SVM中的一次損失函數(shù)就發(fā)展出最小二乘支持向量機(jī),提高了運(yùn)行數(shù)據(jù)的收斂速度,但通過SVM與LS-SVM兩種方法的對(duì)比實(shí)驗(yàn)表明,SVM具有更強(qiáng)的預(yù)測精度[10]。粒子群優(yōu)化算法是近年來發(fā)展迅猛的領(lǐng)域,其摒棄了遺傳算法的遺傳和變異的過程,擁有容易實(shí)現(xiàn)、精度高、收斂快等優(yōu)點(diǎn)受到研究領(lǐng)域的重視,并廣泛應(yīng)用于學(xué)術(shù)研究。本文主要通過SPSS對(duì)數(shù)據(jù)篩選處理,以SVM為預(yù)測模型,并結(jié)合粒子群優(yōu)化算法尋找最優(yōu)參數(shù),混合模型以獲得較好預(yù)測精度。
SPSS-PSO-SVM模型由三部分組成,如圖1所示,分別為:SPSS主成分提取,以消除變量之間的相關(guān)性,同時(shí)去除影響較小的變量,以免造成結(jié)論的偏差;粒子群優(yōu)化PSO,獲得最優(yōu)參數(shù)組合,以達(dá)到最優(yōu)的預(yù)測精度;SVM的MATLAB仿真,旨在預(yù)測當(dāng)前時(shí)刻鍋爐出口的NOx含量,進(jìn)而制定噴氨的量。
1.1 SPSS主成分分析
主成分是在損失較少信息的前提下將多個(gè)單一變量轉(zhuǎn)化為少量綜合性變量,其中的每一個(gè)組成成分都是通過原始變量的線性組合得到,且主成分之間不具有相關(guān)性。主成分表示為式(1):
式中:X1,X2,…,Xp為組成原始變量矩陣X的p個(gè)向量;Yi為第i個(gè)主成分向量。
通過該公式的線性變換,得到主成分的統(tǒng)計(jì)特性并不唯一,合理的主成分提取要滿足三個(gè)條件,每個(gè)主成分對(duì)應(yīng)的系數(shù)平方和為1;不同主成分之間線性無關(guān);先提取的主成分方差永遠(yuǎn)比后提取的主成分大。
圖1 SPSS-PSO-SVM模型
主成分的提取系數(shù)并不能通過SPSS直接得到,但是可得到基于主成分分析的因子載荷矩陣,設(shè)提取q個(gè)公因子,提取的因子模型可表示為:
式中:ξi1,ξi2…,ξiq為組成載荷矩陣的q個(gè)向量; ZXi為第i個(gè)提取的因子向量;f1,f2,…,fq為q個(gè)公因子。
其中因子載荷系數(shù)ξij與主成分系數(shù)bij之間的關(guān)系式為ξij=bji,λj為第j個(gè)主成分對(duì)應(yīng)的方差[11]。則主成分可表示為:
1.2 粒子群優(yōu)化算法PSO
PSO算法是Kennedy和Eberhart受到鳥群捕食活動(dòng)啟發(fā)而提出的理論,賦予粒子如鳥群般捕食信息共享和對(duì)食物距離感知的能力,每個(gè)個(gè)體持續(xù)靠近最優(yōu)適應(yīng)度,比較個(gè)體間的最優(yōu)適應(yīng)度以獲得全局最優(yōu)適應(yīng)度[12]。
設(shè)粒子群Z處在D維搜索空間,表示為Z= (Z1,Z2,…Zn),每個(gè)粒子都是由一個(gè)D維向量組成,通過式(4)更新自身的速度和位置[13]。
式中:Vi為第i個(gè)粒子的速度;Zi為第i個(gè)粒子的位置;Pi為種群個(gè)體極值;Pg為全局極值;k為第k次迭代;c1和c2為取值非負(fù)常數(shù)的學(xué)習(xí)因子,分別被認(rèn)為是認(rèn)知和社會(huì)參數(shù);w反映粒子在速度上繼承先前速度的程度,即慣性權(quán)重;α為限制速度權(quán)重的約束因子[14]。每個(gè)粒子的歷史最好位置的適應(yīng)值與全局最好位置的適應(yīng)值比較,確定全局最優(yōu)值,直到滿足條件,終止PSO運(yùn)算。
1.3 支持向量機(jī)SVM
支持向量機(jī)處理非線性可分?jǐn)?shù)據(jù),通過核函數(shù)映射到高維空間使其線性可分,此時(shí)的分類平面有很多,由圖2表示,但需求解的為最優(yōu)分類超平面,即正反分類間隔達(dá)到最大的分類平面。
圖2 高維空間中正反分類平面示意圖
依據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,SVM轉(zhuǎn)化研究過程為求解優(yōu)化問題,并通過對(duì)偶問題的相互轉(zhuǎn)換,最終求解函數(shù)為二次規(guī)劃方程的最大化如式(5)所示[15]:
采用拉格朗日算子求解最優(yōu)分類超平面,決策函數(shù)如式(6)所示:
DCS通過DA進(jìn)行數(shù)據(jù)的采集工作,其采樣時(shí)間間隔為1 s,首先選取目標(biāo)電廠的采樣數(shù)據(jù),并對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理??紤]到NOx排放在穩(wěn)定工況下波動(dòng)不大,本文選取啟動(dòng)工況下的數(shù)據(jù)進(jìn)行仿真預(yù)測。
根據(jù)數(shù)據(jù)的采集與機(jī)理分析,篩選引入模型的變量,鍋爐負(fù)荷(x1)、催化劑前O2含量(x2)、煙氣入口溫度及流量(x3~x4)、霧化風(fēng)流量(x5)、霧化風(fēng)流量調(diào)節(jié)閥閥位(x6)、催化劑前后溫度(x7~x8)、爐氨水流量及調(diào)節(jié)閥閥位(x9~x10)、加氨泵出口母管流量(x11)共11個(gè)輸入變量,催化劑入口NOx含量為輸出變量,最終篩選出720組代表性數(shù)據(jù),按時(shí)間序列的前500組數(shù)據(jù)用來對(duì)模型進(jìn)行訓(xùn)練,其余220組數(shù)據(jù)用來對(duì)模型進(jìn)行驗(yàn)證。
SPSS對(duì)原始數(shù)據(jù)進(jìn)行因子分析,基于特征值大于1時(shí)提取主成分,結(jié)果顯示可提取5個(gè)公因子,提取總載荷占全部數(shù)據(jù)份額的86.414%。提取5個(gè)公因子時(shí)的因子模型由式(7)求得:
把SPSS獲得的主成分矩陣輸入PSO-SVM預(yù)測模型,為消除變量之間量綱的影響,本文對(duì)數(shù)據(jù)采用歸一化處理,算法如式(9)所示:
式中:xi為變量的第i個(gè)值;珋xi為變量中第i個(gè)值標(biāo)準(zhǔn)化后的值。
SVM通過核函數(shù)將線性不可分的數(shù)據(jù)投影到高維空間,使其變得線性可分,最終轉(zhuǎn)換為最優(yōu)分類超平面的求法。此處選取最為常用的核函數(shù)徑向基函數(shù)如式(10)所示:
結(jié)果通過數(shù)據(jù)的擬合度(R2)和均方誤差(M)[16]表明:
式中:^yi和yi分別為N個(gè)樣本點(diǎn)集中第i樣本點(diǎn)對(duì)應(yīng)的目標(biāo)值和輸出值;珋y為N個(gè)輸出值的平均值。
PSO算法的參數(shù)初始化由文獻(xiàn)[17]與文獻(xiàn)[18]確定。
加速常數(shù)c1=c2=2;粒子群最大數(shù)量sizepop =20;最大進(jìn)化代數(shù)maxgen=1 000;最大飛翔速度v為3;速率更新公式中速度前面的彈性系數(shù)wV與種群更新公式中速度前面的彈性系數(shù)wP的初始值設(shè)為1;慣性因子w為0.6;參數(shù)c變化的最大值popcmax和最小值popcmin分別為100、0.01;參數(shù)g變化的最大值popgmax和最小值popgmin分別為1 000、0.01。
由上SPSS獲得的5個(gè)主成分Y1、Y2、Y3、Y4、Y5作為PSO-SVM輸入變量,催化劑前NOx含量為輸出變量。通過MATLAB仿真分析,模型對(duì)前500組訓(xùn)練樣本的擬合結(jié)果和對(duì)220組測試樣本的預(yù)測結(jié)果分別如圖3(a)、圖3(b)所示。結(jié)果顯示,混合SPSS-PSO-SVM模型在NOx預(yù)測方面具有一定的可行性,訓(xùn)練樣本和測試樣本的均方誤差分別為8.819 7×10-5和0.010 13,擬合度R2分別為0.999 41、0.912 6,顯然,訓(xùn)練樣本的擬合度要比測試樣本好。
圖3 混合SPSS-PSO-SVM模型實(shí)測值與預(yù)測值對(duì)比
PSO作為參數(shù)優(yōu)化的關(guān)鍵步驟,全局最優(yōu)解求取最優(yōu)適應(yīng)度,迭代次數(shù)為1 000,圖4表明,迭代次數(shù)為1 000時(shí),對(duì)應(yīng)最優(yōu)c和g的值分別為368.593 2和1.016 399。
圖4 適應(yīng)度曲線
把x1~x11變量作為PSO-SVM模型的輸入變量,以作為混合SPSS-PSO-SVM模型的比較模型,此PSO與上面混合模型具有相同初始參數(shù),保持原始變量輸入為唯一的變動(dòng)量,以得出SPSS獲得主成分的有效性。PSO-SVM模型仿真結(jié)果圖5所示,對(duì)于相同訓(xùn)練樣本和測試樣本的均方誤差分別為0.003 741 8和0.028 829,擬合度R2分別為0.975 09和0.762 85。表明SPSS獲取主成分在此刻對(duì)于提高NOx排放預(yù)測精度具有一定的必要性。
圖5 PSO-SVM模型實(shí)測值與預(yù)測值對(duì)比
依據(jù)某780 MW電廠鍋爐采集的原始數(shù)據(jù),通過SPSS中因子降維操作,并經(jīng)過轉(zhuǎn)換和計(jì)算得出主成分矩陣,把主成分矩陣作為PSO-SVM模型輸入變量,即通過粒子群優(yōu)化搜索全局最優(yōu)模型參數(shù),利用支持向量法仿真模擬,即為NOx排放的混合SPSS-PSO-SVM模型。對(duì)比于未經(jīng)主成分分析的PSO-SVM模型,結(jié)果表明通過SPSS獲取的主成分不僅降低輸入變量的維數(shù)和消除變量間的相關(guān)性,極大提高了運(yùn)算的速度,同時(shí)也提升了電廠NOx排放的預(yù)測精度。
[1]崔明,左明,宋偉.火電企業(yè)大氣污染物排放對(duì)環(huán)境危害及減排對(duì)策[J].科技與企業(yè),2016,(2): 93,95.
[2]梁懷濤.火電行業(yè)氮氧化物排放量預(yù)測研究[D].保定:華北電力大學(xué),2012.
[3]賈宏祿.鍋爐低氮燃燒改造與高溫腐蝕控制分析[J].電力科學(xué)與工程,2015,31(6):68-73.
[4]李昌海,馮慧山,田金海,等.串級(jí)前饋方法在SNCR煙氣脫硝系統(tǒng)上的應(yīng)用[J].自動(dòng)化與儀表,2016,31(2):47-49,53.
[5]劉芳,張德珍,趙文杰.電站鍋爐燃燒系統(tǒng)的神經(jīng)網(wǎng)絡(luò)建模[J].電力科學(xué)與工程,2010,26(6): 33-37.
[6]呂游,劉吉臻,楊婷婷,等.基于PLS特征提取和LS-SVM結(jié)合的NOx排放特性建模[J].儀器儀表學(xué)報(bào),2013,34(11):2418-2424.
[7]樊曉雪.最小二乘支持向量機(jī)的參數(shù)選擇[D].保定:河北大學(xué),2012.
[8]王雅彬,李曉敏,邊澤楠,等.基于支持向量機(jī)的電站鍋爐NOx排放軟測量模型[J].電力科學(xué)與工程,2012,28(4):55-59.
[9]陳榮超.燃煤電廠脫硝NOx的軟測量技術(shù)和自動(dòng)控制優(yōu)化[J].電力科學(xué)與工程,2015,31(1): 15-19.
[10]閻輝,張學(xué)工,李衍達(dá).支持向量機(jī)與最小二乘法的關(guān)系研究[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2001,41(9):77-80.
[11]李小勝,陳珍珍.如何正確應(yīng)用SPSS軟件做主成分分析[J].統(tǒng)計(jì)研究,2010,27(8):105-108.
[12]涂娟娟.PSO優(yōu)化神經(jīng)網(wǎng)絡(luò)算法的研究及其應(yīng)用[D].鎮(zhèn)江:江蘇大學(xué),2013.
[13]姜諳男,梁冰,張嬌.基于粒子群最小二乘支持向量機(jī)的瓦斯含量預(yù)測[J].遼寧工程技術(shù)大學(xué)學(xué)報(bào)(自然科學(xué)版),2009,28(3):363-366.
[14]李潤求,施式亮,念其鋒,等.基于PSO-SVM的煤礦瓦斯爆炸災(zāi)害風(fēng)險(xiǎn)模式識(shí)別[J].中國安全科學(xué)學(xué)報(bào),2013,23(5):38-43.
[15]吳禎祥.電站鍋爐NOx排放與效率混合建模及優(yōu)化研究[D].大連:大連理工大學(xué),2006.
[16]楊飛,盧保玲.基于主成分和貝葉斯正則化的NOx排放量的預(yù)測[J].熱力發(fā)電,2010,39(2): 24-27.
[17]郭梅.淺析PSO算法及其應(yīng)用研究[J].新疆農(nóng)墾科技,2015,38(12):56-58.
[18]孫衛(wèi)紅,童曉,李強(qiáng).改進(jìn)PSO優(yōu)化參數(shù)的LSSVM燃煤鍋爐NOx排放預(yù)測[J].?dāng)?shù)據(jù)采集與處理,2015,30(1): 231-238.
Application of the Hybrid Spss-pso-svm Model in NOxEmission Forecast of the Plant
BU Hongli,LI Yonghua
(School of Energy Power and Mechanical Engineering,North China Electric Power University,Baoding 071003,China)
Aiming at the prediction of NOxemission in power plant,this paper is devoted to optimizing the amount of ammonia spray in the out-of-stock system and preventing excessive or too little of the current NOxemission limit.In order to improve the prediction accuracy of NOxemission from power plant,an SPSS-PSO-SVM forecasting model is proposed.Data of power plant type being of various types,there are a great amount of correlation and coupling among variables.In view of this situation,the introduction of statistical software SPSS could make it more intuitive for observing and analyzing the correlation between variables.And by factor analysis,the main component matrix is calculated so as to reduce the input variable dimensions and eliminate the relevance.Based on the real-time data of a 780MW thermal power plant,the emission prediction is carried out through SPSS feature extraction and MATLAB simulation.Comparing the performance of the proposed model with that of PSO-SVM model,the effectiveness of the model in the prediction of NOxemission is verified in power plant.
SPSS feature extraction;particle swarm optimization;support vector machines;hybrid modeling;nitrogen oxide emissions
TP73
A
1672-0792(2017)07-0074-05
步紅麗(1991-),女,碩士研究生,研究方向?yàn)殡姀S污染物排放預(yù)測與控制技術(shù)研究;李永華(1968-),男,教授,研究方向?yàn)槿紵碚撆c技術(shù)、電廠節(jié)能技術(shù)、新能源利用技術(shù)等。
10.3969/j.ISSN.1672-0792.2017.07.013
2017-05-12。
國家自然科學(xué)基金(51276064)