申志文, 李慶偉
(上海電力大學(xué) 能源與機械工程學(xué)院, 上海 200090)
燃煤發(fā)電在我國乃至世界范圍內(nèi)仍然是一種重要的發(fā)電形式,而煤炭燃燒是NOx的主要來源之一[1-2]。為實現(xiàn)火力發(fā)電廠的超低排放,我國環(huán)保部門制定了嚴格的NOx排放標準[3]。燃燒優(yōu)化技術(shù)是一種簡單、高效、廉價的燃煤電廠NOx減排技術(shù),精準的NOx排放模型是燃燒優(yōu)化技術(shù)的基礎(chǔ)[4]。
鍋爐燃燒系統(tǒng)具有非線性和強耦合的性質(zhì),難以用機理建模的方法建立準確的NOx排放預(yù)測模型。隨著人工智能的興起,許多學(xué)者開始利用機器學(xué)習(xí)建立NOx排放預(yù)測模型,常用方法有人工神經(jīng)網(wǎng)絡(luò)[5-6]和支持向量機[7-8]。
HUANG G B等人[9]提出的極端學(xué)習(xí)機(Extreme Learning Machine,ELM)是一種重要的NOx排放預(yù)測建模方法。與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)相比,ELM具有泛化性能好、學(xué)習(xí)速度快、精度高等優(yōu)點[10]。目前,針對輸入權(quán)值和隱藏層閾值優(yōu)化的研究較多,常用的優(yōu)化方法有風(fēng)驅(qū)動算法[11]、混沌分組教與學(xué)優(yōu)化算法[12]、量子粒子群算法[13]。
朱志華等人[14]對非小細胞肺癌病人術(shù)后生存時間進行了預(yù)測分析,訓(xùn)練樣本數(shù)目分別為110,130,150。范宇辰[15]針對一種Benchmark分類問題,利用仿真實驗探討了訓(xùn)練樣本個數(shù)、隱藏層節(jié)點數(shù)、輸入層權(quán)值以及隱藏層節(jié)點偏置量4個重要參數(shù)對ELM分類器性能的影響程度。為了解決分類學(xué)習(xí)缺乏足夠的缺陷樣本的問題,MA L Y等人[16]提出了高斯混合模型密度估計的ELM,以檢測鋰離子聚合物電池的電池片中的氣泡缺陷,能夠在不同的訓(xùn)練樣本數(shù)量下保持優(yōu)異的精度性能。
火電廠NOx排放預(yù)測建模屬于多維、強耦合的復(fù)雜問題,目前尚未有ELM樣本特性分析的相關(guān)工作。本文在總樣本一定的前提下,研究了測試樣本數(shù)對NOx預(yù)測性能的影響,并尋找最佳的測試樣本數(shù)。
ELM通過隨機產(chǎn)生的輸入權(quán)值和隱藏層閾值,利用最小二乘法和M-P廣義逆矩陣求解輸出權(quán)值。其網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 ELM網(wǎng)絡(luò)結(jié)構(gòu)示意
對ELM的描述如下。
k=1,2,3,…,N
(1)
b——隱藏層各節(jié)點的閾值矩陣,b=[b1,b2,…,bl]T。
式(1)可以簡化為
Hβ=T
(2)
(3)
β=H+T
(4)
式中:H——隱藏層輸出矩陣;
β——輸出權(quán)值矩陣,β=[β1,β2,…,βl]T;
T——N×1維的目標輸出據(jù)陣,T=[t1,t2,…,tN]T。
ELM的學(xué)習(xí)步驟可總結(jié)如下:首先,設(shè)置激活函數(shù)和隱藏層節(jié)點數(shù);其次,隨機生成輸入權(quán)值和隱藏層閾值;再次,利用式(3)計算隱藏層輸出矩陣H;最后,利用式(4)計算輸出權(quán)值矩陣。
訓(xùn)練樣本數(shù)過多會影響預(yù)測模型的訓(xùn)練速度,數(shù)量過少則會影響預(yù)測模型的性能。本文基于ELM建立預(yù)測模型,研究在總樣本數(shù)目一定的條件下,測試樣本數(shù)目對預(yù)測性能的影響。選擇測試集均方根誤差(Root Mean Squared Error,RMSE),即預(yù)測樣本RMSE作為性能指標,公式為
(5)
預(yù)測樣本的特性研究具體步驟如下:
(1) 設(shè)置隱藏層節(jié)點數(shù)和激活函數(shù)類型等神經(jīng)網(wǎng)絡(luò)參數(shù);
(2) 根據(jù)不同測試樣本數(shù)劃分訓(xùn)練集和測試集;
(3) 利用訓(xùn)練集訓(xùn)練ELM模型;
(4) 利用訓(xùn)練好的ELM模型對訓(xùn)練集和測試集樣本進行預(yù)測;
(5) 計算訓(xùn)練集和測試集樣本的RMSE;
(6) 返回步驟3,直到實驗次數(shù)達到31次;
(7) 計算當(dāng)前測試集樣本數(shù)下測試樣本中位數(shù)RMSE;
(8) 返回步驟2,直到測試樣本數(shù)達到最大值;
(9) 根據(jù)不同測試集樣本數(shù)下測試樣本中位數(shù)RMSE,選出最優(yōu)測試樣本數(shù)。
上述研究方法的流程如圖2所示。
圖2 基于ELM的預(yù)測樣本特性研究流程
采用文獻[17]中的數(shù)據(jù),對330 MW電站鍋爐進行實驗。選取負荷、給煤機轉(zhuǎn)速、一次風(fēng)速、二次風(fēng)速、排煙氧量、燃盡風(fēng)擋板開度和煤質(zhì)等26個參數(shù)進行變工況實驗,工況1~工況3、工況4、工況5~工況6,工況7~工況14和工況15~工況20分別燃用不同的煤種。
ELM的隱藏層激活函數(shù)為sig函數(shù),隱藏層節(jié)點的數(shù)量設(shè)置為30,分別選取不同數(shù)目的測試樣本重復(fù)實驗31次。
測試樣本中位數(shù)RMSE隨樣本個數(shù)的變化趨勢如圖3所示。由圖3可以看出,隨著測試樣本數(shù)的增加,測試樣本中位數(shù)RMSE整體呈現(xiàn)增長的趨勢,當(dāng)測試樣本數(shù)為2個時,測試樣本中位數(shù)RMSE最小,此時,訓(xùn)練樣本數(shù)為18個。
圖3 測試樣本中位數(shù)RMSE隨樣本數(shù)的變化趨勢
為進一步研究樣本數(shù)目對預(yù)測性能的影響,對31次預(yù)測樣本RMSE進行觀察。預(yù)測樣本RMSE隨測試樣本數(shù)目變化趨勢如圖4所示。對于訓(xùn)練集,測試樣本數(shù)目的影響較小,均能達到較好的預(yù)測效果;而對于測試集,隨著測試樣本數(shù)的增加,訓(xùn)練樣本數(shù)減少,RMSE呈明顯增大的趨勢。當(dāng)測試樣本數(shù)為2個時,預(yù)測樣本RMSE整體較小,且波動范圍相對較小。
圖4 31次實驗預(yù)測樣本RMSE隨測試樣本數(shù)的變化趨勢
當(dāng)測試樣本數(shù)為2個時,對訓(xùn)練樣本和測試樣本進行預(yù)測,其預(yù)測絕對誤差結(jié)果如圖5所示。其中,樣本編號1和2的樣本為測試樣本。由圖5可以看出,模型在訓(xùn)練樣本上的預(yù)測性能較好,在測試樣本上的誤差也較為理想,但泛化性能還存在進一步提升的空間。
圖5 測試樣本數(shù)為2個的31次實驗預(yù)測絕對誤差分布
電廠鍋爐燃燒優(yōu)化的關(guān)鍵是建立準確的預(yù)測模型。本文建立了基于ELM的NOx排放預(yù)測模型,并研究了不同測試樣本數(shù)對該模型性能的影響。實驗結(jié)果表明,隨著測試樣本數(shù)的增加,測試樣本中位數(shù)RMSE整體呈現(xiàn)增長的趨勢。當(dāng)測試樣本數(shù)為2個時,預(yù)測的測試樣本中位數(shù)RMSE最佳,預(yù)測樣本RMSE整體較小,且波動范圍相對較小,但模型的泛化性能還存在進一步提升的空間。