王祖林,韓 碩,康俊杰,李云飛,藕泉江
(1.河北國華定州發(fā)電有限責任公司,定州073000;2.華北電力大學 控制與計算機學院,北京102206;3.北京達華潔能工程技術有限公司,北京100029)
我國主要的發(fā)電形式是燃煤發(fā)電,煤炭燃燒產生的主要污染物為氮氧化合物,因此控制污染物的排放對生態(tài)環(huán)境以及人民的健康尤為重要。NOx排放預測是鍋爐燃燒和選擇性催化還原(SCR)、煙氣脫硫(FGD)等排放控制設備運行中的一項重要技術,近年來一直受到研究者的關注[1-4]。由于SCR 脫硝系統(tǒng)入口NOx濃度測量具有一定的滯后特性,如果能夠提前準確預測NOx排放的入口濃度,建立精確的預測模型,就能夠為實現(xiàn)燃燒優(yōu)化與噴氨量的超前調節(jié)打下基礎[5],進而保證NOx排放濃度始終保持在較低的水平,提高運行系統(tǒng)的穩(wěn)定性。
目前,國內外燃煤電站都采用選擇性催化還原脫硝技術, 但由于SCR 系統(tǒng)具有很強的非線性,在負荷頻繁變動時,難以精確控制NOx的排放。機理建模由于過程復雜,模型精度較低。隨著人工智能大數(shù)據(jù)技術的發(fā)展,數(shù)據(jù)驅動模型越來越受到工業(yè)界的關注[6-7]。模型的建立包括數(shù)據(jù)的處理、變量的選擇和學習網(wǎng)絡的建立,文獻[8]將可能性模糊C 均值聚類算法應用于電力負荷數(shù)據(jù)檢測與修正過程中,對數(shù)據(jù)中的異常數(shù)據(jù)進行檢測和修正;文獻[9]結合SRCKF 和移動窗口法提出了一種自適應容積卡爾曼濾波方法,針對參數(shù)數(shù)據(jù)存在不同噪聲統(tǒng)計特性的特點, 移動窗口法實時估計噪聲的協(xié)方差陣,校正參數(shù)的濾波結果;文獻[10]采用遺傳算法對SCR 系統(tǒng)運行數(shù)據(jù)進行主元分析選出主要獨立變量,建立廣義回歸神經網(wǎng)絡,得到SCR 系統(tǒng)的GAGRNN 模型, 但是該模型沒有考慮歷史時序對當前時刻的影響。
為此,本文首先利用滑動平均法對原始數(shù)據(jù)進行去噪,然后基于隨機森林算法分析變量間的相互關系,從37 個輸入變量中選出20 個相關度高的變量,去除冗余變量,最后利用深度學習Bi-LSTM 建立了某電廠660 MW 電站鍋爐燃燒系統(tǒng)SCR 入口動態(tài)的NOx濃度預測模型。該模型充分利用歷史信息,并能夠實現(xiàn)動態(tài)建模,結果表明相較于傳統(tǒng)數(shù)據(jù)模型該模型擬合效果好、預測精度高,并與其他幾種模型進行對比分析,驗證了模型的有效性。
本文采用某660 MW 電廠的歷史數(shù)據(jù),為了提高預測模型的預測精度,需要對數(shù)據(jù)進行降噪預處理。采用滑動窗口平均法對原始數(shù)據(jù)進行預處理,滑動平均相當于低通濾波,在數(shù)據(jù)展開圖中選定某一尺寸的窗口,將窗口內的所有異常值做算術平均,將所求的平均值作為窗口中心點的異常值。按照點距或線距移動窗口,重復此平均方法,直到對全部數(shù)據(jù)完成上述過程。
滑動窗口平均方法是沿全長度為N 的數(shù)據(jù),不斷地逐個滑動地取m 個相鄰數(shù)據(jù)作加權平均來表示平滑數(shù)據(jù),其一般算式為
式中:m=p-q;Wi為權系數(shù),且其和為1。
處理結果如圖1~圖4 所示,列舉了發(fā)電機有功功率、預熱器煙道入口處后墻壓力、給煤機給煤量、鍋爐氧量這4 個主要因變量的原始數(shù)據(jù)以及處理后的數(shù)據(jù)。
圖1 發(fā)電機有功功率數(shù)據(jù)處理前后對比Fig.1 Comparison before and after processing of generator active power data
圖2 空預器入口壓力數(shù)據(jù)處理前后對比Fig.2 Comparison of air preheater inlet pressure data before and after processing
圖3 給煤機給煤量數(shù)據(jù)處理前后對比Fig.3 Comparison of coal feeder data before and after processing
圖4 鍋爐氧量數(shù)據(jù)處理前后對比Fig.4 Comparison of boiler oxygen data before and after processing
根據(jù)燃燒機理分析,SCR 入口NOx的生成主要受風量、煤量及配風方式等的影響。數(shù)據(jù)建模的輸出是SCR 反應器A 進口NOx濃度,與輸出的相關的自變量包括發(fā)電機有功功率、總煤量、各層二次風門擋板開度閥門指令、給煤機給煤量及磨煤機一次風流量等37 個變量。
隨機森林在模型輸入變量選擇方面應用廣泛,本文使用基尼指數(shù)衡量每個變量對目標變量的貢獻大小,變量重要性評分用VIM 表示,基尼指數(shù)用GI 表示。假設有c 個特征b1,b2,b3,…,bc,則每個特征bn的基尼指數(shù),即第n 個特征在隨機森林所有決策樹中節(jié)點不純度的平均改變量表示為
式中:k 為類別個數(shù);Pnk表示類別k 在節(jié)點n 中所占的比例大小。
特征bn在節(jié)點c 分支前后的基尼指數(shù)變化量用下式表示:
式中:GIl和GIr分別為分枝后生成的兩個新節(jié)點的基尼指數(shù)。
假設特征bn在決策樹i 中出現(xiàn)的節(jié)點屬于集合M,則特征bn在第i 棵樹的重要程度表示為
如果隨機森林中共有L 棵樹,則:
通過保持變量個數(shù)不變,改變生成樹數(shù)量的方法, 使用隨機森林算法對37 個相關變量進行重要性評分,進而選出合適的輸入變量。
LSTM 神經網(wǎng)絡由Hochreiter 等提出,在RNN的基礎上考慮數(shù)據(jù)的時序特性, 其引入了門控單元,解決了網(wǎng)絡訓練過程中梯度消亡的問題。LSTM單元結構如圖5 所示。
圖5 LSTM 結構圖Fig.5 Architecture of LSTM
每個單元結構中都包含有輸入門、 輸出門、遺忘門,這三個結構通過非線性活函數(shù)對輸入的信息選擇性通過或者遺忘,同時確定新輸入有多少通過或遺忘,這取決于信息的價值含量。這些確保了有效信息的傳遞。遺忘門控制前一時刻單元結構狀態(tài)信息ct-1的保留程度, 輸入門決定了當前時刻單元結構的輸入ht-1有多少保留到當前單元狀態(tài)c1,輸出門控制當前單元狀態(tài)ct有多少輸出到單元結構的當前輸出ht。LSTM 單元結構三個門的公式如下:
遺忘門對應的函數(shù)式:
輸入門對應的函數(shù)式:
輸出門對應的函數(shù)式:
式中: ft、it、ot分別為遺忘門、輸入門、輸出門的輸出;w 和b 分別為權重矩陣和偏置項。
單元結構的當前狀態(tài)為
單元結構的當前輸出為
Bi-LSTM 網(wǎng)絡是由2 層LSTM 網(wǎng)絡通過反向連接構成的,可以充分提取各個輸入數(shù)據(jù)序列間的關聯(lián)關系及序列自身的前向以及反向關聯(lián)關系,最終得到輸入時間序列與SCR 入口NOx濃度的映射關系,其結構如圖6 所示。
圖6 Bi-LSTM 結構圖Fig.6 Architecture of Bi-LSTM
構建一個如圖7 所示的4 層神經網(wǎng)絡,包括輸入層、Bi-LSTM 層、全連接層、輸出層。將序列輸入圖層的大小指定為輸入數(shù)據(jù)的特征數(shù)量。將全連接層的大小指定為響應數(shù)。指定Bi-LSTM 層有200 個隱含單元。將求解器設置為adam,并進行300 輪訓練。為了防止梯度爆炸,將梯度閾值設置為1。
圖7 Bi-LSTM 網(wǎng)絡結構圖Fig.7 Bi-LSTM network structure diagram
本文研究對象為某電廠超臨界660 MW 燃煤機組,鍋爐為超臨界參數(shù)變壓運行的直流爐,四角切向燃燒方式、一次中間再熱、單爐膛平衡通風、固態(tài)排渣、半露天布置、爐前低封、全鋼構架,配用中速磨煤機正壓直吹式制粉系統(tǒng)。
為了使訓練數(shù)據(jù)具有廣泛的表示性,為了體現(xiàn)深度神經網(wǎng)路的優(yōu)勢,從所研究電廠的分散控制系統(tǒng)(distributed control system,DCS)中采集了46800個大數(shù)據(jù)樣本,對基于Bi-LSTM 的NOx排放模型進行了訓練和測試。采樣間隔為15 s,采樣時間覆蓋了所研究鍋爐8 天的運行歷史數(shù)據(jù)。為了保證訓練集和測試集都包含不同的運行工況,避免不同樣本分布對模型精度和通用性的影響。樣本數(shù)據(jù)分為兩部分,將前70%的數(shù)據(jù)設置為訓練數(shù)據(jù)集,剩余30%設置為測試數(shù)據(jù)集。結合現(xiàn)場測點的具體情況,總共確定了37 個操作變量作為基于Bi-LSTM 的NOx排放模型的原始輸入變量。利用隨機森林算法得到這些變量的重要性柱狀圖,如圖8 所示。
將基于隨機森林的變量重要性評估的評分閾值設為2,分數(shù)高于2 的變量可作為模型訓練網(wǎng)絡的輸入變量。經過分析,選擇其中20 個變量,如表1所示。
圖8 原始變量重要性柱狀圖Fig.8 Histogram of importance of original variables
表1 輸入變量及其變化范圍Tab.1 Input variables and their range of variation
基于Bi-LSTM 方法模型預測SCR 入口NOx濃度的框架結構如圖9 所示。
圖9 基于Bi-LSTM 的NOx 排放預測框架圖Fig.9 Block diagram of NOx emission prediction based on Bi-LSTM
電站鍋爐煤粉燃燒過程中生成的NOx大多以燃料型和熱力型為主,并且NOx的生成不僅僅由當前時刻的運行輸入量單獨決定的,而是受之前一段時間內運行輸入量的累積影響。穩(wěn)態(tài)模型通常只考慮當前時刻的系統(tǒng)輸入和輸出關系, 不能描述NOx生成的動態(tài)特性。電站鍋爐負荷頻繁變動,長期處于變工況運行狀態(tài),穩(wěn)態(tài)模型的預測精度將大大下降。相比之下,動態(tài)模型考慮了系統(tǒng)輸入和輸出的時間序列影響,對真實對象的動態(tài)特性具有更好的解釋能力,更能反映系統(tǒng)的動態(tài)變化特性。根據(jù)NOx機理和現(xiàn)場測量的遲滯情況,本文利用X(t)、X(t-1)、X(t-2)、X(t-3)等時序輸入建立SCR 脫硝系統(tǒng)入口NOx質量濃度的動態(tài)模型。為了驗證數(shù)據(jù)動態(tài)模型的準確性,本文分別采用BPNN 建立NOx排放的動態(tài)模型和核偏最小二乘(kernel partial least squares,KPLS)方法建立的靜態(tài)模型作為對比。圖10 為基于動態(tài)的Bi-LSTM 的SCR 反應器入口NOx質量濃度的模型的訓練結果及與其他模型的對比圖, 圖11為測試結果的對比圖。
圖10 Bi-LSTM、BPNN 及KPLS 的NOx 模型訓練結果對比圖Fig.10 Comparison diagram of NOx model training results of BI-LSTM,BPNN and KPLS
圖11 Bi-LSTM、BPNN 及KPLS 的NOx 模型測試結果對比圖Fig.11 Comparison diagram of NOx model training results of BI-LSTM,BPNN and KPLS
由圖10、圖11 可知,基于Bi-LSTM 和BPNN 的動態(tài)模型要比KPLS 建立的靜態(tài)模型預測的效果要好,深度神經網(wǎng)絡要比淺層的神經網(wǎng)絡建立的模型準確性高。值得一提的是,當樣本量不充足或者樣本覆蓋工況不完整時, 會影響數(shù)據(jù)模型的準確度。為了說明本文所提方法的泛化能力,所選測試數(shù)據(jù)的范圍要大于訓練數(shù)據(jù)的范圍。這時KPLS 靜態(tài)模型存在著嚴重的模型失效問題,動態(tài)的BPNN 模型表現(xiàn)的好于靜態(tài)KPLS,而動態(tài)Bi-LSTM 泛化能力明顯高于前兩者。因此,基于動態(tài)深度神經網(wǎng)路建立的預測模型也具有較好的泛化能力。模型的評價指標采用均方誤差平方根(rooted mean squared error,RMSE)和平均絕對百分比誤差(mean absolute percentage,MAPE)。RMSE 和MAPE 的計算公式如下:
式中:yi為實際SCR 入口NOx濃度;模型預測值;n 為序列的總樣本數(shù)。
具體的對比數(shù)值如圖12、圖13 所示。比較三種模型的擬合和預測效果,KPLS 靜態(tài)模型對于訓練樣本的擬合效果很好RMSET=4.88 mg/m3,但是對于測試樣本的預測精度較低RMSEP=22.3 mg/m3,模型泛化能力有限。動態(tài)BPNN 模型雖然預測精度比KPLS 效果要好,但是擬合誤差和預測誤差還是比較大。基于動態(tài)的Bi-LSTM 模型的擬合和預測效果都較好,訓練樣本RMSET=5.21 mg/m3,測試樣本RMSEP=6.08 mg/m3, 模型反映了NOx排放模型隨負荷波動的動態(tài)過程。
圖12 不同模型的RMSE 對比Fig.12 RMSE comparison of different models
圖13 不同模型的MAPE 對比Fig.13 MAPE comparison of different models
為了測試本文提出方法的有效性,在該電廠實際安裝調試本文提出的預測方法。經過一段時間的平穩(wěn)運行后, 從DCS 中截取某時刻SCR 脫硝系統(tǒng)A、B 兩側預測的NOx質量濃度與實際運行測試曲線的對比圖,如圖14、圖15 所示。
圖14 A 側預測NOx 濃度與實際運行曲線對比Fig.14 Comparison of predicted NOx concentration and actual operation curve on A side
圖15 B 側預測NOx 濃度與實際運行曲線對比Fig.15 Comparison of predicted NOx concentration and actual operation curve on B side
從實際投運該方法后的曲線對比圖可知,本文提出的方法可以較準確的跟蹤實際運行曲線,在現(xiàn)場可以很好地預測NOx趨勢,為提前預測及進一步噴氨優(yōu)化的實施提供了平臺。
為了提高SCR 脫硝系統(tǒng)入口NOx排放濃度模型的精度,為進一步實施精準噴氨控制打下基礎。本文在利用滑動窗口平均濾波法對原始數(shù)據(jù)進行濾波去噪,并采用隨機森林算法對輸入變量進行特征選擇,進而提出了一種基于Bi-LSTM 網(wǎng)絡的動態(tài)NOx排放的建模方法。在該模型下對某電廠660 MW 超臨界燃煤電站鍋爐實際運行數(shù)據(jù)進行處理仿真,并與動態(tài)淺層神經網(wǎng)絡BPNN 模型和靜態(tài)KPLS 模型進行對比,結果表明本文進行的數(shù)據(jù)處理和隨機森林變量選擇可以降低模型的復雜度,提出的Bi-LSTM動態(tài)模型精度較高,并有效地提高了模型的泛化能力。