孫宇航, 田 亮
(華北電力大學 控制與計算機工程學院,河北 保定 071003)
據(jù)《中國電力行業(yè)年度發(fā)展報告2021》數(shù)據(jù)顯示,截至2020年底,全國全口徑發(fā)電裝機容量220 204萬kW,比上年增長9.6%。其中火電124 624萬kW,占比56.6%,比上年增長4.8%(煤電107 912萬kW,比上年增長3.7%)。雖然我國處于能源結構轉型的關鍵時期,但在可預見的時間里,國內(nèi)發(fā)電主力形式仍然是燃煤機組火力發(fā)電[1]。因此,如何實現(xiàn)電站鍋爐的高效率、低污染燃燒,對能源與環(huán)境的和諧發(fā)展具有重要意義。
燃燒調(diào)整實驗通常在3個典型負荷660 MW、500 MW、330 MW下進行(以660 MW鍋爐為例)。通過調(diào)整氧量、一次風風壓、二次風門開度等,探究可調(diào)參數(shù)變化對鍋爐燃燒效率及NOx等污染物排放產(chǎn)生的影響。但由于鍋爐燃燒存在變煤質(zhì)、變工況、深調(diào)峰等復雜情況,僅針對個別典型負荷進行燃燒優(yōu)化調(diào)整實驗會缺失大量燃燒過程中的關鍵信息,若對所有工況進行燃燒優(yōu)化調(diào)整實驗,燃燒優(yōu)化成本則會大幅增加[2]。考慮到鍋爐運行過程中積累了海量歷史數(shù)據(jù),蘊含著適合機組真實特性的參數(shù)“場景”及運行人員的調(diào)整經(jīng)驗,因此出現(xiàn)了對海量機組歷史運行數(shù)據(jù)進行優(yōu)化參數(shù)挖掘的方法。劉曉鵬[3]采用RBF神經(jīng)網(wǎng)絡基于滾動化形成實現(xiàn)了對歷史數(shù)據(jù)的優(yōu)化調(diào)制、優(yōu)化分析與測算過程;鄭偉[4]等采用約束模糊關聯(lián)規(guī)則算法對數(shù)據(jù)進行模糊處理,再通過FCM算法劃分模糊處理后的數(shù)據(jù)從而實現(xiàn)聚類過程;吳坡[5]等通過改進最小二乘法、極大似然法等方法通過算法從歷史數(shù)據(jù)中辨識出鍋爐的特征運行狀態(tài),選取特征狀態(tài)參數(shù)指導燃燒優(yōu)化;周小朋[6]采用粗糙集和屬性簡約算法找出了與鍋爐NOx排放量高度相關且去除冗余信息的可調(diào)整優(yōu)化參數(shù),采用Apriori算法,并將CA算法引入到模糊關聯(lián)規(guī)則中,挖掘出用于指導鍋爐低NOx排放的規(guī)則;張尚志[7]等通過采用改進置信區(qū)間判別相結合的滑動判別算法確定不同工況下的穩(wěn)態(tài)數(shù)據(jù),并以穩(wěn)態(tài)數(shù)據(jù)為指導控制二次風配風方式從而實現(xiàn)燃燒優(yōu)化;李建強[8]利用粒子群優(yōu)化Apriori算法,挖掘精簡后的數(shù)據(jù)庫中符合機組NOx減排要求的各個參數(shù)的最優(yōu)參考工況作為燃燒優(yōu)化的指導數(shù)據(jù)。目前火電機組燃燒優(yōu)化研究方法大多著重于利用智能優(yōu)化算法建立燃燒模型并求解復雜的非線性問題,但當機組負荷頻繁波動時,基于進化算法的優(yōu)化方法在穩(wěn)定性和響應速度方面往往不能達到很好的效果,且算法中存在隱式規(guī)律,不能直觀的展示。采用算法針對全工況進行數(shù)據(jù)分析得到的結果雖然具體,但由于數(shù)據(jù)量過大,導致工程實踐過程中指導意義不強。
本文從工程應用角度出發(fā),設計一種基于數(shù)據(jù)挖掘工況聚類的燃燒優(yōu)化方法。在對鍋爐海量歷史運行數(shù)據(jù)進行工況劃分并剔除離群點基礎上,采用KPCA-K-means++數(shù)據(jù)挖掘方法對各工況穩(wěn)態(tài)歷史數(shù)據(jù)進行數(shù)據(jù)降維、聚類,聚類結果能夠能精準、凝練、直觀地反映鍋爐燃燒在不同工況下鍋爐燃燒控制規(guī)律,根據(jù)聚類結果將每種工況控制參數(shù)劃分出:鍋爐效率最優(yōu)、NOx排放最優(yōu)、鍋爐效率和NOx排放均衡三種燃燒優(yōu)化模式。針對GHJJ電廠海量歷史數(shù)據(jù)進行KPCA-Kmeans++數(shù)據(jù)挖掘,得到典型工況下二次風門優(yōu)化參數(shù),能夠滿足燃燒優(yōu)化在線指導的實際需要,實現(xiàn)多目標燃燒優(yōu)化。
PCA即主成分分析法,是一種統(tǒng)計分析、簡化數(shù)據(jù)集的方法。采用該算法能盡可能保留原本數(shù)據(jù)結構分布,并在最小均方條件下進行最能代表原始數(shù)據(jù)的投影查找,從而在特征空間中實現(xiàn)數(shù)據(jù)降維。采用該算法能夠?qū)υ紨?shù)據(jù)進行線性變換,根據(jù)方差變化依次建立新坐標系,將數(shù)據(jù)轉換到新坐標系中。主成分分析法可以同時實現(xiàn)數(shù)據(jù)提取和去冗降維,使得數(shù)據(jù)結構更加簡單[9]。
通過對PCA進行改進即可得到核主成分分析法(KPCA)算法。KPCA方法可以避免遇到特征向量線性不可分的問題,不僅適合解決線性問題,而且能提供比PCA更多的特征數(shù)目,可以最大限度地提取特征信息。KPCA算法采用非線性的方式對其主成分進行合理提取[10,11]。使用算法前需要對所有樣本進行合理的非線性轉換:
xk→φ(xk)
(1)
式中:xk表示第k個樣本。
將所有樣本轉換至高維空間F中,數(shù)據(jù)樣本協(xié)方差矩陣為
(2)
協(xié)方差矩陣C的特征向量V與特征值λ滿足:
λV-CV=0
(3)
代入非線性函數(shù)φ(xk)可得
λφ(xk)V-Cφ(xk)V=0
(4)
將協(xié)方差矩陣特征向量由非線性函數(shù)表示為
(5)
引入核函數(shù)
Kij=K(xi,xj)=φ(xi)φ(xj)
(6)
將公式(3)、(5)代入公式(4)中得到
mλα-Kα=0
(7)
式中:α表示核函數(shù)矩陣K的特征向量。
對任意樣本數(shù)據(jù),在高維空間F中非線性函數(shù)φ(x)的投影表示:
(8)
進行核主成分分析時,保證累計貢獻率的值大于85%可以確保損失的信息不至于太多,也能夠達到減少變量、簡化數(shù)據(jù)結構的目的,便于提取出反映工業(yè)系統(tǒng)整體過程的前k個主成分。選擇累計貢獻率大于85%的影響因素替代原有全部影響因素,即
(9)
式中:s表示滿足該條件影響因素的數(shù)量[12,13]。
上述計算過程均在滿足:
(10)
(11)
式中:L表示m×m階系數(shù)為1/m的矩陣。
目前可選擇的核函數(shù)類型較多,本次實驗選取徑向基核函數(shù):
(12)
Kmeans是一種經(jīng)典的基于劃分的聚類算法,其目標是將對象集劃分為若干個簇,使得簇內(nèi)對象間的相似度較高,而簇間對象的相似度較。Kmeans++對Kmeans算法隨機選取初始聚類中心進行了改進,該方法并不是隨機地給出若干個初始聚類中心,而是先隨機選取一個點作為第一個初始聚類中心,然后計算所有點到該聚類中心的距離,接著依據(jù)“聚類中心相互之間距離越遠越好”的樸素原則[12],選取新的聚類中心,不斷重復,直到選出k個聚類中心,最后將這些聚類中心作為初始聚類中心來運行Kmeans通過計算與距離占比相關的概率逐一選取新的初始聚類中心,直到最后選取k個初始聚類中心[13-18]。Kmeans++算法過程如下:
(1)隨機選取一個樣本作為初始聚類中心x1,即X=x1;
(2)計算出每個樣本點的x到與其最近的聚類中心的距離D(x);
(3)每個樣本點被選為新的聚類中心的概率P:
(13)
(4)重復計算2、3兩步,直至選出K個初始聚類中心;
(5)采用計算出的K個初始聚類中心運行Kmeans聚類算法。
算法框架如圖1所示。
圖1 Kmeans++算法框圖
本文以GHJJ電廠5號660 MW超超臨界機組四角切圓燃燒鍋爐為例,對預處理后的鍋爐燃歷史運行數(shù)據(jù)采用KPCA和Kmeans++進行降維處理及聚類分析,過程如圖2所示。從電廠DCS系統(tǒng)中采集2個月的全工況歷史運行數(shù)據(jù)進行預處理后,根據(jù)工況劃分結果整理出194 467組運行數(shù)據(jù),每組運行數(shù)據(jù)包含110種運行參數(shù),部分數(shù)據(jù)見表1。
表1 部分ABCDEF工況數(shù)據(jù)
圖2 PCA-Kmeans++數(shù)據(jù)挖掘系統(tǒng)流程圖
由于在不同的工況下鍋爐燃燒過程會表現(xiàn)出不同的特性,因此需要選擇一個參數(shù)作為工況劃分的標準。本文以6臺磨的起磨方式進行工況劃分,會出現(xiàn)64種6臺磨的排列組合結果。機組運行規(guī)程要求運行過程中保持至少三臺磨運行且四角切圓燃燒方式不得出現(xiàn)燃燒器隔2層燃燒。按照上述要求剔除非法起磨方式后采用細分網(wǎng)格化的拼法,可以得到31種合法起磨方式,再根據(jù)起磨方式在燃燒過程中出現(xiàn)的時間及電廠的實際運行情況可劃分為典型工況、常見工況、少數(shù)工況,如表2所示。
表2 合法工況及分類
由于分析的工況太多且每個工況下得到的控制規(guī)律不盡相同,所體現(xiàn)的數(shù)據(jù)規(guī)律性差,對燃燒系統(tǒng)的指導意義不能有效體現(xiàn)??紤]到火電機組對象特性并不具有非此即彼的性質(zhì),且不同工況之間往往存在一定的關聯(lián),若能將挖掘后的大量數(shù)據(jù)更準確、更精煉地呈現(xiàn),使其有規(guī)律可循,那么挖掘后的數(shù)據(jù)對燃燒優(yōu)化更具有指導意義[19-21]。相較于典型工況和常見工況,少數(shù)工況在鍋爐運行過程中所出現(xiàn)的時間短,對鍋爐燃燒優(yōu)化的指導意義不強,為了找出盡可能精煉、準確的規(guī)律,在后續(xù)降維、聚類分析過程中不再對少數(shù)工況進行討論,防止挖掘的數(shù)據(jù)規(guī)律復雜化。排除少數(shù)工況后可得到ABC、ABCD、ABCDE、ABCDEF、ABD、ABCE、ABDEF、ACDEF、BCDE、ABCDF、BCDEF,共11組對鍋爐燃燒過程具有代表性的運行工況控制參數(shù)。
過程參數(shù)的選取是實現(xiàn)燃燒優(yōu)化的重要內(nèi)容。過程參數(shù)選取過多,會導致控制規(guī)律復雜且不直觀;過程參數(shù)選取過少則會導致優(yōu)化過程不夠精確。這里將過程參數(shù)分為三類:可調(diào)參數(shù)、不可調(diào)參數(shù)和優(yōu)化參數(shù)。根據(jù)現(xiàn)場取得的實際運行數(shù)據(jù),作如下分類,如表3所示。
表3 過程參數(shù)分類
上述過程參數(shù)在鍋爐運行歷史數(shù)據(jù)中共包含110種參數(shù),顯然數(shù)據(jù)種類過于復雜,不利于發(fā)現(xiàn)主要運行參數(shù)與性能指標之間的關聯(lián)關系。因此采用KPCA對典型工況和常見工況穩(wěn)態(tài)下110種參數(shù)進行降維處理,找出能包含所有過程參數(shù)85%以上信息的特征參數(shù)。
通過對表4的數(shù)據(jù)進行分析可以發(fā)現(xiàn),前29個參數(shù)的累積貢獻率已經(jīng)超過85%,因此在接下來的研究中可以使用前29個特征參數(shù)作為下一步Kmeans++聚類的對象。另外,通過對原始數(shù)據(jù)進行分析可以發(fā)現(xiàn)在使用KPCA降維的過程中,可以最大程度的保留原始數(shù)據(jù)的基本信息,進而實現(xiàn)不同過程參數(shù)的降維處理,即將原有的110個過程參數(shù)減少至29個,使過程參數(shù)之間的冗余性降低,為后續(xù)聚類分析奠定基礎。
表4 過程參數(shù)特征值和累計貢獻率
對KPCA降維處理后確定的過程參數(shù)分別按11種工況進行聚類分析,找出不同工況下隱含的控制規(guī)律。實驗表明,聚類迭代次數(shù)為29次時可滿足所有工況聚類結果收斂。為了評價與衡量聚類的結果的好壞,需要指定統(tǒng)一的評價指標,這里采用業(yè)界比較常用的DBI指標作為評價標準:
(14)
式中:i、j為任意兩類別的類內(nèi)距離平方和;ci、cj表示第i、j個聚類中心。DBI越小意味著類內(nèi)距離越小,同時類間距離越大。所有聚類結果DBI指數(shù)經(jīng)計算均小于0.7,已實現(xiàn)較好的聚類效果。
通過分析聚類結果可將每個工況分出三種模式,模式1:NOx排放最優(yōu);模式2:鍋爐效率最優(yōu);模式3:鍋爐效率和NOx排放均衡。按照每種工況下三種模式的劃分方式可得到表5所示典型工況二次風擋板開度聚類結果參數(shù)表。
表5 部分典型工況二次風擋板開度聚類結果參數(shù)表
在GHJJ電廠5號機組鍋爐上進行KPCA-Kmeans++數(shù)據(jù)挖掘燃燒優(yōu)化實驗。該機組為660 MW參數(shù)變壓運行螺旋管圈直流爐,爐型為一次再熱四角切圓型鍋爐,配置磨煤機6臺。KPCA-Kmeans++分析數(shù)據(jù)取自機組2021年7月至8月的歷史運行數(shù)據(jù),共計26萬7千組數(shù)據(jù),經(jīng)過聚類分析得到11種典型工況控制參數(shù)規(guī)律。
在磨組合為ABCDE工況下,考慮到現(xiàn)場應用需要,在表5聚類結果基礎上對二次風擋板數(shù)據(jù)做近似處理,優(yōu)化系統(tǒng)二次風擋板開度輸入?yún)?shù)如表6所示。機組應用優(yōu)化參數(shù)2小時后,得到NOx排放、鍋爐效率運行數(shù)據(jù),并與同工況條件下沒有應用二次風擋板優(yōu)化參數(shù)的運行數(shù)據(jù)進行比較(如圖3所示)。
圖3 鍋爐燃燒優(yōu)化前后對比
圖3(a)中,在模式1即NOx排放最優(yōu)模式下,采用優(yōu)化后的二次風門擋板參數(shù),NOx排放濃度平均值下降45.6 mg/m3;圖3(b),在模式2即鍋爐效率最優(yōu)模式下,優(yōu)化后的鍋爐效率平均值提升0.18%;而在模式3即均衡模式下,圖3(c)和(d)中NOx排放濃度平均值下降29.2 mg/m3,鍋爐效率平均提升0.11%,實現(xiàn)了多目標燃燒優(yōu)化。
(1)采用KPCA降維后,數(shù)據(jù)復雜度明顯降低,由110維降至29維,保證保留數(shù)據(jù)85%以上信息的同時降低了模型訓練的復雜程度,達到了減少計算資源,節(jié)省實時優(yōu)化時間的目的。Kmeans++聚類將各工況下的大量數(shù)據(jù)根據(jù)其特征對數(shù)據(jù)進行有效劃分,每種工況下劃分出三種典型模式,能在保證燃燒系統(tǒng)正常運行同時,根據(jù)實際需要調(diào)整燃燒優(yōu)化方式。KPCA與Kmeans++相結合的數(shù)據(jù)挖掘方法可以直觀展現(xiàn)鍋爐控制規(guī)律,保證優(yōu)化效果的同時對鍋爐燃燒優(yōu)化進行精簡、全面的指導,為機組經(jīng)濟、高效、清潔運行提供了有力支持。
(2)以GHJJ電廠5號660 MW超超臨界機組鍋爐運行歷史數(shù)據(jù)為研究對象,對海量歷史運行數(shù)據(jù)進行工況劃分,得到典型工況、常見工況共11種有效工況。對11種工況進行KPCA-Kmeans++數(shù)據(jù)分析,進行KPCA降維后,采用Kmeans++聚類算法對降維后的數(shù)據(jù)進行聚類,按照每種工況特性進行模式劃分,每種工況下找到NOx排放最優(yōu)、鍋爐效率最優(yōu)、NOx排放-鍋爐效率均衡3種模式,并運用于電廠燃燒優(yōu)化。針對二次風擋板開度進行優(yōu)化調(diào)整實驗,在均衡模式下實現(xiàn)NOx排放濃度平均值下降29.2 mg/m3,鍋爐效率平均提升0.11%。