王錫輝,王志鵬,陳厚濤,朱曉星,劉武林,尋 新
(1.國網(wǎng)湖南省電力有限公司電力科學研究院, 高效清潔火力發(fā)電技術(shù)湖南省重點實驗室, 長沙 410007;2.湖南省湘電試驗研究院有限公司, 長沙 410007)
電站鍋爐的燃燒是一個復雜的物理化學過程,基于完整的化學反應[1-2]、傳熱傳質(zhì)模型[3]或直接數(shù)值模擬[4]進行燃燒診斷多偏向理論研究,其工程實用效果尚不理想。與內(nèi)燃機缸內(nèi)燃燒[5]或單個火焰[6]的燃燒診斷不同,電站鍋爐燃燒診斷更加注重整體宏觀特性,目的是獲取一些對運行調(diào)整有意義的信息[7],如火焰穩(wěn)定性、均勻性、污染物排放特性等,以便進行燃燒優(yōu)化[8]。基于特征信息而不深究燃燒過程的物理化學規(guī)律,得出具有統(tǒng)計意義的結(jié)論正是基于特征量分析的模式識別技術(shù)的特點[9-12]。當前文獻對基于特征量分析的電站鍋爐燃燒診斷技術(shù)中應用的各種算法的基本理念、數(shù)學原理及應用特點缺乏深入的對比研究,如何根據(jù)實際情況選取合適的技術(shù)路線缺乏綜述性評價。鑒于此,現(xiàn)概述各類別燃燒診斷技術(shù),詳細介紹基于特征量分析的電站鍋爐燃燒診斷技術(shù)的流程、特征量的提取、各種算法的詳細數(shù)學原理與實現(xiàn)以及用于燃燒診斷時的綜合性能評價,以期推動模式識別技術(shù)在火力發(fā)電智能診斷、控制等領(lǐng)域的廣泛應用,豐富電廠智能化、智慧化建設的技術(shù)手段。
根據(jù)一次測量元件的類型來劃分,電站鍋爐燃燒診斷技術(shù)分為三大類。第一類是基于火焰輻射強度探測的診斷技術(shù);第二類是基于火焰數(shù)字圖像分析的診斷技術(shù);第三類是基于聲波發(fā)送與接收、用于爐膛溫度測量的診斷技術(shù)。其目的是診斷火焰是否存在、燃燒是否穩(wěn)定、是否滿足經(jīng)濟性及環(huán)保要求等。
周懷春等[13]研究了燃煤火焰信號的頻譜分布特性。將燃燒火焰的時序信號進行通用的快速傅里葉變換,從燃燒火焰在頻率域的能量分布定性地看出,當燃燒穩(wěn)定性變差時,火焰的低頻波動能量變大,頻譜分布圖上的低頻頻譜峰值變大。肖雋等[14]對采樣信號進行重構(gòu)并濾除信號中的高頻噪聲后用快速傅里葉變換方法對微壓信號進行頻譜分析發(fā)現(xiàn),當鍋爐燃燒處于不穩(wěn)定狀態(tài)時,爐膛負壓信號頻譜中有沖擊信號特征。高翔等[15]嘗試通過對壓力脈動信號做線性回歸,以回歸直線的斜率K大小作為判定燃燒狀態(tài)穩(wěn)定與否的依據(jù)。周懷春等[16]對煤粉火焰的顏色使用了CIE1931標準色度系統(tǒng)作了定量分析,給出了近似色度坐標計算方法。徐偉勇等[17]采用傳像光纖和數(shù)字圖像處理技術(shù)開展了檢測電站鍋爐燃燒火焰的研究,將火焰亮度及其變化歷史記錄作為判斷燃燒穩(wěn)定性的依據(jù)。利用單個特性參數(shù)對燃燒狀況進行診斷,其效果依賴于該參數(shù)富含的信息以及表征燃燒狀況的準確程度,以及該參數(shù)評判火焰穩(wěn)定與否的閾值合理性。
周懷春等[18-19]采用單色火焰灰度圖像與參考點熱電偶實測溫度相結(jié)合的方法,通過獲得的單色圖像與其中某一參考點的輻射強度的比較來獲得溫度場,或通過火焰圖像提取紅、綠、藍三色數(shù)據(jù),利用比色法獲得三維溫度場的分布[20-22]。單色法測溫參考點的空間位置在圖片上難以精確定位,溫度測量元件的使用壽命受限,比色法測溫時由于圖像信息中存在疊加而有可能造成誤差?;诓噬姾神詈掀骷?charged coupled device,CCD)的光學響應特性和輻射定律,有學者建立輻射傳遞方程組,采用代數(shù)迭代重建方法求得每個網(wǎng)格上的輻射強度,并根據(jù)維恩定律,求出該網(wǎng)格溫度,反復迭代直至收斂[23-31]。該方法計算較繁復,測量精度依賴于射線條數(shù)和網(wǎng)格的大小。聲波測溫法起源于20世紀90年代[32]。根據(jù)理想氣體方程與聲波傳播方程,可獲得氣體溫度與聲波傳播速度的關(guān)系。聲波發(fā)生器與接收器的距離很容易測得,記錄聲波在發(fā)生器與接收器傳播路徑上的飛渡時間,即可計算得到聲波的傳播速度,從而實現(xiàn)聲波傳播路徑上的溫度推算。通過設置多個聲波發(fā)生器與接收器,理論上可獲得多條聲波傳播通道上的溫度測量,實現(xiàn)某個截面的溫度場重建[33-36]。但由于爐膛內(nèi)環(huán)境復雜,噪聲大,顆粒多,對聲波的傳播造成了干擾,影響溫度測量的準確性。通過溫度測量,可獲得爐膛燃燒的定量信息,并使得未燃盡碳含量、NOx排放的預測成為可能,對燃燒的運行優(yōu)化指導具有重大作用,其測量準確度和可靠性是影響技術(shù)推廣的主要因素。
與基于單個或少數(shù)幾個參數(shù)擬合某種規(guī)律的燃燒診斷技術(shù)相比,基于特征量分析的模式識別技術(shù)在高維度數(shù)據(jù)處理、整合功能及強關(guān)聯(lián)耦合卻又難以建立精確模型的問題分析上具有巨大優(yōu)勢[9-12]。隨著人工智能技術(shù)的不斷發(fā)展,基于特征量分析的燃燒診斷方法或機組運行狀態(tài)識別技術(shù)將更具有滿足智慧電廠建設要求的潛力[37]。
中國基于特征量提取和算法分析的技術(shù)用于電站鍋爐燃燒診斷始于21世紀初[38],研究聚焦于燃燒狀態(tài)的識別(如火焰穩(wěn)定性)和污染物排放的預測[39]。應用較多的算法主要有Kohonen 自組織神經(jīng)網(wǎng)絡[40]、反向傳播神經(jīng)網(wǎng)絡[41]、主元分析方法[42]以及支持向量機算法[43]。模糊C均值聚類算法[44-45]及模糊免疫算法[46]由于其描述燃燒過程漸變特性的便利性也被廣泛研究。
基于特征量分析的燃燒診斷技術(shù)基本流程如圖1所示,分為4個主要環(huán)節(jié):①獲取火焰強度、爐膛負壓、火焰圖像信息等;②提取能表征燃燒狀態(tài)的特征量作為模式識別輸入?yún)?shù)(樣本);③選擇算法,將樣本代入算法進行學習/訓練,使其具備識別輸入?yún)?shù)狀態(tài)模式的能力并經(jīng)過驗證樣本的檢測;④將待診斷樣本輸入訓練好的算法即可得知樣本的狀態(tài)。待診斷樣本特征量的組成、提取方法、診斷周期的選擇應與訓練樣本保持完全一致。其中,提取特征量、算法的選取和學習/訓練是該技術(shù)的核心環(huán)節(jié),將分別在第3節(jié)和第4節(jié)詳細介紹。
圖1 基于特征量分析的燃燒診斷技術(shù)流程圖
燃燒理論并未對某一種燃燒狀態(tài)進行定義,而是根據(jù)經(jīng)驗,當一些參數(shù)滿足某種要求時,判定燃燒處于某一種狀態(tài)。燃燒狀態(tài)的識別是一種基于經(jīng)驗的模糊判斷。在采用神經(jīng)網(wǎng)絡或其他算法進行模式識別時,模擬人的思維模式,提取一些特征量參數(shù)用于表征燃燒狀態(tài)。設計合適的算法,通過特征量組合發(fā)現(xiàn)同一類別的相似性和不同類別的差異性而達到模式識別或分類的目的。特征量準確表征狀態(tài)某種屬性的能力對于整體狀態(tài)識別至關(guān)重要?;趫D像處理技術(shù)時,一般把火焰圖像的幾何特性參數(shù)、物理特性參數(shù)以及色度特性參數(shù)作為特征量。基于燃燒特性參數(shù)測量時,一般利用微壓、火焰頻譜、火焰強度信號等參數(shù)的統(tǒng)計學值作為特征量。
(1)火焰圖像灰度的平均值[40]:也稱為特征區(qū)或有效燃燒區(qū)平均灰度,公式為
(1)
(2)
式中:N為t時間內(nèi)采樣的次數(shù);gavi為第i次采樣時圖像的平均灰度值;G為圖像像素個數(shù);gji為第i次采樣時圖像中像素點j的灰度值。圖像灰度的平均值表征一段時間內(nèi)的燃燒強度。
(2)t時間內(nèi)火焰圖像平均灰度的方差或標準差(標準差等于方差開方)[40]:公式為
(3)
火焰圖像平均灰度的方差表征火焰的脈動情況。燃燒穩(wěn)定時,圖像平均灰度方差較小,燃燒不穩(wěn)定時,方差較大。
(3)火焰有效區(qū)域面積[40, 42]:也稱為火焰像素面積或有效燃燒區(qū)域面積,公式為
(4)
式(4)中:Spixel-i為第i次采樣時火焰有效區(qū)面積,通過統(tǒng)計火焰圖像中某灰度級以上的所有像素點的總量,并基于每個像素占據(jù)的火焰面積均勻的假設而獲得;gth為判定閾值,根據(jù)經(jīng)驗設定。
t時間內(nèi)火焰像素面積方差[40]表示為
(5)
(6)
(4)高溫區(qū)域面積[42]:與有效燃燒區(qū)域面積類似,通過統(tǒng)計火焰圖像中某灰度級以上的所有像素點的總量并基于像素所占面積均勻的假設而獲得,灰度閾值根據(jù)經(jīng)驗設定。不同的是,在計量高溫區(qū)域面積時,選取的灰度閾值更大。
(5)高溫面積率[42]:高溫區(qū)域面積與火焰有效區(qū)域面積之比。該特征量可降低環(huán)境原因(如攝像頭拍攝角度等)造成的誤判率,與高溫面積率類似的特征量還有有效燃燒面積率(等于有效燃燒區(qū)域像素數(shù)與圖像總像素數(shù)之比)[47-48]。
與燃氣、燃油火焰不同,煤粉火焰中可觀察到未燃區(qū)、著火區(qū)(初始燃燒區(qū))和完全燃燒區(qū),以下特征量適用于煤粉火焰。
(6)火焰鋒面位置[40](或著火點位置[48]):沿著風粉射流中心線上灰度梯度最大的位置,即通常所說的著火點?;鹧驿h面位置表征火焰穩(wěn)燃能力。
(7)鋒面位置差分[40]:相鄰兩次采樣火焰鋒面(著火點)位置之差,表征著火穩(wěn)定性。燃燒越穩(wěn)定,鋒面位置差分波動越小。
(8)質(zhì)心偏移距離[47]:火焰的質(zhì)心與基準狀態(tài)火焰質(zhì)心相比,偏移的距離。該參數(shù)表征火焰穩(wěn)定性的能力依賴于基準火焰質(zhì)心的準確性和對不同工況的適應性。
(9)圓形度[48]:假設有一個與火焰圖像區(qū)域的投影面積具有相同面積的圓,以此圓的直徑作為圓等效直徑,用這個等效圓的周長除以火焰圖像的周長所得到的值稱為圓形度。表征火焰的幾何外形特征。
(10)著火面積[47]:火焰鋒面與燃燒器包圍區(qū)域的面積,意義與火焰鋒面位置類似。
(11)火焰?zhèn)鞑ソ嵌萚48]:火焰邊界切線之間的夾角。
采用某一個特征量無法準確地表征燃燒狀態(tài)。通常選取幾個特征量作為一個組合,組合中的每一個特征量各表征燃燒狀態(tài)某一方面的信息。對于不同的特征量組合,在表征火焰穩(wěn)定性時,其特點如表1所示。
表1 特征量組合及其特點
一般而言,特征量的組合應滿足如下條件[45]:①每個被選為特征量的參數(shù)要有明確的物理意義;②單個特征量參數(shù)能表征燃燒狀況的某種屬性;③特征量參數(shù)之間表征的屬性不重疊、不沖突;④所有被選為特征量的參數(shù)組合起來應盡量能完整全面地表征燃燒狀況。特別地,當實際燃燒狀況不同時,特征量組合應具備識別其差異的能力并具備較強的魯棒性;⑤特征量參數(shù)應盡量不受安裝、信息提取等技術(shù)因素的影響。
Kohonen自組織神經(jīng)網(wǎng)絡是一種無導師學習模型[49],通過自組織方法,用大量的樣本訓練數(shù)據(jù)調(diào)整網(wǎng)絡的權(quán)值,使得最后網(wǎng)絡的輸出能夠?qū)Σ煌斎霕颖咀龀霾煌憫_到模式識別或聚類的目的[50-51]。在自組織映射里,神經(jīng)元節(jié)點放置在網(wǎng)格節(jié)點上,網(wǎng)格通常是一維或二維的。以二維為例,網(wǎng)絡結(jié)構(gòu)如圖2所示。假設[xi1,xi2,…,xim]為m維的輸入?yún)?shù)Xi(或稱為樣本,即第三節(jié)所述特征量組合,其中1≤i≤n,n為樣本總數(shù)),每個輸出網(wǎng)絡節(jié)點對應一個權(quán)值向量且兩兩之間互不相同,權(quán)值向量維數(shù)與輸入?yún)?shù)維數(shù)一致。以某節(jié)點j為例,其權(quán)值向量wj表示為[wj1,wj2,…,wjm]。訓練過程中,計算輸入?yún)?shù)與權(quán)值向量的點積XiwjT(或計算輸入?yún)?shù)與權(quán)值向量之間的歐式距離),點積最大(或歐式距離最小)的節(jié)點即為獲勝節(jié)點或獲勝神經(jīng)元,對該神經(jīng)元及其鄰域神經(jīng)元的權(quán)值向量按一定規(guī)則進行調(diào)整,而其他節(jié)點的權(quán)值向量保持不變。當輸入數(shù)據(jù)的模式發(fā)生變化時,獲勝節(jié)點也隨著轉(zhuǎn)移。因此,經(jīng)過一定輸入數(shù)據(jù)(包含各種模式)的訓練后,某個(些)神經(jīng)元對某一類輸入數(shù)據(jù)的響應遠比其他節(jié)點更加顯著,這個神經(jīng)元的空間位置即代表某類特定的模式,從而達到模式識別的目的。為了訓練過程中數(shù)學處理更加便利,通常將輸入?yún)?shù)及權(quán)值向量初始化、歸一化。Kohonen 自組織神經(jīng)網(wǎng)絡的訓練流程如圖3所示。
圖2 Kohonen網(wǎng)絡拓撲結(jié)構(gòu)
圖3 Kohonen自組織神經(jīng)網(wǎng)絡訓練流程
在訓練的起始階段,各神經(jīng)元節(jié)點的權(quán)值向量是隨機分配的。權(quán)值向量調(diào)整規(guī)則及鄰域半徑的確定是Kohonen網(wǎng)絡訓練的核心環(huán)節(jié)。權(quán)值向量的調(diào)整表達式為
wj(n+1)=wj(n)+η(n)hj,i(x)[Xi-wj(t)]
(7)
式(7)中:η為學習率參數(shù);hj,i(x)為獲勝神經(jīng)元的鄰域函數(shù)(應滿足均勻?qū)ΨQ的要求),二者在學習過程中是動態(tài)變化的。η和hj,i(x)有許多不同的形式,在具體訓練過程中可根據(jù)輸入?yún)?shù)的分布進行選擇和設計,但均應滿足隨著訓練次數(shù)的增加而衰減的要求。下述兩個函數(shù)滿足此要求。
(8)
(9)
式中:dj,i為優(yōu)勝神經(jīng)元i與獲勝神經(jīng)元j之間的歐式距離;σ0、η0為初始參數(shù);n為訓練次數(shù);τ1、τ2為時間常數(shù)。
衛(wèi)成業(yè)等[52]以一段時間內(nèi)平均灰度、平均灰度方差、火焰像素面積平均值、像素面積方差為特征量組合,構(gòu)建了輸出層為15×15個神經(jīng)元的Kohonen 網(wǎng)絡,從300幅不同狀態(tài)(穩(wěn)定火焰、不穩(wěn)定火焰、熄火)的火焰圖像中提取特征量,作為輸入樣本Xi(i=1~300),對構(gòu)建的網(wǎng)絡進行6 000次訓練,通過不斷調(diào)整各神經(jīng)元的權(quán)值向量,使不同狀態(tài)的樣本聚類于網(wǎng)絡輸出層的不同空間位置(即該位置神經(jīng)元節(jié)點的權(quán)值向量與輸入樣本的點積最大),達到狀態(tài)識別的目的。提取的特征量對不同狀態(tài)的表征區(qū)分度直接影響聚類的準確性。
反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡是一種有監(jiān)督的學習算法[53]。網(wǎng)絡結(jié)構(gòu)包含輸入層、隱藏層(也可無隱藏層)和輸出層[54-55],現(xiàn)考慮只有一層隱藏層的網(wǎng)絡結(jié)構(gòu),如圖4所示。相鄰層節(jié)點的連接都配有權(quán)值向量。輸入?yún)?shù)向量通過網(wǎng)絡的正向傳播,在輸出節(jié)點上產(chǎn)生一個實際響應。期待響應與實際響應之差獲得誤差信號。在反向傳播中,利用誤差信號調(diào)整權(quán)值向量,經(jīng)過一定數(shù)量樣本的訓練后,網(wǎng)絡輸出節(jié)點的實際響應在統(tǒng)計意義上接近目標響應,網(wǎng)絡完成學習過程。將未知樣本輸入網(wǎng)絡,根據(jù)網(wǎng)絡輸出對應的期待響應而確定輸入?yún)?shù)向量的模式,完成模式識別。反向傳播算法學習過程的數(shù)學原理如下。
圖4 BP網(wǎng)絡結(jié)構(gòu)
假設神經(jīng)元j在第n次訓練時,輸出誤差信號表示為
ej(n)=dj(n)-yj(n)
(10)
(11)
假設訓練集合的樣本總數(shù)為N,對每一個訓練樣本求取ξ(n),整個訓練集的均方誤差能量ξav可表示為
(12)
訓練的目的是調(diào)整權(quán)值向量使得ξav最小化。
如圖5所示為網(wǎng)絡正向傳播過程中神經(jīng)元之間的信號流圖。前一層輸入信號對神經(jīng)元j產(chǎn)生的刺激表示為
圖5 BP網(wǎng)絡正向傳播過程中神經(jīng)元之間的信號流圖
(13)
式(13)中:wji(n)為第i層網(wǎng)絡輸出與第j個神經(jīng)元的連接權(quán)值向量,i和j是毗鄰的網(wǎng)絡層;m為輸入向量(不含偏置)個數(shù),經(jīng)激活函數(shù)后神經(jīng)元j的輸出函數(shù)信號表示為
(14)
應用于wji(n)的修正值Δwji(n)定義為
(15)
式(15)中:η為反向傳播算法的學習率參數(shù);負號表示尋找使得ξ(n)值下降的權(quán)值改變方向。根據(jù)微分的鏈式規(guī)則有
(16)
聯(lián)立式(10)、式(11)、式(13)、式(14)和式(16)可得
(17)
為使后述的表達更加簡潔,引入局域梯度δj(n),定義為
ej(n)φ′j[vj(n)]
(18)
將式(17)、式(18)代入式(15),權(quán)值向量wji(n)的修正量Δwji(n)表示為
Δwji(n)=ηδj(n)yi(n)
(19)
當神經(jīng)元j位于輸出層時,根據(jù)式(19)可以很直接得到權(quán)值向量的調(diào)整值。當神經(jīng)元j位于網(wǎng)絡的隱藏層時,誤差信號無法直接計算,需根據(jù)與j神經(jīng)元相連的輸出神經(jīng)元的誤差來遞歸獲得。重新考察圖5所示的網(wǎng)絡結(jié)構(gòu),神經(jīng)元j位于隱藏層。根據(jù)定義,ξ(n)表示為
(20)
式(20)中:k為輸出層節(jié)點。
式(20)兩邊對函數(shù)信號yj求偏導得
(21)
由于神經(jīng)元k位于輸出層,則
ek(n)=dk(n)-yk(n)=dk(n)-φk[vk(n)]
(22)
因此
(23)
式(21)可進一步表示為
(24)
由式(24)及局域梯度的定義,對隱藏層神經(jīng)元j有
(25)
因此,隱藏層神經(jīng)元權(quán)值向量的修正量Δwji(n)表示為
Δwji(n)=ηyi(n)δj(n)=
(26)
至此,反向傳播算法有關(guān)權(quán)值向量調(diào)整規(guī)則的數(shù)學推導結(jié)束。在上述的推導過程中,反復使用φ(·)和其偏導數(shù)φ′(·)。φ(·)稱為激活函數(shù),其必須滿足可微的特性。常用的激活函數(shù)有以下兩種,表示為
(27)
φ(x)=atanh(bx)
(28)
張玉杰等[41]以平均灰度、方差、熵、火焰豐度、能量為特征量組合,構(gòu)建輸入層、隱藏層、輸出層分別為25個節(jié)點(連續(xù)提取5幀圖像的特征量)、32個節(jié)點和1個節(jié)點的BP網(wǎng)絡,提取穩(wěn)定燃燒、不穩(wěn)定燃燒以及熄火三種狀態(tài)火焰圖像的特征量組合各40組樣本作為輸入?yún)?shù),并分別將期待輸出設置為0.1、0.5和0.9,網(wǎng)絡經(jīng)過1 500次訓練后,可通過輸出值判斷待識別樣本所隸屬的狀態(tài)。
支持向量機算法的思想本質(zhì)上是通過已知樣本尋找出一個分割超平面(separation hyperplane),也稱為決策平面,使所有樣本位于決策平面的兩側(cè),并滿足離決策面距離最近的點到?jīng)Q策面的距離最大化的約束條件[56-57],如圖6所示。這些離決策面最近的點被稱為支持向量機(support vector machine, SVM)。
wTX+b=0
(29)
式(29)中:X為輸入向量;w為權(quán)值向量;b為偏置,對于期望響應為1的一類,滿足:
wTX+b≥0
(30)
對于期望響應為-1的一類,滿足:
wTX+b<0
(31)
很顯然,如圖6所示,同時滿足式(30)和式(31)的平面不是唯一的。將決策面平移,得到與決策面平行的兩個平面,并分別穿過兩個類別的支持向量。兩個平行平面的方程可寫為wTX+b=-1和wTX+b=1。平面1上方的點必須滿足條件:wTX+b≥1,平面2下方的點必須滿足條件:wTX+b≤-1。下面考慮支持向量到?jīng)Q策平面距離最大化的約束條件。根據(jù)定義,對應期望響應分別為1和-1時,支持向量到?jīng)Q策平面的距離表示為
圖6 基于支持向量機的決策面示意圖
(32)
di(wTX+b)≥1,i=1,2,…,N
(33)
和約束條件2(權(quán)值向量w最小化代價函數(shù)):
(34)
為解決該問題,構(gòu)造拉格朗日函數(shù)為
(35)
式(35)中:αi稱為拉格朗日乘子(αi≥0)。約束最優(yōu)問題的解由拉格朗日函數(shù)的鞍點決定,此函數(shù)對w和b最小化,即
(36)
求得
(37)
圖7 基于決策面線性不可分示意圖
約束條件1:
di(wTX+b)≥1-εi,εi≥0,i=1,2,…,N
(38)
約束條件2:
(39)
式(39)中:Z為使用者選定的正參數(shù);ei為松弛變量。通過構(gòu)造拉格朗日函數(shù)并求導,求得權(quán)值向量為
(40)
可分與不可分的不同在于將限制條件ai≥0替換為0≤ai≤εi。
吳一全等[47]以火焰有效燃燒區(qū)面積率、高溫燃燒面積率、有效燃燒區(qū)域平均灰度、有效燃燒區(qū)域灰度標準差、有效燃燒區(qū)域灰度直方圖熵、質(zhì)心行位置、質(zhì)心列位置、幾何中心行位置、幾何中心列位置、圓形度為特征量組合,從45幅火焰圖像樣本中(包含20幀穩(wěn)定火焰圖片與25幀不穩(wěn)定至熄火的圖片)提取特征量數(shù)值,前10幀作為穩(wěn)定狀態(tài)訓練樣本(設置輸出為1),第21~30幀作為不穩(wěn)定狀態(tài)訓練樣本(設置輸出為-1)進行訓練,最終樣本識別的準確率為84.4%。
主元分析方法(principal component analysis, PCA)一般不直接用于模式識別,而是一種數(shù)據(jù)壓縮(降維)但仍保留其主要特征的數(shù)學處理方法[58],為高維數(shù)據(jù)處理節(jié)省時間和成本。對n×p的矩陣X,PCA算法的數(shù)學模型可描述為
(41)
求取n×m(m≤p)的矩陣Z(稱為X的特征矩陣),其中
Zi=li1x1+li2x2+…+lipxp
(42)
式(42)中:Zi為矩陣Z的列向量,1≤i≤m;Xp為矩陣X的列向量。各向量之間滿足如下約束關(guān)系:①Z1,Z2,…,Zm相互無關(guān);②Z1是X1,X2,…,Xp的所有線性組合中方差最大者,Z2是與Z1不相關(guān)的X1,X2,…,Xp的所有線性組合中方差最大者,以此類推。問題也可等價描述為求取X的協(xié)方差矩陣的由大到小排列的前m個特征值的特征向量??赏ㄟ^特征值分解協(xié)方差矩陣或奇異值分解協(xié)方差矩陣兩種方法獲得。計算流程如圖8所示。
圖8 主元分析模型算法流程圖
白衛(wèi)東[39]以火焰有效區(qū)灰度和高溫區(qū)域灰度、火焰有效區(qū)域面積和高溫區(qū)域面積、高溫面積率、質(zhì)心偏移距離、圓形度為特征量組合,基于PCA分析,采用HotellingT2和Q兩個統(tǒng)計量,通過檢驗其是否超過各自的控制限實現(xiàn)火焰狀態(tài)的監(jiān)測。PCA本質(zhì)上是消除多維變量的相關(guān)性,以減少數(shù)據(jù)處理量。統(tǒng)計量的值表征的是采用PCA降維過程數(shù)據(jù)是否失真,用于監(jiān)測狀態(tài)變化從而實現(xiàn)模式識別,其診斷準確性有待更多實踐驗證。
模糊C均值聚類算法(fuzzyC-means cluster, FCM)是普通C均值聚類算法的改進[59-61]。將一個樣本數(shù)據(jù)集根據(jù)其特征屬性分為若干個類別,每一個類別存在一個聚類中心,通過待診斷樣本與聚類中心之間的隸屬度大小確定其歸屬于哪一類別。數(shù)學方法簡介如下:對于數(shù)據(jù)集X={x1,x2, …,xn},假設該數(shù)據(jù)集可劃分為k個類別,則第i個樣本隸屬于第j(1 ≤j≤k)類的隸屬度uij滿足如下條件:
0≤uij≤1
(43)
(44)
在求取聚類中心時,F(xiàn)CM聚類算法以類內(nèi)加權(quán)平方誤差和為目標函數(shù)。
(45)
式(45)中:dij為聚類中心pj與數(shù)據(jù)xi之間的歐式距離;m為平滑因子。
求目標函數(shù)J對聚類中心pj的偏導,并令其為0,即
(46)
由式(46)可求得聚類中心pj的表達式為
(47)
根據(jù)隸屬度的定義可求得
(48)
采用模糊C均值聚類算法求取聚類中心流程[45]如圖9所示。
圖9 聚類中心求取流程圖
劉偉等[44]以火檢信號的方差、偏度、峭度、形狀因子、奇異譜熵、功率譜熵、小波能譜熵為特征量組合,收集不同燃燒狀態(tài)(好、中、差)的火檢數(shù)據(jù),采用模糊C均值聚類算法求取各燃燒狀態(tài)的聚類中心,通過計算待識別樣本與各狀態(tài)聚類中心之間的隸屬度值,根據(jù)隸屬度值的大小確定待識別樣本的狀態(tài)。FCM采用隸屬度的概念,更加符合燃燒狀態(tài)漸進變化的物理特性,訓練成本低,要求特征量組合在數(shù)值上對不同狀態(tài)具有良好的區(qū)分度。
各種算法的特點及推薦應用場合總結(jié)如表2所示。表2中所述各類算法在進行模式識別時各有特點,是基礎的技術(shù)手段。在火力發(fā)電領(lǐng)域中,不僅可用于燃燒狀態(tài)的識別,也可用于單元機組某一分系統(tǒng)或整臺機組運行狀態(tài)的識別,從而實現(xiàn)輔機設備、分系統(tǒng)故障或機組運行經(jīng)濟性等的智能化診斷,關(guān)鍵在于提取能準確表征狀態(tài)的特征量及選用合適的算法。基于特征量分析、模糊聚類及其他算法獲得的診斷結(jié)論是數(shù)字化的,把基于人的經(jīng)驗獲得的文字性描述結(jié)論轉(zhuǎn)變成控制器可識別的語言,易于與現(xiàn)有控制系統(tǒng)相結(jié)合。應當指出,基于特征量分析的診斷實現(xiàn)火力發(fā)電涉及的過程閉環(huán)控制的進程仍處于探索階段。建議根據(jù)診斷目標進行分類,針對每一類目標提煉相適宜的特征量提取通用方法及診斷算法,初步實現(xiàn)包含機組安全、經(jīng)濟、環(huán)保等指標在內(nèi)的全部性能診斷,并為運行人員提供實時優(yōu)化建議;當診斷結(jié)論和優(yōu)化建議的正確性滿足機組安全穩(wěn)定運行控制要求時,將優(yōu)化建議變成執(zhí)行決策,逐步接入原有控制回路,實現(xiàn)閉環(huán)控制。
表2 各算法特點與適用場合
概述了各類別燃燒診斷技術(shù)及其特點,詳細介紹了基于特征量分析的電站鍋爐燃燒診斷技術(shù)的流程、特征量的提取方法、常用算法的詳細數(shù)學原理與實現(xiàn),綜合比較了各特征量組合、各算法的性能,在此基礎上推薦了應用場合?;趩蝹€特性參數(shù)(如火焰頻譜)的擬合分析對燃燒穩(wěn)定性進行診斷,其效果依賴于該參數(shù)富含的信息以及表征燃燒狀況的準確程度,以及該參數(shù)評判火焰穩(wěn)定與否的閾值合理性。基于溫度測量進行燃燒診斷,可獲得爐膛燃燒的定量信息,并使得未燃盡碳含量、NOx排放的預測成為可能,對燃燒的運行優(yōu)化指導具有重大作用,其測量準確度和可靠性是影響技術(shù)推廣的主要因素。提取特征量、網(wǎng)絡的設計和訓練是基于特征量分析的燃燒診斷技術(shù)的核心環(huán)節(jié)。用于狀態(tài)識別時,特征量應有明確的物理意義且應具備表征狀態(tài)某種屬性的能力;特征量組合應盡量能完整全面地包含狀態(tài)信息。特別地,當實際狀態(tài)不同時,特征量組合應具備識別其差異的能力并具備較強的魯棒性。有導師學習模型如BP神經(jīng)網(wǎng)絡算法、SVM算法及FCM算法適用于所有可根據(jù)經(jīng)驗進行分類的場合,F(xiàn)CM采用隸屬度的概念可更加精準的表述待診斷樣本的狀態(tài),SVM適用于樣本模式非此即彼的分類應用;Kohonen自組織神經(jīng)網(wǎng)絡適用于各類別之間具有較強區(qū)分度的場合;PCA是高維數(shù)據(jù)降維提煉的有效手段。
所述各類模式識別算法不僅可用于燃燒狀態(tài)的識別,也可用于發(fā)電機組某一設備、分系統(tǒng)或整臺機組運行狀態(tài)的識別,進而實現(xiàn)輔機設備故障或機組運行安全性、經(jīng)濟性等的智能化診斷,并具備實現(xiàn)閉環(huán)控制的潛力,在火力發(fā)電廠智能化、智慧化建設中理應受到更多的關(guān)注。