戚凱旋,朱凌云
(東華大學信息科學與技術學院 上海 201600)
在實際的燃氣鍋爐工作環(huán)境中,工作人員需要對鍋爐內部的燃燒穩(wěn)定性進行實時監(jiān)控,以確保整個燃燒流程的效率和穩(wěn)定性[1]。隨著數(shù)字圖像處理和機器學習的發(fā)展,傳統(tǒng)的火焰檢測技術(例如熱電阻測溫、紫外線探測等)逐漸退出歷史舞臺。通過電荷耦合器件(charge coupled device,CCD)攝像機采集圖像,再經過處理提取特征參數(shù),最后建立火焰狀態(tài)檢測模型的方法,已成為學術界研究的主流[2]。鍋爐火焰狀態(tài)檢測除了對圖像進行預處理外,也要從圖像自身特性進行分析,提取出對建模有利的特征,從而更有利于對鍋爐內部進行有效監(jiān)控和異常檢測[3]。
在復雜工業(yè)環(huán)境下,鍋爐內壁和火焰周圍空氣可能會因為火焰光照影響而亮度偏大,一些分割算法會把其當成火焰的一部分,使得分割效果變差。在算法層面,支持向量機(support vector machine,SVM)和神經網絡被廣泛應用于鍋爐火焰狀態(tài)檢測領域。不少研究人員在此基礎上結合優(yōu)化算法,以達到優(yōu)化的目的[4-6]。鍋爐火焰圖像受限于自身單調的圖像特性,能夠提取到的特征維度較低。這對于傳統(tǒng)的支持向量機模型學習是不利的[7]。神經網絡支持對特征進行深層交叉,但在一定程度上損失了模型的可解釋性和簡便性[8-9]。梯度提升決策樹(gradient boosting decision tree,GBDT)支持對特征進行交叉,對非線性數(shù)據具有很好的擬合能力,并且具備可解釋性。近年來,GBDT在很多結構化數(shù)據的訓練場景下都能取得比神經網絡更優(yōu)異的效果[10-11]。
本文首先對燃氣火焰的燃燒特性進行分析,使用基于色調、飽和度、明度(hue,saturation,value,HSV)空間的閾值分割算法[12],有效避免了火焰強光使得分割后面積偏大的問題;然后采集火焰中心區(qū)域的顏色、輪廓、矩特征,使用GBDT+邏輯回歸(logistic regression,LR)算法[13]搭建火焰狀態(tài)檢測模型;最后對比試驗了SVM、深度神經網絡(deep neural networks,DNN)、GBDT+LR在相同數(shù)據集的指標情況。
本文采用的火焰圖像來源于現(xiàn)場CCD相機拍攝的燃氣火焰視頻,完整地記錄了點火→燃燒不穩(wěn)定→燃燒充分→最終熄滅的過程。天然氣火焰在不同的燃燒狀態(tài)下有著不同的特性:燃燒不充分時,火焰呈亮黃色,振蕩幅度較大;在過渡階段,火焰黃藍相間,振蕩幅度相對于燃燒不充分時有所減弱;燃燒充分時,火焰呈藍色,振蕩幅度較小。因此,本文將火焰燃燒狀態(tài)歸為燃燒不充分、燃燒較充分以及燃燒充分三種狀態(tài)。
在實際工業(yè)環(huán)境中,CCD相機成像過程通常會伴隨產生散粒噪聲和高斯噪聲。高斯噪聲與光強度無關,無論像素值是多少,高斯噪聲的平均水平保持不變。而散粒噪聲又稱泊松噪聲。泊松噪聲隨著光強增大,平均噪聲也增大。試驗選擇在火焰圖像中加入隨機散粒噪聲作為噪聲干擾,并對比了中值濾波、均值濾波、高斯濾波、雙邊濾波的去噪試驗效果,最終得出結論:中值濾波對于燃氣火焰場景的噪聲能夠起到很好的抑制作用。中值濾波去噪前后圖像如圖1所示。
圖1 中值濾波去噪前后圖像Fig.1 Images before and after median filtering
圖像分割一般基于閾值、邊緣、區(qū)域、運動等特性。由于火焰運動極不規(guī)律,基于邊緣或者運動的算法會帶來較大的誤差,而且火焰自身與背景閾值相差較大。因此,本文選取基于閾值分割的算法作進一步研究。目前,以大津(OTSU)法為代表的自適應閾值分割算法在鍋爐火焰檢測領域的應用較為廣泛。由于鍋爐內壁環(huán)境較暗,當火焰亮度較高時,采用大津法進行圖像分割可能會造成分割后的火焰偏大。這是因為火焰周圍的空氣亮度較高,導致分割出現(xiàn)誤差。根據火焰前景和背景在HSV顏色空間的S分量上存在顯著差異這一特點,本文采用基于HSV空間S分量的閾值分割算法進行分割?;赟閾值分割前后圖像如圖2所示。
圖2 基于S閾值分割前后圖像Fig.2 Images before and after segmentationbased on S threshold
由于火焰自身極不規(guī)律的運動特性,在圖像分割后可能存在一些空洞,會影響到對火焰面積等特征的準確提取。由于分割后的圖像已是二值圖像,本文使用漫水填充方法進行處理。漫水填充前后圖像如圖3所示。
圖3 漫水填充前后圖像Fig.3 Images before and after flooding filling
鍋爐天然氣火焰在不同燃燒階段顏色分量的占比情況會發(fā)生變化。當天然氣燃燒不充分時,火焰呈現(xiàn)亮黃色,此時火焰的紅色分量較多。當天然氣穩(wěn)定燃燒時,火焰呈純凈的藍色,此時火焰的藍色分量增多。R分量變化趨勢如圖4所示。
圖4 R分量變化趨勢Fig.4 Change trend of R component
由圖4可以看出:在燃燒初期,R分量均值較高,此時燃氣火焰處于不穩(wěn)定的燃燒狀態(tài);從150幀左右開始,火焰由不穩(wěn)定的燃燒狀態(tài)過渡至穩(wěn)定的燃燒狀態(tài),達到穩(wěn)定后的R分量均值較低。
同樣的,不同燃燒狀態(tài)的圖像在HSV空間上的分量也存在著較大的差異。S分量變化趨勢如圖5所示。
圖5 S分量變化趨勢Fig.5 Change trend of S component
由圖5可以看出,當火焰充分燃燒時,S分量均值明顯高于不充分燃燒狀態(tài)下的S分量均值。
當天然氣燃燒不充分時,火焰的振蕩頻率較高。此時,火焰面積較大,變化幅度也較大?;鹧婷娣e變化趨勢如圖6所示。
圖6 火焰面積變化趨勢Fig.6 Change trend of flame area
由圖6可知,前半部分時間幀的火焰面積平均值偏高且方差較大;而在充分燃燒的狀態(tài)下,火焰的振蕩較為穩(wěn)定,故提取圖像分割后的有效周長和面積作為特征。
火焰在燃燒過程中存在閃爍現(xiàn)象,且振蕩比較劇烈。除了通過顏色維度和輪廓維度對火焰圖像進行刻畫外,還需要尋找一種更加穩(wěn)定的特征對頻繁變化的火焰圖像進行有效表達。圖像的距不受光照、噪聲以及幾何形變的影響,在圖像識別領域應用廣泛。設x為隨機變量、c為常數(shù)、k為正整數(shù),則E[(x-c)k] 為x關于c點的k階距。對于M×N的火焰圖像,其(p+q)階幾何矩如式(1)所示:
(1)
式中:f(i,j)為火焰圖像在坐標點(i,j)處的灰度值。
零階幾何距代表火焰圖像的面積,一階幾何矩代表火焰圖像的質心。為了構造出圖像距特征的平移不變性,以火焰圖像的質心作為中心構建中心矩。中心距的計算只與火焰圖像的點以及火焰質心有關,與火焰自身位置無關,即中心矩具備平移不變性。中心距可以由幾何矩的變換推導得出。其(p+q)階中心矩如式(2)所示:
(2)
此外,二階幾何矩可用于計算火焰圖像的方向,也稱為慣性矩。三階幾何矩反映了火焰圖像的方位和斜度。
GBDT以決策樹中的分類回歸樹(classification and regression tree,CART)回歸樹為基礎,利用梯度提升思想,即擬合每一輪訓練過程中的殘差,在GBDT中殘差定義為損失函數(shù)的負梯度。定義數(shù)據集D作為回歸樹的輸入,回歸樹的輸出為f(x)。訓練時,首先對弱學習器進行初始化,如式(3)所示。
(3)
然后,遍歷所有的樣本以計算殘差,即損失函數(shù)的負梯度,如式(4)所示。
(4)
將上一步計算得到的殘差作為新的樣本,輸入至下一個基學習器進行訓練,并得到一棵新的CART回歸樹。對樹生成的葉子節(jié)點計算最佳擬合值,并更新強學習器,如式(5)、式(6)所示。
(5)
(6)
式中:J為回歸樹生成的葉子節(jié)點個數(shù)。
LR本質上屬于廣義線性回歸模型。對于一般的線性回歸,有:
y=θ0+θ1x1+θ2x2+...+θnxn
(7)
邏輯回歸在線性回歸的基礎上,將線性回歸的結果映射到Sigmoid函數(shù)中,如式(8)所示。
(8)
對于損失函數(shù)的求解,使用極大似然估計,首先得到概率函數(shù):
P(y|x;θ)=[hθ(x)]y[1-hθ(x)]1-y
(9)
因為樣本數(shù)據相互之間獨立,所以概率函數(shù)可以轉換為參數(shù)的似然函數(shù)形式:
(10)
對似然函數(shù)取對數(shù),并使用梯度下降算法進行求解。
GBDT+LR組合模型的優(yōu)勢在于:通過GBDT的葉節(jié)點編碼實現(xiàn)對特征的自動交叉,從而引入非線性的特征組合。GBDT的原始特征輸入為通過圖像預處理操作提取的火焰參數(shù),之后GBDT利用樹模型的分裂特性實現(xiàn)不同特征的交叉組合,進行更深層次的學習。訓練結束后,樹模型的葉子節(jié)點表示特征的最佳分裂位置,GBDT的輸出代表對原始輸入歷時節(jié)點編碼。GBDT+LR結構如圖7所示。
圖7 GBDT+LR結構圖Fig.7 Structure diagram of GBDT + LR
x作為一條輸入樣本,在左右進行遍歷,分別落到兩顆樹的葉子節(jié)點上。假設該樣本落在左邊葉子節(jié)點的編碼為[0,1,0],落在右邊葉子節(jié)點的編碼為[0,1],則該樣本經過GBDT最終變?yōu)橐粋€5維的向量,作為LR的新輸入進行訓練。
本文研究了GBDT+LR、SVM、DNN在相同的火焰特征數(shù)據集的分類指標情況。首先,驗證了三種算法模型在相同數(shù)據集上的準確率情況。單組試驗的準確率如圖8所示。
圖8 單組試驗的準確率Fig.8 Accuracy of single group experiment
對比結果表明,基于GBDT+LR的分類模型明顯優(yōu)于傳統(tǒng)的SVM和DNN模型。為了對模型的綜合性進行準確的度量,進行50次重復試驗。每次隨機選取20% 數(shù)據集作為驗證集,并計算準確率、精確率、召回率、F1、Kappa指標。重復試驗的指標平均值及標準差如表1所示。
表1 重復試驗的指標平均值及標準差
從表1可以看出,經過多次重復試驗后,GBDT+LR模型的各項指標平均值都優(yōu)于其他模型。在50次試驗指標的平均值和標準差方面,DNN略優(yōu)于SVM,GBDT+LR得到的試驗結果標準差遠小于其他兩個模型。這說明了GBDT+LR模型在處理不規(guī)律的火焰特征數(shù)據時具有明顯的優(yōu)勢。
本文首先通過對燃氣火焰進行完整、有效的預處理,為之后的火焰特征提取奠定基礎。除了基于火焰特性提取的特征之外,創(chuàng)新性地將GBDT+LR模型的方案引入火焰狀態(tài)檢測領域,實現(xiàn)了對特征的進一步非線性組合,增強了模型的表達能力。試驗證明,基于GBDT+LR的燃氣火焰狀態(tài)檢測模型具有很好的精度和穩(wěn)定性。