陳長友,傅鈺雯,涂沛馳,舒文,楊健晟
(1.貴州大學(xué)電氣工程學(xué)院,貴陽 550025;2.貴州交通職業(yè)技術(shù)學(xué)院物流工程系,貴陽 550025)
化石燃料是我國最主要的能源形式。隨著我國經(jīng)濟(jì)發(fā)展對(duì)能源需求與日俱增,在提高化石燃料燃燒效率和減少污染物排放方面都提出了更高的要求。在燃燒工業(yè)領(lǐng)域中,檢測(cè)燃燒爐內(nèi)火焰相關(guān)參數(shù)判斷燃燒狀態(tài),有效控制燃料與空氣的供給關(guān)系,是提高能源轉(zhuǎn)換效率和減少燃燒污染物生成的有效手段。其中,燃空當(dāng)量比是表征燃料與空氣混合的一個(gè)重要參數(shù),是確定系統(tǒng)性能的因素之一,也是影響燃燒污染物生成的重要因數(shù)[1]。因此測(cè)量火焰當(dāng)量比對(duì)節(jié)能減排具有重大的意義。
火焰是燃料和空氣燃燒過程中釋放的可見光和熱輻射的形式,是燃燒過程的綜合表征。對(duì)于碳?xì)浠鹧娑裕鹧姘l(fā)出的藍(lán)綠光是由于燃燒反應(yīng)中產(chǎn)生的激發(fā)態(tài)自由基CH(*430 nm)和C2(*516 nm)等回歸基態(tài)時(shí)在可見光譜內(nèi)釋放相應(yīng)光子引起的化學(xué)發(fā)光,而火焰的紅黃光是不完全燃燒生成的碳黑在連續(xù)光譜段的黑體輻射[2]。有研究表明,碳?xì)浠鹧孀杂苫鵆H*和C2*的化學(xué)發(fā)光與預(yù)混火焰燃燒當(dāng)量比之間存在密切的關(guān)系,通過測(cè)量自由基CH*與C2*濃度比值可以間接測(cè)量當(dāng)量比[2?4];Clark等[5]研究發(fā)現(xiàn)自由基C2*與CH*的比值可以用來近似表示當(dāng)量比,Haber等[6]也證實(shí)了自由基化學(xué)發(fā)光CH*/C2*的比值與當(dāng)量比具有相似的響應(yīng)。由于顏色是光譜的表征形式,所以通過測(cè)量火焰顏色也可以間接獲得自由基化學(xué)發(fā)光信息。2008年,Huang等[7]發(fā)現(xiàn)在RGB(Red?green?blue)顏色模型中,預(yù)混甲烷火焰圖像的藍(lán)色和綠色通道的中值強(qiáng)度與CH*和C2*化學(xué)發(fā)光強(qiáng)度非常匹配,以此為依據(jù)提出了首個(gè)基于火焰顏色測(cè)量火焰當(dāng)量比的軟測(cè)量模型,該模型以藍(lán)色/綠色(B/G)的比值作為輸入,以對(duì)應(yīng)火焰當(dāng)量比值作為模型輸出,通過線性擬合建立B/G與當(dāng)量比的函數(shù)關(guān)系。隨后,Huang等利用該方法分別對(duì)甲烷和乙烯兩種燃料在不同當(dāng)量比下的化學(xué)發(fā)光進(jìn)行測(cè)量,通過對(duì)比傳統(tǒng)的光譜儀法和濾波片法,證實(shí)了在RGB模型下的B/G值可以用來測(cè)量燃空當(dāng)量比[8]。通過顏色建模測(cè)量當(dāng)量比方法對(duì)成像設(shè)備要求低、操作簡單、數(shù)據(jù)處理便捷,因此很快受到其他研究者的關(guān)注。2014年,Mi?gliorini等[9]利用光譜儀法、濾波片法和數(shù)字顏色建模法,對(duì)不同當(dāng)量比下甲烷預(yù)混火焰中CH*和自由基化學(xué)發(fā)光進(jìn)行了測(cè)量,實(shí)驗(yàn)結(jié)果驗(yàn)證了數(shù)字顏色建模法對(duì)燃空當(dāng)量比測(cè)量的可行性。目前,基于顏色建模的火焰當(dāng)量比檢測(cè)方法已經(jīng)應(yīng)用于多類基礎(chǔ)燃燒研究,并取得了一定的成果[10?14]。
由于成像顏色會(huì)受到彩色圖像傳感器光譜響應(yīng)函數(shù)差異的影響,2019年Yang等[15]等通過標(biāo)定相機(jī)傳感器的光譜響應(yīng),改進(jìn)了利用藍(lán)色和綠色通道測(cè)量CH*和化學(xué)發(fā)光的方法,優(yōu)化了基于圖像顏色與化學(xué)發(fā)光之間的數(shù)學(xué)模型。2020年龍凱等[16]試圖通過白平衡處理校正成像顏色來提高火焰當(dāng)量比顏色模型的普適性。Trindade等[17]也曾設(shè)計(jì)了4種不同的顏色輸入構(gòu)建模型,試圖通過對(duì)比尋找最優(yōu)的表征火焰當(dāng)量比模型的數(shù)字顏色輸入。由于成像過程影響因素較多,如光學(xué)鏡頭色偏、圖像傳感器濾波片光譜特性不一致、制造工藝差異以及插值算法區(qū)別等,使得這些方法僅通過單一顏色比值簡單擬合得到的顏色與當(dāng)量比軟測(cè)量模型存在較大的不確定性及誤差。近年來,隨著機(jī)器學(xué)習(xí)智能算法的快速發(fā)展,為燃燒過程中生成的中態(tài)產(chǎn)物、終態(tài)產(chǎn)物以及相關(guān)參數(shù)的軟測(cè)量建模提供了新的方法。以支持向量(Support vector machine,SVM)、BP神經(jīng)網(wǎng)絡(luò)和極限學(xué)習(xí)(Extreme learning machine,ELM)等為代表機(jī)器學(xué)習(xí)算法已經(jīng)逐步應(yīng)用于燃燒診斷領(lǐng)域。例如:通過提取研究對(duì)象時(shí)間和空間上的相關(guān)特征,包括顏色、紋理和運(yùn)動(dòng)等,進(jìn)一步應(yīng)用機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)火焰、煙霧和燃料的識(shí)別以及燃燒污染物排放預(yù)測(cè),并取得很好的識(shí)別率和回歸預(yù)測(cè)效果[16?21];通過融合火焰靜態(tài)和動(dòng)態(tài)特征,基于ELM算法對(duì)特征數(shù)據(jù)集進(jìn)行訓(xùn)練與測(cè)試,進(jìn)而實(shí)現(xiàn)火焰的檢測(cè),實(shí)驗(yàn)結(jié)果表明,該方法在環(huán)境干擾較小的情況下具有較高的時(shí)效性和檢測(cè)精度;把目標(biāo)集中在算法的改進(jìn)與優(yōu)化方面,通過優(yōu)化算法來提高識(shí)別率和降低預(yù)測(cè)誤差[22]。目前這些研究主要基于特定數(shù)據(jù)集或特定應(yīng)用取得了良好的表現(xiàn)性能,并未有通過機(jī)器學(xué)習(xí)火焰顏色特征檢測(cè)火焰當(dāng)量比的相關(guān)研究。
因此,本文基于火焰顏色?自由基化學(xué)發(fā)光?當(dāng)量比之間的物理轉(zhuǎn)換原理,通過特征工程構(gòu)建火焰多維顏色特征數(shù)據(jù),利用SVM機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)甲烷預(yù)混火焰燃燒當(dāng)量比的軟測(cè)量。
甲烷是天然氣、煤層氣等能源的主要成分,為此本文主要針對(duì)甲烷預(yù)混火焰燃燒當(dāng)量比測(cè)量展開實(shí)驗(yàn)研究。實(shí)驗(yàn)平臺(tái)包括3個(gè)部分。
(1)燃燒實(shí)驗(yàn)平臺(tái)
本文使用的燃燒實(shí)驗(yàn)平臺(tái)為自制本生燈預(yù)混/擴(kuò)散火焰基礎(chǔ)燃燒裝置,包括空氣壓縮機(jī)、甲烷(99.9%)氣瓶、氣體流量計(jì)、壓力表、預(yù)混管以及燃燒器(本生燈)等裝置組成,基本架構(gòu)如圖1所示。其中氣體流量計(jì)MFC300最大量程為500 sccm,精度高達(dá)±0.5%FS,本生燈燃燒管口直徑為6 mm。試驗(yàn)中通過Labview控制流量計(jì)使得甲烷(CH4)與空氣(Air)分別從不同的氣路管道輸送至預(yù)混管進(jìn)行充分混合(為保證混合均勻,每組工況點(diǎn)燃前預(yù)混5 min),然后送至本生燈進(jìn)行點(diǎn)燃燃燒。
圖1 燃燒平臺(tái)基本示意圖Fig.1 Schematic of combustion platform
(2)成像實(shí)驗(yàn)平臺(tái)
本文所采用的成像裝置為WP?030 CMOS微型工業(yè)相機(jī),5 Gb/s傳輸寬帶,采集傳輸速度可達(dá)2×109像素/s,最高幀率達(dá)到815幀/s,最高像素500萬,內(nèi)置64 MB緩存,確保圖像數(shù)據(jù)傳輸更加穩(wěn)定,成像鏡頭光圈為F1.4、焦距f=15~30 mm。
(3)數(shù)據(jù)樣本處理及訓(xùn)練平臺(tái)
數(shù)據(jù)樣本處理及訓(xùn)練平臺(tái)采用的是CPU為Intel酷睿I5?4210U、可超頻至2.7 GHz的計(jì)算機(jī)、64位操作系統(tǒng),編程軟件為MATLAB。
建模過程的技術(shù)路線大致可分為火焰圖像數(shù)據(jù)采集、火焰顏色特征工程構(gòu)建與SVM訓(xùn)練數(shù)據(jù)建模3個(gè)部分,如圖2所示?;鹧鎴D像使用WP?030微型工業(yè)相機(jī)進(jìn)行采集并將其送至計(jì)算機(jī),在計(jì)算機(jī)上運(yùn)用數(shù)字圖像處理技術(shù)對(duì)采集的火焰圖像進(jìn)行預(yù)處理,以獲取火焰圖像目標(biāo)區(qū)域,即感興趣區(qū)域(Region of interest,RoI)。進(jìn)一步在RoI提取不同顏色空間多顏色特征,以此設(shè)計(jì)并構(gòu)建火焰顏色特征工程。最后,在構(gòu)建的火焰顏色特征工程基礎(chǔ)上結(jié)合改進(jìn)的SVM算法訓(xùn)練得到甲烷預(yù)混火焰燃燒當(dāng)量比測(cè)量模型。
圖2 本文提出的甲烷預(yù)混火焰當(dāng)量比測(cè)量系統(tǒng)框圖Fig.2 Diagram of the proposed methane premixed flame equivalent ratio measurement system
對(duì)于數(shù)據(jù)樣本采集,采用WP?030工業(yè)相機(jī)采集了當(dāng)量比Φ從0.7~1.5不同工況下的火焰圖像,其中,甲烷流量恒定設(shè)置為100 sccm,根據(jù)理論空燃比、實(shí)際空燃比以及當(dāng)量比之間的變換關(guān)系,例如Φ=1.0時(shí),CH4為100 sccm,此時(shí)空氣為171 sccm;通過改變空氣流量值進(jìn)而實(shí)現(xiàn)不燃燒工況;在穩(wěn)定燃燒狀態(tài)下以當(dāng)量比間隔Φ=0.05為一組樣本工況進(jìn)行采集。成像快門時(shí)間設(shè)置為0.005 s、幀率為100幀/s,每種當(dāng)量比工況連續(xù)采集時(shí)間t=1 s數(shù)據(jù),共計(jì)100張火焰圖像。所有工況下共采集1 800張火焰圖像數(shù)據(jù),不同工況火焰圖像樣本數(shù)據(jù)示例如圖3所示。
圖3 不同工況火焰圖像數(shù)據(jù)Fig.3 Flame image data under different working conditions
隨著當(dāng)量比值增加,從圖3不同工況火焰圖像數(shù)據(jù)可以明顯看出,火焰圖像在Φ=1.15~1.5工況下火焰頂部存在黃色區(qū)域,由于黃色火焰與藍(lán)色火焰產(chǎn)生機(jī)理完全不同,為了避免這種黃色火焰對(duì)當(dāng)量比軟測(cè)量實(shí)驗(yàn)結(jié)果造成影響,需要采用相關(guān)圖像處理技術(shù)對(duì)火焰圖像進(jìn)行預(yù)處理。本文根據(jù)預(yù)混火焰與擴(kuò)散火焰的數(shù)字火焰顏色分布(Digital flame colour distribu?tion,DFCD)[13]存 在 明 顯 的 分 布 差 異,利 用DFCD技術(shù)實(shí)現(xiàn)火焰區(qū)域的分割,并對(duì)分割的火焰圖像進(jìn)行濾波處理以濾除圖像背景噪聲的干擾??紤]到由于中值濾波算法在去除圖像噪聲同時(shí)也會(huì)對(duì)圖像細(xì)節(jié)造成影響,因此對(duì)初步處理后RGB圖像進(jìn)行中值濾波后的區(qū)域圖像不能視為目標(biāo)區(qū)域,需要進(jìn)一步將原始圖像在RGB、HSV、YCbCr不同顏色空間模型分布下的各顏色通道值分別與DFCD技術(shù)處理之后得到的二值圖像進(jìn)行邏輯乘運(yùn)算,通過邏輯運(yùn)算最終得到火焰圖像目標(biāo)區(qū)域,詳細(xì)的火焰圖像目標(biāo)區(qū)域獲取算法流程如圖4所示。其中,HSV是根據(jù)顏色的直觀特性得到一種顏色空間模型,具體指色相(Hue)分量H、飽和度(Satura?tion)分 量S和明度(Value)分量V[23],而對(duì) 于YCbCr顏色空間模型,其中Y指亮度分量,Cb指藍(lán)色色度分量,Cr指紅色色度分量,YCbCr模型來源于YUV色彩模型[24]。根據(jù)算法流程使用MATLAB軟件編程實(shí)現(xiàn)火焰圖像RoI獲取,如圖5所示。其中圖5(b,c)清晰地展示了采用DFCD技術(shù)可以很好地實(shí)現(xiàn)黃色火焰與藍(lán)色火焰的分離以及火焰圖像目標(biāo)區(qū)域的獲取。
圖4 基于DFCD技術(shù)的火焰圖像目標(biāo)區(qū)域獲取算法流程Fig.4 Diagram of flame RoI using DFCD
圖5 基于DFCD技術(shù)的火焰圖像分割結(jié)果Fig.5 Flame image segmentation by DFCD
對(duì)于火焰顏色特征提取,常用的顏色空間模型有RGB、HSV和YCbCr等,火焰圖像在不同的顏色空間模型下具有不同的顏色分布,其中RGB應(yīng)用最為廣泛,并且HSV和YCbCr顏色空間模型可以由RGB顏色模型通過相應(yīng)的線性變換或者非線性變換得到[25?26]。
通過圖像預(yù)處理階段獲取火焰圖像ROI,設(shè)計(jì)并提取甲烷燃燒預(yù)混火焰圖像特征:選取不同顏色空間模型下的基本顏色分量及相互間比值作為顏色特征,以RGB顏色空間模型為例,設(shè)計(jì)了R、G、B、B/G、R/(R+B+G)等12維火焰顏色特征,其中R、G、B分別指RGB顏色模型中的紅色分量、綠色分量和藍(lán)色分量,類似地提取HSV和YCbCr顏色空間模型的顏色特征,設(shè)計(jì)并提取了36維火焰圖像顏色特征,如表1所示。
表1 火焰圖像顏色特征Table 1 Color features of flame image
特征選擇是從多種特征中選擇出較為有效的特征,即數(shù)據(jù)挖據(jù),是特征工程構(gòu)建中的關(guān)鍵環(huán)節(jié)之一。因?yàn)樘卣鞯倪x擇對(duì)甲烷預(yù)混火焰燃燒當(dāng)量比測(cè)量模型的表現(xiàn)性能具有重要的影響,主要體現(xiàn)在模型計(jì)算復(fù)雜度和泛化能力2個(gè)方面。為此,本文采用基于Spearman[27]相關(guān)性分析和隨機(jī)森林算法(Random forest,RF)[28?29]相結(jié)合手段實(shí)現(xiàn)特征的降維處理。
2.3.1 基于Spearman的特征選擇
對(duì)于特征提取的36維火焰顏色特征,采用統(tǒng)計(jì)學(xué)習(xí)理論中的Spearman相關(guān)性分析剔除冗余特征,即該類特征所包含的信息可以從其他特征中推演出來或者存在一些特征它們所包含的信息具有相似性,Spearman相關(guān)系數(shù)法通過計(jì)算特征之間的相關(guān)系數(shù)進(jìn)而篩選出相關(guān)性較小的特征,其基本原理為
式中:di表示秩序;N表示樣本容量;以RGB顏色空間模型的顏色特征為例,計(jì)算其12維顏色特征Spearman相關(guān)系數(shù),得到火焰顏色特征之間相關(guān)系數(shù)矩陣如表2所示。
表2 RGB顏色空間特征之間的相關(guān)系數(shù)矩陣Table 2 Correlation coefficient matrix between RGB color space features
設(shè)置閾值為0.95,相關(guān)系數(shù)大于0.95表示特征之間相關(guān)性較高,從表2中可以看出特征R與G、R與B、G/B與R/S、R/B與B/S之間的相關(guān)性較高,因此剔除G、B、R/B、G/B顏色特征,最后得到8維的火焰顏色特征。類似地,計(jì)算HSV、YCbCr顏色空間的火焰顏色特征之間的相關(guān)系數(shù),剔除相關(guān)性較大的特征,最終得到22維顏色特征子集。
2.3.2 基于RF的特征選擇
RF算法是一個(gè)包含多棵決策樹的集成學(xué)習(xí)方法,每棵決策樹代表一個(gè)分類器。RF算法學(xué)習(xí)過程中會(huì)得到多種決策結(jié)果,然后根據(jù)決策結(jié)果評(píng)估最后的分類效果。因此,本文采用RF算法對(duì)基于Spearman算法相關(guān)性分析得到的22維火焰顏色特征進(jìn)行選擇,通過進(jìn)一步降維處理,選擇出相對(duì)較為重要的特征,即篩選與預(yù)混火焰燃燒當(dāng)量比相關(guān)性較大的特征。其基本思想通過分析每個(gè)特征在隨機(jī)森林中的每顆樹上所做的貢獻(xiàn),然后求取平均值,對(duì)比特征之間的貢獻(xiàn)大小,最后篩選出貢獻(xiàn)較大的特征。這里采用基尼指數(shù)(Gini index,GI)指標(biāo)進(jìn)行衡量貢獻(xiàn),表達(dá)式為
式中:N,m分別表示類別和樹節(jié)點(diǎn);Pmk表示節(jié)點(diǎn)m中類別k所占的比例。在Python軟件上實(shí)現(xiàn)RF算法,通過相關(guān)性分析得到火焰顏色特征屬性為22,并以此建立決策樹數(shù)目為22隨機(jī)森林,進(jìn)一步分析不同特征在每一顆決策樹上的貢獻(xiàn)。碳?xì)漕A(yù)混火焰燃燒當(dāng)量比作為標(biāo)簽,通過學(xué)習(xí)得到火焰顏色特征與火焰燃燒當(dāng)量比之間相關(guān)性排序,火焰顏色特征重要性如圖6所示。圖中展示每個(gè)火焰特征在每顆決策樹上貢獻(xiàn)大小,選擇GI大于0.02的火焰顏色特征作為特征數(shù)據(jù)集,完成火焰顏色特征的選擇,最終樣本數(shù)據(jù)維度降至16維。
圖6 基于RF算法火焰顏色特征重要性排序Fig.6 Importance ranking of flame color features based on RF algorithm
SVM是一種尋求全局最優(yōu)解和實(shí)現(xiàn)結(jié)構(gòu)風(fēng)險(xiǎn)最小的機(jī)器學(xué)習(xí)算法,常用于分類和回歸預(yù)測(cè)[30]。與當(dāng)前發(fā)展較為迅速的深度學(xué)習(xí)算法[31]相比,SVM可以通過核函數(shù)映射關(guān)系在高維空間實(shí)現(xiàn)低維空間的回歸預(yù)測(cè),而深度學(xué)習(xí)網(wǎng)絡(luò)模型表現(xiàn)性能很大程度上取決于特征樣本數(shù)據(jù)集容量,同時(shí)對(duì)硬件設(shè)備要求非常高,即成本較高。因此本文采用SVM實(shí)現(xiàn)碳?xì)漕A(yù)混火焰燃燒當(dāng)量比軟測(cè)量模型的構(gòu)建。
SVM核心思想是尋求最大分類間隔,對(duì)于回歸問題,其思想和分類非常類似;區(qū)別在于不同的維度空間。分類問題是在二維空間中進(jìn)行,而回歸通常是在高維空間中尋求最優(yōu)超平面以實(shí)現(xiàn)低維空間的不可分問題。對(duì)于預(yù)混火焰燃燒當(dāng)量比軟測(cè)量建模,該數(shù)學(xué)模型為典型的多輸入單輸出結(jié)構(gòu),給定訓(xùn)練數(shù)據(jù)集{(xi,yi),i=1,2,…,n},其回歸估計(jì)預(yù)測(cè)模型[31?33]表達(dá)式為
式中:xi∈Rl為輸入變量,l表示維度;w表示權(quán)重向量;φ(x)為訓(xùn)練樣本的高維非線性映射;b表示偏置。
約束條件為
優(yōu)化目標(biāo)為
式中:ξi,為松弛因子;ε為損失函數(shù);C(C>0)為規(guī)則化參數(shù),也稱懲罰因子。
綜上所述,約束條件與優(yōu)化目標(biāo)構(gòu)成了原所求的回歸估計(jì)問題,根據(jù)式(4,5)可構(gòu)建拉格朗日函數(shù)對(duì)該問題進(jìn)行求解,分別對(duì)w,b,ξi,求偏導(dǎo)數(shù)并令其等于零,結(jié)合支持向量機(jī)拉格朗日乘子與不等式約束的乘積[34]條件最終求解出回歸估計(jì)數(shù)學(xué)模型為
式中:,ai為拉格朗日乘子向量,根據(jù)Mercer條件,特征空間中的內(nèi)積[φ(xi)φ(xj)]可以用核函數(shù)k(xi,xj)代替,SVM的表現(xiàn)性能很大程度依賴核函數(shù)的選擇,基本的核函數(shù)有線性核函數(shù)、多項(xiàng)式核函數(shù)、徑向基核函數(shù)(Radical basis function,RBF)和Sigmoid核函數(shù)。其中RBF核函數(shù)應(yīng)用較為廣泛,所需確定的參數(shù)較少,計(jì)算相對(duì)簡單、復(fù)雜度小,計(jì)算公式如式(7)所示。因此本文選RBF核函數(shù)代替特征空間的內(nèi)積,則式(6)可改寫為式(8)。
式(7)中σ為設(shè)定的參數(shù)。針對(duì)多輸入多輸出回歸問題,只需運(yùn)用上述求解方法分別對(duì)多個(gè)多輸入單輸出系統(tǒng)進(jìn)行求解便可得到,對(duì)于火焰燃燒當(dāng)量比軟測(cè)量模型而言,某一種工況對(duì)應(yīng)是多輸入但輸出系統(tǒng),但是多種工況就形成了多輸入多輸出回歸估計(jì)問題,因此不同工況下的火焰燃燒當(dāng)量比軟測(cè)量模型具體描述為
式中:i表示工況情況,即不同當(dāng)量比的情況。
試驗(yàn)中將火焰不同燃燒當(dāng)量比作為SVM機(jī)器學(xué)習(xí)算法訓(xùn)練預(yù)測(cè)標(biāo)簽,每種工況下選擇100張火焰圖片,結(jié)合特征工程構(gòu)建得到16維火焰顏色特征,用于學(xué)習(xí)SVM。學(xué)習(xí)前,需要將特征數(shù)據(jù)集進(jìn)行簡單的歸一化處理,以避免較大的火焰特征數(shù)據(jù)掩蓋較小的數(shù)據(jù),使得最終的訓(xùn)練結(jié)果不佳[19]。學(xué)習(xí)中80%特征數(shù)據(jù)作為訓(xùn)練集,20%特征數(shù)據(jù)作為測(cè)試集,通過訓(xùn)練SVM得到基于火焰顏色特征的甲烷預(yù)混火焰燃燒當(dāng)量比軟測(cè)量模型,其回歸預(yù)測(cè)模型評(píng)價(jià)指標(biāo)采用均方誤差(Mean square error,MSE)和平方相關(guān)系數(shù)R2(Squared correlation coefficient)進(jìn)行評(píng)判,表達(dá)式為
式中:n表示樣本容量;yi表示真實(shí)值,表示yi的均值;fi(x)表示預(yù)測(cè)值。
本文選擇RBF徑向基核函數(shù)進(jìn)行預(yù)測(cè),其懲罰參數(shù)c與g核函數(shù)參數(shù)對(duì)SVM算法的表現(xiàn)性能起著決定性的作用。這里采用網(wǎng)格搜索法[35]尋求最優(yōu)參數(shù)優(yōu)化SVM算法,基本步驟如下:
(1)粗略設(shè)置網(wǎng)格搜索法搜索初始范圍,c與g的初始范圍設(shè)置為[2-10,210],根據(jù)參數(shù)結(jié)果選擇的等高線圖進(jìn)一步改進(jìn)c與g的搜尋范圍。
(2)采用k折交叉驗(yàn)證方法對(duì)訓(xùn)練集進(jìn)行測(cè)試,這里k是指將原始數(shù)據(jù)分成k組,常采用默認(rèn)值k=3。
(3)根據(jù)測(cè)試結(jié)果確定c與g搜索范圍分別為[2-4,24]和[2-4,26],搜索步長設(shè)置為0.5,k=3,尋得最優(yōu)參數(shù)c=16、g=64;并將該最優(yōu)參數(shù)優(yōu)化SVM。通常,算法的效率主要表現(xiàn)為模型的訓(xùn)練與測(cè)試整個(gè)過程,而參數(shù)的選擇對(duì)模型的表現(xiàn)性能與時(shí)效性具有至關(guān)重要的作用。本文選擇GSM算法優(yōu)化SVM參數(shù)選擇,并不斷改進(jìn)參數(shù)搜尋范圍,其目的是為降低時(shí)間消耗成本,同時(shí)確保模型的回歸預(yù)測(cè)精度。因此,優(yōu)化后的SVM算法具有很好的時(shí)效性和表現(xiàn)性能,其尋優(yōu)結(jié)果如表3所示。
表3 參數(shù)尋優(yōu)結(jié)果對(duì)比Table 3 Comparison of parameter optimization results
通過測(cè)試得到預(yù)混火焰燃燒當(dāng)量比預(yù)測(cè)誤差結(jié)果如圖7所示。從圖7中可以清晰看出,基于SVM預(yù)混火焰燃燒當(dāng)量比預(yù)測(cè)取得很好的預(yù)測(cè)結(jié)果,相對(duì)誤差都集中在-0.3~0.5之間,通過計(jì)算其均方根誤差MSE=0.023,R2=81.31%。
圖7 基于SVM預(yù)混火焰燃燒當(dāng)量比預(yù)測(cè)結(jié)果相對(duì)誤差Fig.7 MSE of prediction result based on SVM pre?mixed flame combustion equivalent ratio
為了進(jìn)一步驗(yàn)證該數(shù)學(xué)模型的效果,本文將該算法與傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)[36]、ELM算法[37]進(jìn)行對(duì)比分析。在同一特征數(shù)據(jù)集下,BP神經(jīng)網(wǎng)絡(luò)和ELM極限學(xué)習(xí)網(wǎng)絡(luò)模型的隱含層統(tǒng)一設(shè)置為25,其中BP神經(jīng)網(wǎng)絡(luò)是一種由輸入層、隱含層和輸出層組成誤差反向傳播的前饋神經(jīng)網(wǎng)絡(luò);本文構(gòu)建的網(wǎng)絡(luò)結(jié)構(gòu)為16-25-1,網(wǎng)絡(luò)最大訓(xùn)練次數(shù)為1 000、訓(xùn)練要求誤差為1e-3、學(xué)習(xí)率設(shè)置為0.1;而ELM算法僅設(shè)置隱含層節(jié)點(diǎn)數(shù)目就可以獲得唯一最優(yōu)解,其訓(xùn)練速度較快。通過訓(xùn)練與測(cè)試得到基于不同算法的預(yù)混火焰燃燒當(dāng)量比的預(yù)測(cè)結(jié)果,如圖8所示。由于采集的火焰圖片數(shù)據(jù)間隔Φ=0.05采集一次,采集間隔較小,因此相鄰2組當(dāng)量比工況下的火焰圖像數(shù)據(jù)分布非常相近。在試驗(yàn)中,為了使試驗(yàn)結(jié)果便于分析與討論,選擇間隔Φ=0.15的火焰圖片數(shù)據(jù)作為本文實(shí)驗(yàn)數(shù)據(jù),共有7種不同工況,分別為當(dāng)量比Φ=0.7、Φ=0.85、Φ=1、Φ=1.25、Φ=1.31、Φ=1.4、Φ=1.5。20%的火焰數(shù)據(jù)作為測(cè)試集,并且每20組測(cè)試數(shù)據(jù)對(duì)應(yīng)同一個(gè)工況,通過對(duì)比不同算法的預(yù)測(cè)結(jié)果發(fā)現(xiàn),SVM表現(xiàn)性能優(yōu)于BP神經(jīng)網(wǎng)絡(luò)與ELM極限學(xué)習(xí),基于SVM算法的預(yù)測(cè)結(jié)果相對(duì)于目標(biāo)值其相關(guān)性高于其余2種算法。
圖8 基于不同算法的預(yù)混火焰燃燒當(dāng)量比預(yù)測(cè)結(jié)果對(duì)比Fig.8 Combustion equivalence ratio prediction result comparison of premixed flame based on different algorithms
從圖8中可以看出,在當(dāng)量比Φ=1.25與Φ=1.31時(shí),基于BP神經(jīng)網(wǎng)絡(luò)和ELM算法預(yù)測(cè)值與參考值波動(dòng)較大,BP神經(jīng)網(wǎng)絡(luò)易陷入局部最優(yōu),同時(shí)收斂速度較慢。ELM是針對(duì)傳統(tǒng)神經(jīng)網(wǎng)絡(luò)訓(xùn)練速度較慢和易陷入局部最優(yōu)的一種改進(jìn)網(wǎng)絡(luò)學(xué)習(xí)算法,通常其網(wǎng)絡(luò)隱含層數(shù)目很難確定,相比較而言,基于GSM算法優(yōu)化SVM實(shí)現(xiàn)甲烷預(yù)混火焰燃燒當(dāng)量比預(yù)測(cè)具有一定的優(yōu)越性,尋求的是全局最優(yōu)解,總體預(yù)測(cè)效果較好。進(jìn)一步計(jì)算基于不同算法下的火焰燃燒當(dāng)量比預(yù)測(cè)絕對(duì)誤差(Abso?lute error,AE),AE結(jié)果如圖9所示。圖9中展示了3種不同算法對(duì)預(yù)混火焰燃燒當(dāng)量比預(yù)測(cè)誤差結(jié)果圖,對(duì)于同一個(gè)數(shù)據(jù)集,基于3種不同算法的最大AE分別為1.14、0.9、0.42,AE指標(biāo)很好地反應(yīng)了預(yù)測(cè)結(jié)果的可信度。表4展示了基于不同算法表現(xiàn)性能結(jié)果對(duì)比。通過對(duì)比不難發(fā)現(xiàn)SVM算法總體回歸預(yù)測(cè)較好,結(jié)果表明本文模型具有較好的回歸預(yù)測(cè)效果,同時(shí),其決定系數(shù)優(yōu)于其余2種算法。
表4 不同算法表現(xiàn)性能結(jié)果對(duì)比Table 4 Comparison of performance results of different algorithms
圖9 基于不同算法預(yù)混火焰燃燒當(dāng)量比回歸預(yù)測(cè)絕對(duì)誤差結(jié)果對(duì)比Fig.9 AE comparison of combustion equivalence ratio regression prediction for premixed flames based on different al?gorithms
本文提出一種基于火焰圖像顏色特征工程的甲烷預(yù)混火焰燃燒當(dāng)量比軟測(cè)量模型構(gòu)建方法。相比傳統(tǒng)單一顏色特征作為模型輸入,本文在RGB、HSV和YCbCr不同顏色空間模型下,設(shè)計(jì)了多種顏色分量以及顏色分量之間的比值共計(jì)36維數(shù)據(jù)作為顏色特征,進(jìn)而應(yīng)用Spearman相關(guān)性分析和RF算法實(shí)現(xiàn)火焰顏色特征選擇進(jìn)行降維處理,最終篩選出表征燃燒當(dāng)量比更深層次的16維火焰顏色特征作為模型輸入,構(gòu)建了甲烷預(yù)混火焰顏色特征工程。同時(shí),相對(duì)傳統(tǒng)簡單的擬合數(shù)據(jù)建模方法,本文提出了通過改進(jìn)GSM尋求最優(yōu)參數(shù)優(yōu)化SVM算法建模,結(jié)果顯示在構(gòu)建的火焰顏色特征工程數(shù)據(jù)集上表現(xiàn)出較好的回歸預(yù)測(cè)結(jié)果。最后,通過與傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)和ELM算法對(duì)比發(fā)現(xiàn),SVM算法回歸預(yù)測(cè)效果在構(gòu)建的特征數(shù)據(jù)集上優(yōu)于BP與ELM。
盡管本文提出的甲烷預(yù)混火焰燃燒當(dāng)量比測(cè)量方法取得了較好的回歸預(yù)測(cè)結(jié)果,但是仍然存在一些不足之處:(1)針對(duì)基于Spearman相關(guān)性分析和RF算法特征選擇閾值設(shè)置主要參考相關(guān)研究選擇與對(duì)比,并沒有深入研究與系統(tǒng)分析;(2)模型評(píng)估僅采用均方誤差和平方相關(guān)系數(shù)指標(biāo)進(jìn)行評(píng)價(jià)。下一步工作將把本文方法應(yīng)用到不同燃料燃燒當(dāng)量比檢測(cè),同時(shí)對(duì)本文存在的不足作進(jìn)一步的研究,包括多元顏色模型選擇(例如引入與設(shè)備無關(guān)的CIE 1931顏色模型等)、參數(shù)選擇以及引入多評(píng)價(jià)指標(biāo)的模型評(píng)估方法。