丁知平, 劉 超, 牛培峰(. 清遠(yuǎn)職業(yè)技術(shù)學(xué)院 信息技術(shù)與創(chuàng)意設(shè)計(jì)學(xué)院, 廣東 清遠(yuǎn) 550; . 貴州航天電器股份有限公司, 貴州 貴陽(yáng) 550009; . 燕山大學(xué) 工業(yè)計(jì)算機(jī)控制工程河北省重點(diǎn)實(shí)驗(yàn)室, 河北 秦皇島 066004)
近年來(lái),隨著我國(guó)對(duì)環(huán)境污染治理的重視,降低NOx排放量是火力發(fā)電廠生存的客觀需要,因此要建立計(jì)算模型預(yù)測(cè)NOx排放量[1~3]。
神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)[4]等人工智能技術(shù)因其良好的處理非線性的能力,可較好地解決NOx建模問(wèn)題,但神經(jīng)網(wǎng)絡(luò)往往出現(xiàn)過(guò)擬合和泛化能力弱等不足,支持向量機(jī)在NOx排放建模方面受到越來(lái)越多的關(guān)注。NOx排放預(yù)測(cè)問(wèn)題由于具有復(fù)雜非線性、多維多模、數(shù)據(jù)樣本少等特征,且需要解決結(jié)構(gòu)風(fēng)險(xiǎn)最小化問(wèn)題。最小二乘支持向量機(jī)(least squares support vector machine,LSSVM)[5]是一種優(yōu)秀的學(xué)習(xí)方法,LSSVM訓(xùn)練過(guò)程中需要確定模型的“超參數(shù)”以建立有效的預(yù)測(cè)模型,如何獲得最優(yōu)的超參數(shù)是NOx排放量模型精度的關(guān)鍵。事實(shí)上,LSSVM超參數(shù)的調(diào)整過(guò)程也是參數(shù)優(yōu)化的過(guò)程,基于LSSVM與尋優(yōu)技術(shù)結(jié)合的燃燒優(yōu)化是降低鍋爐NOx排放的一種有效途徑[6,7]。
引力搜索算法(gravitational search algorithm,GSA)[8]是由Esmat Rashedi等人提出的一種源于對(duì)萬(wàn)有引力定律進(jìn)行模擬的智能優(yōu)化技術(shù),因其具有概念簡(jiǎn)單、易實(shí)現(xiàn)等特征而得到廣泛應(yīng)用[9,10]。然而,GSA在高維多模函數(shù)優(yōu)化中存在優(yōu)化能力弱的問(wèn)題,為進(jìn)一步改善算法的優(yōu)化性能,本文提出了一種改進(jìn)的GSA算法(improved GSA, IGSA),在IGSA算法基礎(chǔ)上,建立了基于IGSA-LSSVM的NOx排放量軟測(cè)量模型。
(1)
在特定的時(shí)間t,作用在質(zhì)點(diǎn)j和質(zhì)點(diǎn)i之間的引力定義為:
(2)
式中:Mi和Mj為質(zhì)點(diǎn)的質(zhì)量;ε為一較小的常數(shù);Rij(t)為質(zhì)點(diǎn)間的距離;G(t)為引力系數(shù)。則作用在第i個(gè)質(zhì)點(diǎn)的第d維上的合力為:
(3)
式中:rankj為[0,1]中的一個(gè)隨機(jī)數(shù)。
根據(jù)運(yùn)動(dòng)定律, 在時(shí)間t質(zhì)點(diǎn)i的d維加速度為:
(4)
在GSA算法中,按式(5)更新質(zhì)點(diǎn)的速度和位置:
(5)
GSA算法雖然有較優(yōu)異的優(yōu)化性能,但在處理部分復(fù)雜優(yōu)化問(wèn)題時(shí),GSA仍然存在早熟收斂、易陷入局部最優(yōu)解的缺點(diǎn)。因此,其尋優(yōu)能力仍需進(jìn)一步改善。
GSA算法的第一步就是初始化種群,一個(gè)較好的能夠覆蓋整個(gè)解空間的初始種群有助于改善進(jìn)化速度和提高解的質(zhì)量。如果包含全局最優(yōu)解的局部解空間不在初始群空間,同時(shí)質(zhì)點(diǎn)的位置更新算法又不能在有限次數(shù)的進(jìn)化過(guò)程內(nèi)將覆蓋空間擴(kuò)延到全局最優(yōu)解所在的區(qū)域,那么過(guò)早收斂就不可避免,可以看出,初始種群個(gè)體的分布狀況直接影響算法的全局收斂性能。針對(duì)原始GSA算法的初始種群是隨機(jī)分布的,其覆蓋空間具有很大的不確定性,本文采用網(wǎng)格算法初始化質(zhì)點(diǎn)的位置群,使初始個(gè)體在海域中均勻分布,其表達(dá)式如式(6)所示:
(6)
利用網(wǎng)格初始化種群,可以在保證初始變量隨機(jī)性的前提下,提高種群的遍歷性,使算法遍歷所有可能的狀態(tài),有利于克服一般隨機(jī)初始化種群給優(yōu)化算法搜索帶來(lái)的局限性。
為進(jìn)一步提高GSA算法的優(yōu)化性能,避免在復(fù)雜高維多模函數(shù)優(yōu)化中出現(xiàn)的早熟現(xiàn)象,提出了線性遞減權(quán)值策略。雖然它在一定程度上有利于改善優(yōu)化性能,但算法沒(méi)有考慮到優(yōu)化問(wèn)題的適應(yīng)度值,在處理部分復(fù)雜非線性?xún)?yōu)化問(wèn)題時(shí)將有可能降低優(yōu)化性能。因此,本文在線性遞減慣性權(quán)值的基礎(chǔ)上結(jié)合適應(yīng)度提出自適應(yīng)遞減的慣性權(quán)值位置更新策略:
(7)
式中:ts和te分別為初始值和最終值,且0 將式(7)代入式(5),得到質(zhì)點(diǎn)的位置更新: (8) (1)初始化參數(shù):最大迭代次數(shù)imax=1 000,種群數(shù)N=50; (2)網(wǎng)格算法初始化種群; (3)計(jì)算種群質(zhì)點(diǎn)的適應(yīng)度值; (4)更新數(shù)據(jù)G(t),Ab(t),Aw(t)和Mi,i=1,2,…,N; (5)按式(3)更新質(zhì)點(diǎn)在各個(gè)方向上的合力; (6)按式(5)計(jì)算質(zhì)點(diǎn)的速度; (7)按式(7)、式(8)更新質(zhì)點(diǎn)的位置,ts和te分別設(shè)為1和0; (8)重復(fù)步驟(3)~(7),直到停止條件滿足。 選取13個(gè)標(biāo)準(zhǔn)函數(shù)用來(lái)評(píng)價(jià)IGSA的優(yōu)化性能,f1~f7為單模態(tài)函數(shù),只有一個(gè)極值點(diǎn),主要用來(lái)考察算法的執(zhí)行能力并測(cè)試算法的尋優(yōu)精度;f8~f13為多模態(tài)函數(shù),具有大量的局部最優(yōu)點(diǎn),是優(yōu)化領(lǐng)域中公認(rèn)的較難優(yōu)化的函數(shù),大部分優(yōu)化算法在對(duì)其進(jìn)行尋優(yōu)的過(guò)程中往往會(huì)陷入局部最優(yōu)點(diǎn),主要用來(lái)檢驗(yàn)算法是否具備避免早熟并搜索全局最優(yōu)解的能力。除f8的最小值為-418.982 9×n(n為解的維數(shù))外,其它12個(gè)函數(shù)的最小值均為零。文獻(xiàn)[11]描述了標(biāo)準(zhǔn)函數(shù)解的取值范圍,指出原始GSA優(yōu)于PSO、RGA和CFO。本文進(jìn)行了蜂群算法(ABC)與原GSA以及IGSA的對(duì)比,結(jié)果見(jiàn)表1。 為有效減少隨機(jī)干擾的影響,每個(gè)算法均獨(dú)立運(yùn)行30次。表中,C.I.為平均收斂迭代次數(shù),Mean為平均最優(yōu)適應(yīng)度值,SD為標(biāo)準(zhǔn)差。 分析表1給出的13個(gè)標(biāo)準(zhǔn)測(cè)試函數(shù)的優(yōu)化結(jié)果發(fā)現(xiàn):對(duì)于單模態(tài)函數(shù),除f6外,在3種算法中,無(wú)論函數(shù)為30維是50維,IGSA的優(yōu)化效果均為最好的,且優(yōu)勢(shì)明顯;對(duì)于多模態(tài)函數(shù),除f12外,IGSA的優(yōu)化效果均為最好的。因而相對(duì)于ABC和GSA,IGSA的優(yōu)解的精度最高。同時(shí)還發(fā)現(xiàn):當(dāng)n=50,IGSA的優(yōu)化精度基本上接近n=30的精度,這在某種程度上說(shuō)明,隨著問(wèn)題復(fù)雜程度的增加,IGSA的優(yōu)化效果并沒(méi)有得到減弱;相比較而言,ABC和GSA隨著維數(shù)的增加,絕大部分的優(yōu)化效果都呈現(xiàn)下降趨勢(shì),尤其是ABC算法,隨著問(wèn)題復(fù)雜程度的增加,其優(yōu)化能力下降明顯。 標(biāo)準(zhǔn)差反映了算法的穩(wěn)健性,平均函數(shù)收斂次數(shù)C.I.反映算法的計(jì)算收斂速度。由表1可知,ABC和GSA對(duì)13個(gè)標(biāo)準(zhǔn)函數(shù)不能一直精確地求解,相對(duì)來(lái)說(shuō),GSA優(yōu)化性能較ABC穩(wěn)定,同時(shí)可明顯觀察到IGSA的優(yōu)化性能較ABC和GSA更精確,其跳出局部極值的能力也較強(qiáng);在優(yōu)化速度方面,IGSA的C.I.指標(biāo)比另外2種算法要少;從標(biāo)準(zhǔn)差可看出ABC和GSA在求解單峰和多峰連續(xù)函數(shù)時(shí)數(shù)值計(jì)算不穩(wěn)定,相比之下,IGSA是最穩(wěn)定的。 最小二乘支持向量機(jī)(LSSVM)是SVM的改進(jìn)且優(yōu)勢(shì)明顯:(1)用等式約束代替SVM算法中的不等式約束;(2)將求解二次規(guī)劃問(wèn)題轉(zhuǎn)化為直接求解線性方程組。兩優(yōu)點(diǎn)使LSSVM方法的優(yōu)化問(wèn)題的求解變?yōu)橥ㄟ^(guò)Kuhn-Tucker條件下得到的一組線性方程組的求解,在一定程度上降低了求解難度、提高了求解速度、改善了模型的泛化能力和預(yù)測(cè)精度,使之更能適應(yīng)于現(xiàn)場(chǎng)實(shí)際應(yīng)用。LSSVM目標(biāo)函數(shù)定義為下: (9) s.t.yi-(wφ(xi)+b)=ξi,i=1,2,…,N (10) y(x) =wT·φ(x)+b (11) 表1 3種優(yōu)化算法性能比較 基于RBF核的LSSVM建立煤粉鍋爐NOx排放預(yù)測(cè)模型,模型性能主要由正則化參數(shù)C和核寬度δ決定[12]。由LSSVM的基本理論及算法推導(dǎo)過(guò)程可知,正則化參數(shù)和核參數(shù)對(duì)于建立有效的LSSVM預(yù)測(cè)模型至關(guān)重要。正則化參數(shù)在于調(diào)節(jié)置信范圍和經(jīng)驗(yàn)風(fēng)險(xiǎn)的比例,若選擇的正則化參數(shù)值越大,意味著對(duì)LSSVM訓(xùn)練的誤差懲罰也越大,此時(shí)訓(xùn)練數(shù)據(jù)的樣本點(diǎn)和真實(shí)值的擬合會(huì)越好,但容易使模型陷入“過(guò)擬合”;若減小其值則會(huì)降低模型的復(fù)雜性。核參數(shù)主要影響樣本數(shù)據(jù)在高維特征空間中的分布復(fù)雜程度,其值選擇的越大,則模型的復(fù)雜度越小,也容易出現(xiàn)“過(guò)擬合”現(xiàn)象;核參數(shù)值越小,則模型擬合出的曲線越光滑。事實(shí)上,最小二乘支持向量機(jī)的超參數(shù)調(diào)整過(guò)程也是參數(shù)優(yōu)化的過(guò)程,采用群智能優(yōu)化算法優(yōu)化選擇超參數(shù)是LSSVM模型目前常用的參數(shù)選擇方法。本文采用IGSA算法優(yōu)化選擇LSSVM參數(shù)對(duì)(C,δ2)。 在模型參數(shù)優(yōu)化過(guò)程中,定義適應(yīng)度函數(shù): (12) 式中:Hr為實(shí)際值;Hp為模型的預(yù)測(cè)值。 圖1為采用IGSA算法優(yōu)化LSSVM參數(shù)、建立NOx排放模型的流程圖。主要思路:采用IGSA算法對(duì)LSSVM模型的超參數(shù)進(jìn)行優(yōu)化,以目標(biāo)函數(shù)適應(yīng)度值最小為原則,通過(guò)判斷是否滿足終止條件,將優(yōu)化得到的參數(shù)代入LSSVM模型,即完成IGSA-LSSVM模型的建立;利用得到的NOx排放模型分析、處理未來(lái)數(shù)據(jù),從而有效地得到研究對(duì)象的估計(jì)或預(yù)測(cè)結(jié)論以便做出有價(jià)值的決策。 圖1 IGSA-LSSVM預(yù)測(cè)模型流程圖Fig.1 Flowchart for IGSA-LSSVM prediction model 采用IGSA算法優(yōu)化LSSVM模型參數(shù),預(yù)測(cè)某330 MW煤粉汽包鍋爐NOx濃度排放量,預(yù)測(cè)結(jié)果與標(biāo)準(zhǔn)GSA、蜂群算法(ABC)和粒子群算法(PSO)優(yōu)化方法進(jìn)行比較。在NOx排放量多工況測(cè)試中,包含影響鍋爐燃燒特性的各種運(yùn)行參數(shù),如發(fā)電負(fù)荷、給煤機(jī)轉(zhuǎn)速、一次風(fēng)、二次風(fēng)等特性參數(shù),具體數(shù)據(jù)見(jiàn)表2。 采用IGSA優(yōu)化LSSVM中的懲罰系數(shù)C和核函數(shù)參數(shù)δ2,利用優(yōu)化后的LSSVM模型預(yù)測(cè)NOx排放量。利用IGSA優(yōu)化LSSVR模型參數(shù),設(shè)定IGSA種群規(guī)模為50,在表2中的19組工況中,選取3~17組數(shù)據(jù)進(jìn)行訓(xùn)練優(yōu)化建模,1組、2組作為預(yù)測(cè)數(shù)據(jù),以此驗(yàn)證IGSA的優(yōu)化性能。 圖2 4種算法預(yù)測(cè)值與實(shí)測(cè)值之間的誤差曲線Fig.2 Error curve between prediction values and true values of 4 algorithms IGSA獲得的最優(yōu)模型參數(shù)(C,δ2)的值為(650, 175),利用此組參數(shù)對(duì)1組、 2組預(yù)測(cè)數(shù)據(jù)和另17組訓(xùn)練數(shù)據(jù)進(jìn)行回歸預(yù)測(cè),同時(shí)與另外3種方法的綜合建模進(jìn)行實(shí)驗(yàn)對(duì)比,預(yù)測(cè)誤差見(jiàn)圖2。表3為4種預(yù)測(cè)方法預(yù)測(cè)NOx排放量的相對(duì)誤差RE。由圖2和表3可以看出:利用IGSA優(yōu)化LSSVM模型參數(shù),然后基于優(yōu)化參數(shù)建立模型的預(yù)測(cè)精度較ABC、PSO、GSA優(yōu)化模型的預(yù)測(cè)精度更高,即IGSA能夠比ABC、PSO和GSA找到更好的模型參數(shù)。 表2 鍋爐運(yùn)行試驗(yàn)數(shù)據(jù) 表3 4種算法預(yù)測(cè)結(jié)果精度分析 燃煤鍋爐NOx排放量特性受到多種因素的影響,且其影響關(guān)系復(fù)雜,NOx排放量的預(yù)測(cè)和控制均很困難,本文采用最小二乘支持向量機(jī)方法建立NOx排放量軟測(cè)量模型。為改善LSSVM的預(yù)測(cè)精度和泛化能力,采用改進(jìn)的引力搜索算法優(yōu)化選擇LSSVM的模型參數(shù)。以某電廠330 MW煤粉鍋爐為測(cè)試對(duì)象,采用IGSA算法優(yōu)化最小二乘支持向量機(jī)的超參數(shù)并建立NOx排放的預(yù)測(cè)模型,通過(guò)將DCS采集到的相關(guān)數(shù)據(jù)作為訓(xùn)練樣本、測(cè)試樣本,對(duì)模型進(jìn)行訓(xùn)練和檢驗(yàn),仿真實(shí)驗(yàn)表明,基于IGSA-LSSVM的NOx排放預(yù)測(cè)模型有較好的準(zhǔn)確性和較強(qiáng)的泛化能力。 [參考文獻(xiàn)] [1] Tan P, Xia J. Modeling and optimization of NOxemission in a coal-fired power plant using advanced machine learning methods [J].EnergyProcedia,2014,61:377-380. [2] 牛培峰, 馬云鵬, 張京.基于相關(guān)向量機(jī)的電站鍋爐NOx燃燒優(yōu)化[J].計(jì)量學(xué)報(bào), 2016, 37(2): 191-196. Niu P F, Ma Y P, Zhang J. Utility boilers NOxcombustion optimization based on relevance vector machine[J].ActaMetrologicaSinica, 2016, 37(2): 191-196. [3] 牛培峰, 王丘亞, 馬云鵬,等. 基于量子自適應(yīng)鳥(niǎo)群算法的鍋爐NOx排放特性研究[J]. 計(jì)量學(xué)報(bào), 2017, 38(6): 770-775. Niu P F, Wang Q Y, Ma Y P,etal. Study on NOxemission from boiler based on quantum adaptation bird swarm algorithm[J].ActaMetrologicaSinica, 2017, 38(6): 770-775. [4] 張維平, 趙文蕾, 牛培峰.基于粗糙集與最小二乘支持向量回歸的汽輪機(jī)主蒸汽流量預(yù)測(cè)[J].計(jì)量學(xué)報(bào), 2015, 36(1): 43-47. Zhang W P, Zhao W L, Niu P F. Forecasting of turbine main steam flow based on rough sets and least squars support vector machine regression [J].ActaMetrologicaSinica, 2015, 36(1): 43-47. [5] Liu C, Niu P F. A hybrid heat rate forecasting model using optimized LSSVM based on improved GSA[J].NeuralProcessingLetters,2017,45:299-318. [6] Li Q, Niu P F, Zhang W P. Model NOxemissions by least squares support vector machine with tuning based on ameliorated teaching-learning-based optimization [J].ChemometricsandIntelligentLaboratorySystems,2013,126:11-20. [7] 牛培峰, 王培坤, 李國(guó)強(qiáng).基于自由搜索算法和支持向量機(jī)的燃煤鍋爐NOx建模與優(yōu)化[J].計(jì)量學(xué)報(bào), 2014, 35(6): 626-630. Niu P F, Wang P K, Li G Q. Modeling and optimization of NOxfor coal-fired boilers by free search algorithm and support vector machine [J].ActaMetrologicaSinica, 2014, 35(6): 626-630. [8] Esmat Rashedi, Hossein Nezanudmdi-pour, Saryazdi Saryazdi. GSA: A Gravitational Search Algorithm[J].InformationSciences,2009,179(13):2232-2248. [9] Gouthamkumar N, Sharma Veena, Naresh R. Disruption based gravitational search algorithm for short term hydrothermal scheduling[J].ExpertSystemswithApplications,2015,42(20):7000-7011. [10] Sajjad Yazdani, Hossein Nezamabadi-pour, Shima Kamyab. A gravitational search algorithm for multimodal optimization[J].SwarmandEvolutionaryComputation,2014,14:1-14. [11] Li G Q, Niu P F, Xiao X J. Development and investigation of efficient artificial bee colony algorithm for numerical function optimization[J].AppliedSoftComputing, 2012, 12(1): 320-332. [12] 牛培峰, 劉超, 李國(guó)強(qiáng).汽輪機(jī)熱耗率多模型建模方法研究[J].計(jì)量學(xué)報(bào), 2015, 36(3): 251-255. Niu P F, Liu C, Li G Q. Investigation on multi-model modeling method of steam turbine heat rate[J].ActaMetrologicaSinica, 2015, 36(3): 251-255.3.3 IGSA優(yōu)化步驟
3.4 IGSA性能驗(yàn)證
4 NOx排放預(yù)測(cè)模型
4.1 最小二乘支持向量機(jī)
4.2 IGSA優(yōu)化的LSSVM模型
4.3 IGSA-LSSVM預(yù)測(cè)NOx排放量
5 結(jié) 論