張國(guó)興, 王世朋
(國(guó)能寧夏鴛鴦湖第一發(fā)電有限公司,寧夏 銀川 750011)
目前以煤炭為燃料的火力發(fā)電仍為我國(guó)發(fā)電的主要方式,而發(fā)電過(guò)程中氮氧化物(NOx)的排放又是大氣中的NOx污染的主要源頭之一[1]。為控制燃煤電廠發(fā)電過(guò)程中NOx的過(guò)量排放,減少大氣污染,我國(guó)大多數(shù)電廠采用的是氨催化的選擇性催化還原技術(shù)(SCR)對(duì)鍋爐燃燒煙氣進(jìn)行脫硝,其效率可達(dá)90%以上。因鍋爐燃燒過(guò)程運(yùn)行工況復(fù)雜,反應(yīng)延遲較大,致使SCR入口NOx濃度無(wú)法準(zhǔn)確即時(shí)地測(cè)量,導(dǎo)致SCR反應(yīng)過(guò)程中因噴氨量少使得NOx無(wú)法完全反應(yīng)或者氨逃逸的現(xiàn)象發(fā)生[2]。故建立精準(zhǔn)高效的預(yù)測(cè)模型以滿足對(duì)NOx排放濃度的實(shí)時(shí)監(jiān)測(cè)具有重要意義。
模型預(yù)測(cè)精度好壞有多個(gè)影響因素,其中,建模方法的選擇是主要影響因素之一。近年來(lái),人工智能的蓬勃發(fā)展使得神經(jīng)網(wǎng)絡(luò)成為數(shù)據(jù)建模的重點(diǎn),Li等[3]利用支持向量機(jī)(support vector machine, SVM)建立了NOx排放預(yù)測(cè)模型,實(shí)現(xiàn)了對(duì)氮氧化物排放的實(shí)時(shí)監(jiān)測(cè);Fu等[4]利用長(zhǎng)短期記憶網(wǎng)絡(luò)(long short-term memory, LSTM)建立了脫硫效率預(yù)測(cè)模型,預(yù)測(cè)精度較高。對(duì)模型進(jìn)行超參數(shù)優(yōu)化,可以進(jìn)一步提升模型的訓(xùn)練效率和預(yù)測(cè)精度,單斌斌等[5]利用改進(jìn)天牛須算法優(yōu)化極限學(xué)習(xí)機(jī)(extreme learning machine, ELM),加快了模型預(yù)測(cè)時(shí)間,提高了模型預(yù)測(cè)效率;李沁穎等[6]利用粒子群算法(particle swarm optimization, PSO)獲得滑??刂破鞯淖顑?yōu)參數(shù),提高了控制器的響應(yīng)和精度。
鍋爐燃燒系統(tǒng)具有大遲延,大慣性的特點(diǎn),因此對(duì)模型輸入變量進(jìn)行時(shí)延補(bǔ)償尤為必要。閆來(lái)清等[7]采用K近鄰互信息計(jì)算時(shí)延的方法對(duì)各輸入變量進(jìn)行重構(gòu)后再放入模型進(jìn)行預(yù)測(cè),提升了模型預(yù)測(cè)精度;唐振浩等[8]利用Pearson相關(guān)系數(shù)法對(duì)各輸入變量進(jìn)行時(shí)延性分析重構(gòu),重構(gòu)后的變量輸入模型后使得預(yù)測(cè)結(jié)果有了較大的提升;吳康洛等[9]采用最大互信息系數(shù)(maximal information coefficient, MIC)估計(jì)各變量遲延時(shí)間對(duì)數(shù)據(jù)進(jìn)行重構(gòu),提升了模型的預(yù)測(cè)精度。Hong等[10]利用主成分分析法(principal components analysis, PCA)對(duì)變量進(jìn)行降維重構(gòu),提高了模型效率,但破壞了數(shù)據(jù)本身的信息;劉岳等[11]利用索套算法(least absolute shrinkage and selection operator, LASSO)去除了輸入之間的冗余變量,精簡(jiǎn)了模型結(jié)構(gòu),但沒(méi)有考慮輸入變量對(duì)原始變量的影響,Qiu等[12]利用經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition, EMD)對(duì)數(shù)據(jù)進(jìn)行重構(gòu),提煉了數(shù)據(jù)深層的時(shí)域和頻域信息;謝麗蓉等[13]利用集合經(jīng)驗(yàn)?zāi)B(tài)分解(ensemble empirical mode decomposition, EEMD)將風(fēng)功率信號(hào)分解后進(jìn)行相空間重構(gòu),實(shí)現(xiàn)了特征優(yōu)化提高了預(yù)測(cè)精度。
本實(shí)驗(yàn)采用互信息算法對(duì)各變量與輸出之間進(jìn)行時(shí)延補(bǔ)償計(jì)算,再將加入時(shí)延補(bǔ)償?shù)淖兞糠湃肽P瓦M(jìn)行預(yù)測(cè)。同時(shí),輸入變量的選擇也會(huì)直接影響到模型預(yù)測(cè)結(jié)果,此外還使用K近鄰算法對(duì)初始變量進(jìn)行特征選擇,使用互信息變化率的原理,消除冗余變量的同時(shí)也考慮到了加入數(shù)據(jù)對(duì)原始數(shù)據(jù)的影響。但篩選出來(lái)的原始數(shù)據(jù)其中包含了較多的噪聲及非平穩(wěn)性較高的信息,通過(guò)變分模態(tài)分解并選擇最終輸入變量,最后采用BSO優(yōu)化后的RBF對(duì)NOx濃度進(jìn)行預(yù)測(cè)。在此過(guò)程中,設(shè)計(jì)了一系列相關(guān)實(shí)驗(yàn),以驗(yàn)證各環(huán)節(jié)的有效性。
K近鄰互信息(K-nearest neighbor-mutual information, KNN-MI)采用的是計(jì)算樣本之間的歐氏距離[14]。假設(shè)樣本輸入集D={x1,x2,…,xm},輸出為Y,其中xi=[xi1,xi2,…,xin]T,設(shè)Z為向量空間上面一點(diǎn),Z=(xij,yj),其它點(diǎn)Z′到點(diǎn)Z的距離為:
I(x,y)=ψ(K)-〈ψ(nx+1)+ψ(ny+1)〉+ψ(n)
式中:K取值范圍2~6;ψ為伽馬函數(shù);n為變量個(gè)數(shù)。
由低維K近鄰互信息類推到高維K近鄰互信息,式為:
I(x1,x2,…,xm,Y)=ψ(K)-<ψ(nx1)+ψ(nx1)
+…+ψ(ny)>+mψ(n)
式中:m為輸入變量維度。
變化率[15]式如下:
(1)
當(dāng)一組變量中加入新的變量di后,如果di是不相關(guān)的,則變量的不確定性就會(huì)變大。因此,如果加入變量di是相關(guān)的,則K近鄰互信息變化率就會(huì)變小。由此可得,通過(guò)K近鄰互信息變化率可以對(duì)變量子集進(jìn)行初步前向選擇,既考慮到了高維變量之間的互信息,又考慮到了加入新的變量后對(duì)初始變量的影響。所選出的變量子集有可能會(huì)存在某幾個(gè)變量之間冗余的情況,所以通過(guò)計(jì)算所選變量之間的一維互信息可以刪除冗余變量。基于K近鄰互信息變化率的雙向變量選擇(K-nearest neighbor mutual information change rate, KNN-MI-CR)步驟如下:
1)前向選擇。設(shè)置初始變量子集S,此時(shí)S為空集;計(jì)算輸入變量子集D內(nèi)任一變量xi與輸出Y之間的一維互信息值,并由大到小排列,取互信息值最大的變量放入S集中,作為初始變量。
2)按照步驟1)中剩余輸入變量子集D的順序依次代入式(1)計(jì)算R(S+di,Y)的大小;設(shè)置閾值α=0.1,選取R<0.1所對(duì)應(yīng)變量加入S集中。
3)重復(fù)步驟2),直至所有變量被選取完畢,形成初始變量子集S。
反向選擇:計(jì)算S集中任意2個(gè)變量之間的一維K近鄰互信息值,選取互信息值較大變量組合作為冗余組合,并以步驟1)中所計(jì)算的與輸出變量Y之間的互信息值為參照,刪除冗余變量,形成最優(yōu)變量子集S。
變分模態(tài)分解(variational mode decomposition,VMD)是一種完全非遞歸的信號(hào)處理方法[16]。VMD可以較好的抑制EMD存在的模態(tài)混疊問(wèn)題,能夠有效地處理非平穩(wěn)、非線性序列。提前設(shè)置分解個(gè)數(shù)K,根據(jù)信號(hào)自身特性,VMD算法可以自適應(yīng)地將信號(hào)分解為K個(gè)具有不同中心頻率的固有模態(tài)分量(intrinsic mode function, IMF)。VMD算法分解過(guò)程主要包含對(duì)變分約束問(wèn)題的建模和求解2個(gè)部分,具體分解步驟詳見文獻(xiàn)[17]。
徑向基神經(jīng)網(wǎng)絡(luò)(radial basis function, RBF)是一種具有單隱層的三層前向神經(jīng)網(wǎng)絡(luò),包括輸入層、隱含層和輸出層[18]。RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單,收斂效果好,能夠逼近任意非線性函數(shù),具有逼近能力強(qiáng),學(xué)習(xí)速度快的顯著優(yōu)點(diǎn)。其基本思想就是使用RBF作為隱含層單元的基構(gòu)成隱藏層空間,進(jìn)而對(duì)輸入矢量進(jìn)行變換,將數(shù)據(jù)轉(zhuǎn)化到高維空間,使得線性不可分問(wèn)題在高維空間線性可分。
2.4.1 天牛須搜索算法
天牛須搜索算法(beetle antennae search,BAS)是由Jiang等[19]在2017年提出的一種智能優(yōu)化算法,屬于啟發(fā)式算法的一種。該算法通過(guò)模擬自然界中天牛尋食這一現(xiàn)象,來(lái)達(dá)到快速搜索的目的,是一種單體搜索的算法,具有結(jié)構(gòu)簡(jiǎn)單、計(jì)算量少等優(yōu)點(diǎn),在處理低維優(yōu)化目標(biāo)時(shí)具有非常大的優(yōu)勢(shì)。
天牛須搜索算法具體步驟如下:
1) 初始化天牛。設(shè)置天牛初始質(zhì)心位置為x,左須為xl,右須為xr,兩須之間的距離為d0,維度為k,步長(zhǎng)為Nstep,算法迭代次數(shù)為n。由于天牛頭的朝向是隨機(jī)的,所以其初始方向?yàn)镈ir。
Dir=rands(k,1)
式中:rands為k維隨機(jī)變量,數(shù)值在0~1之間。
2) 計(jì)算左右須位置。將方向歸一化后,通過(guò)式(2)計(jì)算左右兩須位置。
(2)
3) 更新天牛位置。計(jì)算天牛左右兩須的氣味感知強(qiáng)度,即計(jì)算左右兩須的適應(yīng)度函數(shù)值,再將左右函數(shù)值的大小代入式(3)來(lái)更新天牛位置。
x=x-Nstep×Dir×sign(f(xl)-f(xr))
(3)
式中:f(xl)、f(xr)為天牛左右兩須的適應(yīng)度函數(shù)值;sign為符號(hào)函數(shù),用來(lái)表示值的正負(fù)。
4) 更新迭代。其中,天牛兩須之間的距離d0通過(guò)式(4)迭代更新,移動(dòng)步長(zhǎng)Nstep通過(guò)公式(5)迭代更新。
d0=Nstep/c
(4)
Nstept=λNstept-1
(5)
式中:c為固定值,取100;λ為衰減系數(shù),通常取0.95。
5) 判斷是否到達(dá)迭代次數(shù)或滿足停止迭代要求,若沒(méi)有,繼續(xù)迭代直至結(jié)束。
2.4.2 基于天牛須改進(jìn)的粒子群算法
天牛須算法會(huì)隨著迭代次數(shù)的增加,移動(dòng)步長(zhǎng)逐漸衰減,導(dǎo)致陷入局部最優(yōu)。將天牛須搜索算法與更突出群體的粒子群優(yōu)化算法相融合[20],提出了基于天牛須改進(jìn)的粒子群算法(beetle swarm optimization,BSO)。BSO將每個(gè)粒子視為一只天牛,天牛群的初始位置和速度的生成過(guò)程與標(biāo)準(zhǔn)粒子群算法相同。在迭代過(guò)程中,天牛位置的更新增加了天牛須對(duì)氣味濃度感知的過(guò)程,通過(guò)比較左右兩須的氣味濃度即適應(yīng)度函數(shù)值大小來(lái)更新天牛的位置。BSO有效克服了BAS中隨著迭代次數(shù)的增加導(dǎo)致步長(zhǎng)逐漸減小從而陷入局部最優(yōu)的缺點(diǎn),同時(shí)提高了算法整體的穩(wěn)定性。
BSO更新規(guī)則如下:
1) 天牛群速度更新規(guī)則。根據(jù)天牛須算法得到速度更新公式為:
v0=-Nstep×Dir×sign(f(xl)-f(xr))
將其融入粒子群算法的速度更新公式中得到天牛群算法的速度更新公式為:
v=w×v0+c1×r1×(pibest-x)+
c2×r2×(gbest-x)+c3×r3×v0
式中:w為慣性權(quán)重,變化規(guī)則為公式(6);c1、c2、c3為學(xué)習(xí)因子,均取1.2;r1、r2、r3為rand函數(shù);pibest為當(dāng)前位置個(gè)體最優(yōu)解;gbest為當(dāng)前位置全局最優(yōu)解。
(6)
設(shè)置速度界限為±0.1,當(dāng)速度超出邊界值時(shí)將速度校正為邊界值。
2) 天牛群位置更新規(guī)則。
xi+1=xi+vi+1
式中:xi+1為第(i+1)次迭代天牛位置;vi+1為第(i+1)次迭代天牛速度。
3) 天牛群步長(zhǎng)更新。由于BAS算法迭代過(guò)程中步長(zhǎng)的衰減系數(shù)是固定不變的,這會(huì)導(dǎo)致天牛在前期進(jìn)行搜索迭代時(shí)因?yàn)椴介L(zhǎng)過(guò)長(zhǎng)而使得搜索精度降低,后期因?yàn)樗p較慢使得搜索效率變差。因此,提出一種動(dòng)態(tài)衰減策略:
式中:Nstep0為初始步長(zhǎng),其大小通常與變量變化范圍相等。
BSO算法具體步驟如圖1所示。
圖1 BSO算法流程圖Fig.1 BSO algorithm flow chart
圖2 算法尋優(yōu)結(jié)果比較Fig.2 Comparison of algorithm optimization results
表1為算法尋優(yōu)結(jié)果及運(yùn)行時(shí)間。
表1 尋優(yōu)結(jié)果Tab.1 Optimization result
由圖3和表1可知,BSO算法的收斂效果明顯優(yōu)于其它2個(gè)算法,且算法的穩(wěn)定性也較高。BSO算法將BAS的全局搜索能力和PSO算法的局部搜索能力相結(jié)合,使得算法整體上更加穩(wěn)定,性能也有明顯的提升。
圖3 K近鄰互信息值Fig.3 K-nearest neighbor mutual information value
建立預(yù)測(cè)模型具體流程如下:
1)通過(guò)機(jī)理分析選定11個(gè)初始相關(guān)變量,并利用互信息相關(guān)性對(duì)各變量進(jìn)行時(shí)延補(bǔ)償。
2)使用K近鄰互信息變化率雙向選擇算法對(duì)加入時(shí)延的11個(gè)初始變量進(jìn)行篩選,去除冗余變量,生成包含5個(gè)輸入變量的最優(yōu)子集。
3)利用VMD算法對(duì)變量子集進(jìn)行分解,分解后的28個(gè)IMF分量再經(jīng)過(guò)互信息計(jì)算與篩選,確定模型的最終輸入。
4)搭建RBF神經(jīng)網(wǎng)絡(luò),利用BSO優(yōu)化算法對(duì)神經(jīng)網(wǎng)絡(luò)的超參數(shù)進(jìn)行尋優(yōu),將數(shù)據(jù)代入模型中進(jìn)行訓(xùn)練和測(cè)試,得出最終結(jié)果。
模型采用的評(píng)價(jià)指標(biāo)為SRMSE和R2。SRMSE為均方根誤差,表示預(yù)測(cè)值與真實(shí)值之間的標(biāo)準(zhǔn)偏差的大小,數(shù)值越小表明預(yù)測(cè)精度越高;R2為決定系數(shù),表示預(yù)測(cè)值相對(duì)真實(shí)值的偏離程度,其數(shù)值越接近于1表明預(yù)測(cè)效果越好。將二者結(jié)合使用能夠更全面的評(píng)價(jià)預(yù)測(cè)模型的好壞,計(jì)算式如下:
本文選取某電廠所提供的現(xiàn)場(chǎng)數(shù)據(jù)共3 600組,采樣周期為5 s,總選取時(shí)間為5 h。其中前2 400組數(shù)據(jù)用來(lái)對(duì)模型進(jìn)行訓(xùn)練,后1 200組數(shù)據(jù)用來(lái)對(duì)模型進(jìn)行測(cè)試,目的為驗(yàn)證模型的預(yù)測(cè)精度。通過(guò)對(duì)NOx生成機(jī)理進(jìn)行分析,初步選擇出11個(gè)輔助變量,包含:機(jī)組負(fù)荷、總煤量、給煤機(jī)電流、SCR入口煙氣含氧量、SCR入口煙氣溫度、總風(fēng)量、鍋爐含氧量、尿素閥門開度、SCR入口煙氣流量、爐膛負(fù)壓、尿素流量。
由于鍋爐燃燒過(guò)程具有大遲延的特性,所以在現(xiàn)場(chǎng)運(yùn)行過(guò)程中采集到的各個(gè)點(diǎn)位的相關(guān)數(shù)據(jù)與SCR入口NOx濃度實(shí)時(shí)數(shù)據(jù)存在一定的時(shí)間偏差,因此設(shè)計(jì)了一種基于最大互信息的時(shí)延計(jì)算方法[21]。根據(jù)經(jīng)驗(yàn),鍋爐燃燒周期為10 min左右,所以將最大時(shí)延時(shí)間定為600 s。計(jì)算方式為固定SCR入口NOx濃度選取時(shí)間,將其余所有輔助變量分別向前一時(shí)刻移動(dòng),每移動(dòng)一時(shí)刻就計(jì)算這個(gè)時(shí)刻輔助變量與NOx濃度之間的互信息值,選取相關(guān)性最大的一時(shí)刻作為時(shí)延補(bǔ)償,從而確定最終變量輸入序列。表2為各變量遲延時(shí)間表。
表2 各變量遲延時(shí)間Tab.2 Delay time for each variable s
3.1.1 基于K近鄰互信息變化率的雙向變量選擇
通過(guò)機(jī)理分析選擇出來(lái)的11個(gè)輔助變量之間有可能會(huì)存在冗余,而冗余變量輸入模型后對(duì)模型的預(yù)測(cè)精度有較差的影響,所以要對(duì)這11個(gè)初始變量利用KNN-MI-CR進(jìn)行進(jìn)一步篩選。將上述11個(gè)初始變量按順序貼上標(biāo)簽,分別為:x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11。圖3(a)為一維K近鄰互信息計(jì)算結(jié)果圖,由此圖可知x3對(duì)應(yīng)的一維K近鄰1.56互信息值最大。設(shè)置K近鄰互信息變化率閾值為0.1,按照2.1流程計(jì)算,最終得到初始變量子集S={x1、x2、x3、x4、x6、x7、x9}。圖3(b)為集合S內(nèi)變量之間的K近鄰互信息較大的冗余變量組合的互信息,其值均較大,表明x6、x9和x2、x3之間存在冗余變量。根據(jù)圖3(a)所示:I(x6,y)>I(x9,y),I(x3,y)>I(x2,y),因此x2和x9為冗余變量,剔除之后得到最終輸入變量子集S={x1、x3、x4、x6、x7},即給煤機(jī)電流、總風(fēng)量、鍋爐含氧量、負(fù)荷及SCR入口煙氣含氧量。
3.1.2 基于VMD分解的變量處理
經(jīng)VMD分解后的信號(hào)存在多個(gè)IMF分量,而分量個(gè)數(shù)越多意味著表征高頻噪聲分量的IMF中真實(shí)噪聲占有比重就越大,所以確定合適的分解個(gè)數(shù)K能夠更好地對(duì)信號(hào)存在的噪聲進(jìn)行分離。本文通過(guò)計(jì)算原始信號(hào)信噪比(signal noise ratio,SNR)[22]并與設(shè)定閾值相比較來(lái)確定分解個(gè)數(shù)K,SNR計(jì)算公式如下:
(7)
式中:f為不帶噪聲的原始信號(hào),即原始信號(hào)與高頻IMF分量只差;f′為噪聲信號(hào)。
設(shè)置VMD分解算法中懲罰因子α=2 000,根據(jù)式(7)計(jì)算并選擇合適分解個(gè)數(shù)K。表3為子集S內(nèi)各變量分解個(gè)數(shù)及分量選取結(jié)果。
表3 變量分解個(gè)數(shù)及分量選取結(jié)果Tab.3 Factorization number of variables
分解后得到28組IMF分量,計(jì)算各分量與輸出變量之間的互信息值,選擇互信息大于0.85的10組分量作為最終輸入變量。VMD分解后確定輸入變量的時(shí)域波形圖如圖4所示。
圖4 信號(hào)時(shí)域波形圖Fig.4 Signal time-domain waveform
3.2.1 不同特征選擇方法對(duì)預(yù)測(cè)結(jié)果的影響
為驗(yàn)證基于KNN-MI-CR算法對(duì)變量篩選的優(yōu)劣性,現(xiàn)對(duì)11個(gè)初始變量利用最大相關(guān)最小冗余(max-relevance and min-redundancy, mRMR)[23]和隨機(jī)森林(random forest, RF)[24]這2種特征選擇的算法重新進(jìn)行變量篩選,以對(duì)比3種不同方法之間的預(yù)測(cè)結(jié)果,實(shí)驗(yàn)條件均相同,篩選變量個(gè)數(shù)均設(shè)置為5個(gè)。圖5為不同特征選擇算法下的預(yù)測(cè)結(jié)果散點(diǎn)圖。
圖5 不同特征選擇預(yù)測(cè)結(jié)果散點(diǎn)圖Fig.5 Different feature selection prediction results scatter plot
由圖5可知,經(jīng)過(guò)KNN-MI-CR算法篩選后的模型輸入變量預(yù)測(cè)結(jié)果更加接近于真實(shí)值曲線,跳躍點(diǎn)較少,且各模型評(píng)價(jià)指標(biāo)也均優(yōu)于其它2種算法,這表明使用KNN-MI-CR算法可以更好地選擇與輸出最相關(guān)變量以及剔除冗余變量。其中,不經(jīng)過(guò)變量篩選的初始變量集代入模型后的預(yù)測(cè)結(jié)果相比于經(jīng)過(guò)篩選變量后的明顯較差,模型評(píng)價(jià)指標(biāo)均差于其它變量輸入預(yù)測(cè)結(jié)果,所以模型輸入變量的篩選可以有效地提高模型預(yù)測(cè)精度,同時(shí)可以縮減模型的計(jì)算時(shí)間。
3.2.2 時(shí)延分析對(duì)預(yù)測(cè)結(jié)果的影響
鍋爐燃燒系統(tǒng)是一個(gè)大遲延系統(tǒng),各變量之間的時(shí)間延遲對(duì)結(jié)果也會(huì)有一定程度的影響?,F(xiàn)將輸入變量固定,分別將考慮時(shí)延分析與不考慮時(shí)延分析的輸入變量放入同一個(gè)預(yù)測(cè)模型,得到結(jié)果如圖6 所示。結(jié)果表明,考慮時(shí)延分析后的輸入變量使得模型預(yù)測(cè)結(jié)果SRMSE降低了40.6%,R2提高了2.15%,可見考慮時(shí)延分析后的輸入變量增強(qiáng)了與輸出變量之間的相關(guān)性,對(duì)模型預(yù)測(cè)精度的提升有較大作用。
圖6 時(shí)延對(duì)比結(jié)果曲線圖Fig.6 Time delay comparison curve
3.2.3 變量處理對(duì)預(yù)測(cè)結(jié)果的影響
原始數(shù)據(jù)會(huì)存在一定的非平穩(wěn)性和噪聲量,利用VMD分解可以提取數(shù)據(jù)中的平穩(wěn)分量,去除噪聲。為了驗(yàn)證VMD算法對(duì)模型預(yù)測(cè)的影響,現(xiàn)將變量分解前的輸入變量和VMD分解后的篩選變量放入同一模型內(nèi)進(jìn)行預(yù)測(cè),隱含層神經(jīng)元個(gè)數(shù)均設(shè)為輸入維度的1.5倍,其余條件均保持不變,預(yù)測(cè)結(jié)果圖及模型評(píng)價(jià)指標(biāo)結(jié)果如圖7所示。由結(jié)果可知,VMD分解后的變量輸入模型后的預(yù)測(cè)結(jié)果優(yōu)于分解前,各評(píng)價(jià)指標(biāo)也較好。表明VMD分解可將原始數(shù)據(jù)中非平穩(wěn)性較高的數(shù)據(jù)分解為多個(gè)平穩(wěn)分量以及噪聲分量,互信息算法再將非平穩(wěn)度較高和噪聲分量剔除,只保留了相關(guān)性較大的平穩(wěn)分量,有效地提升了模型的預(yù)測(cè)精度。
圖7 變量分解前后預(yù)測(cè)結(jié)果比較Fig.7 Comparison of prediction results before and after variable decomposition
3.2.4 不同尋優(yōu)算法對(duì)預(yù)測(cè)結(jié)果的影響
RBF神經(jīng)網(wǎng)絡(luò)超參數(shù)包括:u、σ、w,不同尋優(yōu)算法獲得的模型參數(shù)精度不同,從而使得模型預(yù)測(cè)結(jié)果也是不同的。現(xiàn)使用BAS算法、PSO算法、BSO算法作為尋優(yōu)算法分別對(duì)RBF神經(jīng)網(wǎng)絡(luò)超參數(shù)進(jìn)行尋優(yōu),其中,PSO與BSO種群規(guī)模均與輸入維度相等,RBF隱含層神經(jīng)元個(gè)數(shù)為輸入維度的1.5倍,實(shí)驗(yàn)結(jié)果如圖8所示。由圖8可知,BAS算法與PSO算法預(yù)測(cè)結(jié)果SRMSE相差不大,且R2僅相差0.000 1,BSO算法的預(yù)測(cè)結(jié)果優(yōu)于其余兩種算法。預(yù)測(cè)過(guò)程中,BAS算法多次預(yù)測(cè)時(shí)預(yù)測(cè)結(jié)果上下浮動(dòng)變化較為明顯,這與其只有一個(gè)尋優(yōu)粒子使得其穩(wěn)定性較差有關(guān)。結(jié)果表明BSO算法在提高模型預(yù)測(cè)精度上要優(yōu)于BAS和PSO算法,且尋優(yōu)過(guò)程較為穩(wěn)定,多次預(yù)測(cè)依然保持較好效果。
圖8 不同尋優(yōu)算法預(yù)測(cè)結(jié)果對(duì)比Fig.8 Comparison of prediction results of different optimization algorithms
針對(duì)目前火力發(fā)電廠燃燒過(guò)程遲延較大,SCR入口NOx質(zhì)量濃度難以準(zhǔn)確測(cè)量的問(wèn)題,提出了一種基于考慮時(shí)延補(bǔ)償后的變量選擇與分解和RBF神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型。使用電廠數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn),結(jié)果表明:
1) 考慮時(shí)延補(bǔ)償后的變量與輸出序列之間的相關(guān)性大大增強(qiáng),將時(shí)延補(bǔ)償后的變量經(jīng)KNN-MI-CR選擇后,有效去除了冗余變量,從而簡(jiǎn)化了模型輸入,提高了模型訓(xùn)練效率和精準(zhǔn)度。
2) VMD分解后可以將數(shù)據(jù)中非平穩(wěn)性較高以及噪聲較大的分量分解出來(lái),再使用互信息將其剔除,減小了數(shù)據(jù)復(fù)雜度,提升了輸入與輸出之間的相關(guān)性,有效地提高了模型預(yù)測(cè)精度。
BSO算法既有BAS算法的全局尋優(yōu)能力也同時(shí)具備了PSO算法局部尋優(yōu)能力,穩(wěn)定性較高,可以更加準(zhǔn)確地對(duì)神經(jīng)網(wǎng)絡(luò)超參數(shù)進(jìn)行尋優(yōu),對(duì)模型訓(xùn)練效率和精度的提升都有較好效果。