顏黃斌,陳 永,崔麗華,陳 祺
(昆明云內(nèi)動力股份有限公司,云南 昆明 650000)
柴油發(fā)動機(jī)受NOx排放過高的限制,主要應(yīng)用于非道路的農(nóng)業(yè)機(jī)械、船舶以及重型貨車等,在輕型車上使用較少。準(zhǔn)確預(yù)測柴油發(fā)動機(jī)的NOx瞬時排放有助于解決NOx排放過高的問題。
目前機(jī)器學(xué)習(xí)算法廣泛應(yīng)用于實(shí)際生產(chǎn)和日常生活中,同時機(jī)器學(xué)習(xí)算法具有較高和較為準(zhǔn)確的預(yù)測精度。文華等使用BP神經(jīng)網(wǎng)絡(luò)算法,對柴油機(jī)NOx瞬態(tài)排放進(jìn)行了預(yù)測,其模型的相關(guān)系數(shù)R為0.95[1]。Liu等使用支持向量機(jī)的集成方法,建立了柴油機(jī)瞬態(tài)NOx排放預(yù)測模型,具有較高的準(zhǔn)確率[2],RMSE為51.12×10-6,R2為0.98。Alcan等采用基于S型的非線性自回歸外生輸入模型預(yù)測了柴油機(jī)穩(wěn)態(tài)和瞬態(tài)下的NOx排放,其瞬態(tài)預(yù)測結(jié)果驗(yàn)證精度在70%左右[3]。
目前,研究人員主要使用較為傳統(tǒng)的機(jī)器學(xué)習(xí)算法,其精度和應(yīng)用價值還需要進(jìn)一步提高,因此本文選用一種基于梯度提升的集成樹算法XGBoost預(yù)測柴油發(fā)動機(jī)瞬時NOx排放,增加預(yù)測結(jié)果的穩(wěn)定性和精度。
本實(shí)驗(yàn)使用便攜式排放測試系統(tǒng)(PEMS)測試一輛國IV的柴油公交車的瞬時排放和車輛、發(fā)動機(jī)參數(shù),公交車的參數(shù)如表1所示。為增加采集樣本的可靠性,選擇的公交車行駛路線包括市區(qū)、郊區(qū),紅綠燈交叉路口,同時為避免交通流量的影響,采集時間包括道路高峰時間段和非高峰時間段。
表1 實(shí)驗(yàn)車輛參數(shù)
由于PEMS系統(tǒng)和采集發(fā)動機(jī)參數(shù)、車輛參數(shù)的OBD系統(tǒng)不是同步運(yùn)行,需要對采集的數(shù)據(jù)進(jìn)行對正處理。由于NOx排放的大小與轉(zhuǎn)速和負(fù)荷息息相關(guān),因此對正采用波峰波谷對正,利用負(fù)荷和轉(zhuǎn)速出現(xiàn)峰值的時刻與NOx排放出現(xiàn)峰值的時刻相同,觀察峰值之間的時間差,然后將NOx排放數(shù)據(jù)前移或者后移相應(yīng)的時間差。
在實(shí)驗(yàn)過程中可能由于實(shí)驗(yàn)設(shè)備的損壞和傳感器的失靈,造成實(shí)驗(yàn)數(shù)據(jù)的異常,需要對異常值進(jìn)行剔除。剔除方法根據(jù)數(shù)據(jù)方差分布,將遠(yuǎn)遠(yuǎn)大于數(shù)據(jù)方差的數(shù)據(jù)直接剔除或者利用前后數(shù)據(jù)的平均值填充異常的數(shù)據(jù)。
Obj(φ)=L(y,f(x))+∑mΩ(fm)
(1)
XGBoost基于加法方式的迭代函數(shù)可寫為公式(2)。
(2)
原目標(biāo)函數(shù)使用二階泰勒展開得到公式(3)。
(3)
去除所有常數(shù)項(xiàng),將目標(biāo)函數(shù)改寫成關(guān)于葉結(jié)點(diǎn)分?jǐn)?shù)的一元二次函數(shù),得到公式(4)。
(4)
(5)
帶入式(5)可得最終目標(biāo)函數(shù),可寫為公式(6)。
(6)
為驗(yàn)證模型的實(shí)際效果,本文選取了隨機(jī)森林(RF)[6]、貝葉斯網(wǎng)絡(luò)(bayes)[7]、BP神經(jīng)網(wǎng)絡(luò)三種模型進(jìn)行實(shí)驗(yàn)對比。
采用決定系數(shù)(R2)、平均絕對誤差(MAE)和標(biāo)準(zhǔn)均方根誤差(NRMSE)去評價模型性能,計(jì)算公式如下:
(7)
(8)
(9)
實(shí)驗(yàn)數(shù)據(jù)經(jīng)過對正和異常值處理后,將發(fā)動機(jī)轉(zhuǎn)速、負(fù)荷、車速和瞬時燃油消耗作為模型的輸入?yún)?shù),瞬時NOx排放數(shù)據(jù)作為輸出參數(shù),建立XGBoost模型。使用網(wǎng)格搜索的方法尋找XGBoost模型的最佳參數(shù),搜索參數(shù)包括學(xué)習(xí)率、樹的最大深度、最大葉節(jié)點(diǎn)數(shù)量、最小葉子節(jié)點(diǎn)樣本權(quán)重和、正則化比例,其余參數(shù)選擇模型默認(rèn)參數(shù)。其中數(shù)據(jù)的90%作為訓(xùn)練集,10%的數(shù)據(jù)作為驗(yàn)證集,圖1顯示了XGBoost模型、RF、bayes以及BP神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果與真實(shí)值的對比。
圖1 模型預(yù)測結(jié)果對比
通過圖1,可以發(fā)現(xiàn)XGBoost模型比另外三種模型預(yù)測精度更高,在各個波峰和波谷都能較好的實(shí)現(xiàn)預(yù)測,對柴油發(fā)動機(jī)NOx排放趨勢能較好的捕獲和預(yù)測。而RF、bayes和BP神經(jīng)網(wǎng)絡(luò)模型都存在較大的偏差,尤其是bayes模型在各個極值點(diǎn)處都出現(xiàn)預(yù)測過大或者過小的現(xiàn)象,并且出現(xiàn)連續(xù)偏高或者偏低的預(yù)測結(jié)果。通過圖1對比表明XGBoost模型在機(jī)器學(xué)習(xí)模型中具有更好的預(yù)測精度。
表2列出了各個模型的決定系數(shù)、平均絕對誤差和標(biāo)準(zhǔn)均方根誤差結(jié)果,觀察結(jié)果可以發(fā)現(xiàn)XGBoost模型預(yù)測精度比另外三個模型具有更高的精度。其中XGBoost模型的R2比RF、bayes、BP分別提高了10.98%,16.48%,8.79%。XGBoost模型的MAE比RF、bayes、BP分別提高了30.00%,56.21%,23.96%。XGBoost模型的NRMSE比RF、bayes、BP分別提高了21.42%,28.57%,12.21%。以上結(jié)果表明XGBoost模型具有更好的穩(wěn)定性和預(yù)測精度。
表2 各個模型性能參數(shù)對比
實(shí)驗(yàn)結(jié)果表明XGBoost模型在預(yù)測柴油發(fā)動機(jī)NOx排放時,準(zhǔn)確性和穩(wěn)定性上相對傳統(tǒng)的機(jī)器學(xué)習(xí)模型的確更有優(yōu)勢。XGBoost模型的R2比RF、bayes、BP神經(jīng)網(wǎng)絡(luò)分別提高了10.98%,16.48%,8.79%,表明XGBoost模型對柴油發(fā)動機(jī)NOx瞬時排放預(yù)測具有更好的預(yù)測精度。