王瓏迪 何超
摘 要:為建立一種輕型汽油車NOx排放預(yù)測(cè)模型,在昆明市內(nèi)采用便攜式車載排放測(cè)試系統(tǒng)(Portable Emission Measurement System,PEMS)對(duì)一輛輕型汽油車進(jìn)行實(shí)際行駛污染物排放(Real Drive Emission,RDE)測(cè)試;利用主成分分析算法(Principal Component Analysis,PCA)對(duì)影響輕型汽油車排放的特征參數(shù)進(jìn)行降維,將降維后的數(shù)據(jù)作為門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)(Gated Recurrent Unit,GRU)的輸入,建立基于PCA-GRU的排放預(yù)測(cè)模型,對(duì)輕型汽油車的NOx的排放量進(jìn)行瞬時(shí)預(yù)測(cè)。結(jié)果表明,PCA-GRU模型對(duì)NOx的預(yù)測(cè)結(jié)果的平均絕對(duì)誤差為0.133mg/s,絕對(duì)系數(shù)為0.88,相比于單一的GRU模型,分別提高了42.4%和8.6%。該排放預(yù)測(cè)模型可以實(shí)現(xiàn)對(duì)輕型汽油車NOx排放較準(zhǔn)確的預(yù)測(cè),具有一定的工程價(jià)值。
關(guān)鍵詞:便攜式車載排放測(cè)試系統(tǒng) RDE測(cè)試 主成分分析 門控循環(huán)單元神經(jīng)網(wǎng)絡(luò) 排放預(yù)測(cè)模型
1 引言
隨著機(jī)動(dòng)車保有量的不斷增加,機(jī)動(dòng)車成為污染物排放的主要貢獻(xiàn)者[1],控制機(jī)動(dòng)車污染物排放成為改善人類居住環(huán)境的關(guān)鍵。建立排放預(yù)測(cè)模型可以有效監(jiān)測(cè)機(jī)動(dòng)車污染物排放量,為環(huán)保部門制定減排措施提供參考依據(jù)。隨著機(jī)器學(xué)習(xí)的發(fā)展,神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用于機(jī)動(dòng)車排放預(yù)測(cè)領(lǐng)域,戴金池等在[2]AVL部分流稀釋采樣發(fā)動(dòng)機(jī)臺(tái)架上進(jìn)行歐洲瞬態(tài)循環(huán)試驗(yàn)(ETC)和歐洲穩(wěn)態(tài)循環(huán)試驗(yàn)(ESC),將處理時(shí)間序列問題的LSTM神經(jīng)網(wǎng)絡(luò)用于柴油機(jī)NOx的預(yù)測(cè),結(jié)果顯示,相對(duì)于其他模型,LSTM模型在柴油機(jī)NOx排放預(yù)測(cè)方面具有更好的預(yù)測(cè)能力,具有更高的準(zhǔn)確性和更強(qiáng)的泛化性能。Liu等[3]提出了一種基于主成分分析(PCA)和遺傳算法(GA)的支持向量機(jī)的集成方法,建立了柴油機(jī)NOx瞬態(tài)排放預(yù)測(cè)模型,在穩(wěn)態(tài)的運(yùn)行條件下,該模型對(duì)訓(xùn)練集和測(cè)試集表現(xiàn)出了較高的準(zhǔn)確率,并且與單個(gè)SVM模型和傳統(tǒng)ANN模型相比,所提出的最優(yōu)SVM集成模型在預(yù)測(cè)精度和泛化能力方面表現(xiàn)更優(yōu)秀。但上述研究是以臺(tái)架試驗(yàn)數(shù)據(jù)建立的模型,只能反映試驗(yàn)車輛在特定工況下的排放水平,與機(jī)動(dòng)車在實(shí)際道路行駛的排放差別較大?;诖?,本研究采用便攜式車載排放測(cè)試系統(tǒng)對(duì)一輛輕型汽油車進(jìn)行實(shí)際行駛污染物排放測(cè)試(RDE測(cè)試),利用測(cè)得的數(shù)據(jù)建立基于PCA-GRU的輕型汽油車排放預(yù)測(cè)模型,實(shí)現(xiàn)對(duì)輕型汽油車實(shí)際道路NOx排放的準(zhǔn)確預(yù)測(cè)。
2 方法論
2.1 主成分分析
主成分分析(Principal Component Analysis,PCA)是一種使用廣泛的數(shù)據(jù)降維算法[4],由于高維數(shù)據(jù)包含許多冗余的信息,這些信息會(huì)影響數(shù)據(jù)處理和模型構(gòu)建的效率和準(zhǔn)確性,主成分分析可以將n維特征通過線性變化映射到k維上,得到新的k維特征,使得新的k維特征之間的相關(guān)性最小化,具體步驟為:
1)對(duì)所有樣本進(jìn)行標(biāo)準(zhǔn)化,使每個(gè)特征具有相同的重要性,標(biāo)準(zhǔn)化公式為:
式中,為標(biāo)準(zhǔn)化后的數(shù)據(jù),為初始數(shù)據(jù),為初始數(shù)據(jù)的平均值,為初始數(shù)據(jù)的標(biāo)準(zhǔn)差。
2)之后構(gòu)造協(xié)方差矩陣,計(jì)算協(xié)方差矩陣的特征值和特征向量,最后通過計(jì)算累計(jì)貢獻(xiàn)率選取前k個(gè)主成分,達(dá)到特征降維的目的。
2.2 門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)
門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)(Gated Recurrent Unit,GRU)是一種基于LSTM神經(jīng)網(wǎng)絡(luò)的變體[5],LSTM解決了循環(huán)神經(jīng)網(wǎng)絡(luò)RNN中梯度消失和梯度爆炸的問題,與LSTM比較,GRU保持了LSTM的性能,并且只有更新門和重置門,更新門用于控制上一時(shí)刻信息保存到當(dāng)前時(shí)刻的量,重置門用于決定當(dāng)前時(shí)刻信息如何與上一時(shí)刻信息結(jié)合,GRU結(jié)構(gòu)得到優(yōu)化,訓(xùn)練速度提升。因此能有效處理時(shí)間序列問題。圖1為GRU網(wǎng)絡(luò)原理圖。
2.3 PCA-GRU模型
排放預(yù)測(cè)模型的輸入過多,會(huì)導(dǎo)致模型響應(yīng)時(shí)間變長(zhǎng),預(yù)測(cè)精度降低,因此利用主成分分析進(jìn)行降維,建立基于PCA-GRU的輕型汽油車NOX排放預(yù)測(cè)模型。流程圖如圖2所示,具體步驟如下:
1)采用便攜式車載測(cè)試排放系統(tǒng)PEMS對(duì)一輛輕型汽油車進(jìn)行RDE試驗(yàn),采集試驗(yàn)過程中車輛污染物濃度和車輛信息;
2)選取影響輕型汽油車排放的特征參數(shù),利用主成分分析進(jìn)行降維;
3)將降維后的數(shù)據(jù)作為GRU神經(jīng)網(wǎng)絡(luò)的輸入,得到輕型汽油車NOx的排放預(yù)測(cè)結(jié)果。
3 試驗(yàn)結(jié)果與分析
3.1 RDE試驗(yàn)
RDE試驗(yàn)是指實(shí)際行駛污染物排放(Real Drive Emission,RDE)測(cè)試,我國(guó)在制定國(guó)Ⅵ排放標(biāo)準(zhǔn)時(shí)從歐Ⅵ標(biāo)準(zhǔn)引入,RDE試驗(yàn)作為車輛類型認(rèn)證的必要條件之一,要求新車型必須滿足RDE試驗(yàn)的排放要求,以更準(zhǔn)確地評(píng)估車輛尾氣排放情況,加強(qiáng)車輛排放監(jiān)管和保護(hù)環(huán)境。隨著中國(guó)環(huán)保法規(guī)的不斷升級(jí),RDE試驗(yàn)在中國(guó)的推廣應(yīng)用將越來越廣泛。
選擇一輛國(guó)Ⅴ輕型汽油車作為RDE試驗(yàn)測(cè)試車輛,車輛主要技術(shù)參數(shù)見表1。
便攜式車載排放測(cè)試系統(tǒng)(Portable Emission Measurement System,PEMS)包括:
1)SEMTECH-ECOSTAR車載氣體排放測(cè)量系統(tǒng):用于檢測(cè)試驗(yàn)車輛行駛時(shí)的污染物排放濃度和排放速率;
2)電子流量計(jì):用于記錄車輛排氣質(zhì)量流量;
3)GPS定位系統(tǒng):用于確定試驗(yàn)車輛位置和海拔高度等;
4)OBD車載診斷系統(tǒng):用于采集車輛行駛時(shí)的車速、發(fā)動(dòng)機(jī)轉(zhuǎn)速、燃油率、負(fù)荷百分比等參數(shù)。
將PEMS安裝到測(cè)試車輛上,根據(jù)《輕型汽車污染物排放限制及測(cè)量方法(中國(guó)第六階段)》規(guī)劃實(shí)驗(yàn)道路,測(cè)試車輛按市區(qū)-市郊-高速的順序在昆明市實(shí)際道路上行駛,三種行駛里程占比分別為34%、33%、33%,允許誤差在10%以內(nèi)。試驗(yàn)持續(xù)90~120min,整個(gè)試驗(yàn)過程由PEMS設(shè)備記錄污染物濃度和車輛信息等。將采集到的數(shù)據(jù)分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,占總樣本比例分別為75%、15%、10%。
3.2 建立PCA-GRU排放預(yù)測(cè)模型
車速與車輛動(dòng)力需求和駕駛行為等因素密切相關(guān),對(duì)機(jī)動(dòng)車排放水平具有重要的影響;發(fā)動(dòng)機(jī)轉(zhuǎn)速和負(fù)荷百分比是決定車速的主要參數(shù);排氣溫度會(huì)影響車輛后處理裝置中的催化劑活性,從而影響排放;排氣流量和燃油率也與車輛的排放水平。因此,選取車速、排氣溫度、排氣流量、負(fù)荷百分比、發(fā)動(dòng)機(jī)轉(zhuǎn)速、燃油率等6個(gè)參數(shù)進(jìn)行標(biāo)準(zhǔn)化。將標(biāo)準(zhǔn)化之后的數(shù)據(jù)進(jìn)行主成分分析計(jì)算得到協(xié)方差矩陣的特征值和每個(gè)特征值的方差貢獻(xiàn)率,列于表1,由表1可知,前4個(gè)主成分的累計(jì)貢獻(xiàn)率為97.478%,可以代表6個(gè)參數(shù)的大部分信息,因此,選取前4個(gè)主成分作為GRU神經(jīng)網(wǎng)絡(luò)的輸入,NOx作為GRU神經(jīng)網(wǎng)絡(luò)的輸出。
主成分特征向量計(jì)算結(jié)果如下:
式中:F1,F(xiàn)2,F(xiàn)3,F(xiàn)4表示主成分特征向量,Y1,Y2,…,Y6表示標(biāo)準(zhǔn)化處理后的數(shù)據(jù)。
在機(jī)器學(xué)習(xí)中,超參數(shù)的設(shè)置很大程度上影響了模型的性能和泛化能力,合理的超參數(shù)設(shè)置可以使模型在訓(xùn)練過程中快速收斂,防止過擬合,并提高模型的訓(xùn)練效率和泛化能力。本文選定的GRU神經(jīng)網(wǎng)絡(luò)超參數(shù)為:GRU神經(jīng)網(wǎng)絡(luò)的步長(zhǎng)設(shè)置為6,批處理大小為45,迭代次數(shù)為180次,學(xué)習(xí)率為0.001,GRU為2層,每層神經(jīng)元數(shù)量均為50。選用平均絕對(duì)誤差MAE和絕對(duì)系數(shù)R2作為排放預(yù)測(cè)模型評(píng)價(jià)指標(biāo),MAE越小,表明排放預(yù)測(cè)模型的精度越高;絕對(duì)系數(shù)R2的取值范圍在0到1之間,當(dāng)絕對(duì)系數(shù)R2越接近1時(shí),說明模型對(duì)數(shù)據(jù)的擬合程度越好。公式如下:
式中,為預(yù)測(cè)模型的預(yù)測(cè)結(jié)果,為實(shí)際值。
3.3 試驗(yàn)結(jié)果分析
對(duì)輕型汽油車NOx的排放預(yù)測(cè)結(jié)果如圖3所示。
由圖可知,GRU單一模型對(duì)輕型汽油車NOx瞬時(shí)排放率的預(yù)測(cè)效果不是很理想,存在較大誤差,這是由于未經(jīng)過主成分分析處理的數(shù)據(jù)中包含冗余信息和噪聲,這些會(huì)對(duì)模型的預(yù)測(cè)結(jié)果造成干擾,導(dǎo)致模型的預(yù)測(cè)精度降低。而PCA-GRU排放預(yù)測(cè)模型的NOx預(yù)測(cè)結(jié)果與實(shí)測(cè)值在整體趨勢(shì)上一致,將單一GRU模型與PCA-GRU模型的NOx預(yù)測(cè)結(jié)果的平均絕對(duì)誤差MAE和絕對(duì)系數(shù)R2列于表3,相比與GRU模型,PCA-GRU模型的MAE提高了42.4%,絕對(duì)系數(shù)R2提高了8.6%,表明PCA-GRU排放預(yù)測(cè)模型不僅能夠更好地提取和保留原始數(shù)據(jù)中的重要特征信息,還減少了原始數(shù)據(jù)中的冗余信息和噪聲,從而使模型具有良好的預(yù)測(cè)性能,可以實(shí)現(xiàn)輕型汽油車NOx精度較高的預(yù)測(cè)。
4 結(jié)論
本研究利用便攜式車載排放測(cè)試系統(tǒng)對(duì)一輛輕型汽油車進(jìn)行了實(shí)際行駛污染物排放測(cè)試,根據(jù)采集到的試驗(yàn)數(shù)據(jù),分析后確定了與車輛排放相關(guān)的車速、排氣溫度、排氣流量、負(fù)荷百分比、發(fā)動(dòng)機(jī)轉(zhuǎn)速、燃油率等6個(gè)特征參數(shù),通過主成分分析算法對(duì)6個(gè)參數(shù)進(jìn)行降維處理,得到4個(gè)主成分,然后將4個(gè)主成分作為GRU神經(jīng)網(wǎng)絡(luò)的輸入建立基于PCA-GRU的排放預(yù)測(cè)模型,對(duì)輕型汽油車NOx進(jìn)行排放預(yù)測(cè)。結(jié)果表明,所建立的排放預(yù)測(cè)模型對(duì)輕型汽油車NOx排放預(yù)測(cè)的平均絕對(duì)誤差MAE為0.133mg/s,絕對(duì)系數(shù)R2為0.88,相較于單一GRU模型的0.231mg/s和0.81,預(yù)測(cè)準(zhǔn)確性分別提高了42.4%和8.6%,說明通過主成分分析降維,使得模型對(duì)數(shù)據(jù)的理解更加深入和準(zhǔn)確,模型結(jié)構(gòu)更加合理,提高了模型的預(yù)測(cè)能力。因此,基于PCA-GRU的排放預(yù)測(cè)模型可以對(duì)實(shí)際道路中輕型汽油車NOx瞬時(shí)排放量實(shí)現(xiàn)較精準(zhǔn)的預(yù)測(cè)。
參考文獻(xiàn):
[1]中國(guó)環(huán)境保護(hù)部.《中國(guó)移動(dòng)源環(huán)境管理年報(bào)(2021)》發(fā)布[J]. 中國(guó)能源,2021,42(8):1.
[2]戴金池,龐海龍,俞妍,等. 基于LSTM神經(jīng)網(wǎng)絡(luò)的柴油機(jī)NOx排放預(yù)測(cè)[J]. 內(nèi)燃機(jī)學(xué)報(bào),2020,38(5):457-463.
[3]Liu B,Hu J,Yan F W,et al. A novel optimal support vector machine ensemble model for NOx emissions prediction of a diesel engine[J]. Measurement,2016,92:183-192.
[4]XIA W,SONG T,YAN Z. A method for recognition of mixed gas composition based on PCA and KNN[C].Proceedings of the 19th International Conference on Optical Communications and Networks.2021:1-3.
[5]KYUNGHYUN CHO,BART VAN MERRIEENBOER,CAGLAR GULCEHRE,et al. Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation[C]. //Conference on empirical methods in natural language processing, vol. 3: Conference on empirical methods in natural language processing (EMNLP 2014), 25-29 October 2014, Doha, Qatar.:Association for Computational Linguistics, 2014:1724-1734.