吐爾遜·買買提,趙夢佳,寧成博,孔慶好
(1.新疆農(nóng)業(yè)大學交通與物流工程學院,烏魯木齊 830052;2.新疆農(nóng)業(yè)科學研究院綜合試驗場,烏魯木齊 830012)
近年來,較大的尾氣排放總量使得非道路移動源污染物排放問題成為關注的熱點。2019年非道路移動源排放NOx、HC、PM等污染物分別達到了493.3×104、43.5×104、24×104t,農(nóng)業(yè)機械等柴油機械排放占非道路移動排放總量的34.3%[1]。可見,農(nóng)業(yè)機械在內(nèi)的非道路移動源污染氣體排放對環(huán)境的影響不容忽視。
準確測度排放因子、建立排放清單是大氣污染物排放治理以及排放控制的基礎。基于各類傳感器測量污染物排放因子是常用的方法,但其受到成本、測量精度以及作業(yè)狀態(tài)的限制[2],因此通常采用模型預測方法。目前移動源排放預測方面主要有基于MAP映射、物理模型和數(shù)據(jù)驅(qū)動的污染物排放預測等方法[3]。近年來隨著算法框架理論、方法和技術的持續(xù)發(fā)展,各類預測算法的精度和魯棒性進一步提高,進而基于數(shù)據(jù)驅(qū)動的預測模型法成為測度污染物排放時間序列的重要途徑。Anand等[4]建立反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡模型預測柴油機在穩(wěn)態(tài)工況下NOx排放,并驗證其模型預測的精度。許金良等[5]基于曲線回歸法建立了載重柴油車小半徑圓曲線排放量與曲線半徑、長度和車輛駛入速度之間的關系模型,并在此基礎上建立了累積碳排放模型,并獲得了較高的預測精度。
文獻[6]基于主成分分析法對數(shù)據(jù)進行規(guī)約,通過網(wǎng)絡搜索和遺傳算法(genetic algorithm,GA)優(yōu)化支持向量機(support vector machine,SVM)預測模型參數(shù),并對柴油機不同運行狀態(tài)NOx排放進行預測,發(fā)現(xiàn)和其他方法相比,預測精度較高。左付山等[7]提出了以汽油機排放數(shù)據(jù)流信息為輸入,以汽油機CO、HC和NOx排放水平為輸出的BP神經(jīng)網(wǎng)絡的預測。文獻[8]提出將最小二乘法和神經(jīng)網(wǎng)絡相結合的預測模型在柴油機NOx排放預測分析方面具有較好的魯棒性,在較少數(shù)據(jù)量和非線性擬合方面也有較大優(yōu)勢。分析可知,目前在移動源排放時間序列預測方面,主要針對工程柴油機械排放NOx進行分析,但在農(nóng)業(yè)機械等非道路移動源實際工況排放預測方面的研究尚未見報道。BP神經(jīng)網(wǎng)絡可以作為一種較好的排放預測工具,但BP等神經(jīng)網(wǎng)絡訓練速度慢,且容易陷入局部最小化。極限學習機(extreme learning machine,ELM)具有訓練時間短、精度高等優(yōu)點[9],近年來被廣泛應用到各個領域[10-12],但目前ELM方法激活函數(shù)較單一,模型學習能力較弱,因此需對ELM算法進行優(yōu)化。
深度極限學習機是一種衍生極限學習機模型,該模型具有訓練速度快,泛化能力強等特點。鑒于此,基于實驗數(shù)據(jù)和深度極限學習機(deep extreme learning machine,DELM)方法建立了拖拉機不同運行狀態(tài)排放預測模型,并于SVM和BP神經(jīng)網(wǎng)絡預測方法進行對比,進而結合實例分析不同模型在排放預測方面的適應性。
考慮到新疆拖拉機排放階段和功率分段等基礎數(shù)據(jù)的可獲得性因素,以新疆農(nóng)機局統(tǒng)計數(shù)據(jù)和2004年開始實施的農(nóng)機購置補貼統(tǒng)計數(shù)據(jù)作為基本依據(jù),結合專家咨詢法選取洛陽路通、常州東風、雷沃重工和上海紐荷蘭等廠家生產(chǎn)的40~85 kW功率段的5臺拖拉機,排放標準均為國Ⅱ,拖拉機具體情況如表1所示。
表1 試驗農(nóng)用拖拉機信息Table 1 Test information of farm tractors
為便于后續(xù)分析,選取常州東風拖拉機實地排放數(shù)據(jù)。田間排放試驗研究采用SEMTECH-DS氣態(tài)污染物分析儀,可以實時采集污染物濃度數(shù)據(jù)、質(zhì)量排放量和基于燃油消耗和時間的排放單位,能夠應用于車載尾氣的測量[13]。通過SEMTECH-DS和GPS模塊實時讀取GPS移動軌跡、速度、發(fā)動機轉(zhuǎn)速、功率、CO、HC、NOx和PM等數(shù)據(jù)。通過數(shù)據(jù)接口將數(shù)據(jù)發(fā)送到計算機供后續(xù)處理和分析。試驗場地選取待犁地的農(nóng)田,將車載排放測試儀安裝到將進行實際作業(yè)的拖拉機上。
首先啟動測試柴油機進行預熱,再安裝尾氣分析儀,接著校準清零后將其探頭放到柴油機的排氣管中。尾氣分析儀的另一端口可連接到計算機讀取數(shù)據(jù)。將柴油機穩(wěn)定在怠速狀態(tài)下運行,被測試的柴油機平穩(wěn)運行一段時間后,記錄此時利用尾氣分析儀檢測的數(shù)據(jù),怠速狀態(tài)采樣時長為600 s。
柴油機在怠速狀態(tài)下試驗結束后,啟動設備開關,使柴油機在行走狀態(tài)下工作一段時間后達到勻速穩(wěn)定狀態(tài),記錄尾氣分析儀檢測到的數(shù)據(jù),行走狀態(tài)采樣時長為600 s。
柴油機在行走狀態(tài)工作結束后,讓其于田間邊走邊旋耕,柴油機處于旋耕狀態(tài),記錄此時尾氣分析儀檢測到的數(shù)據(jù),行走狀態(tài)采樣時長為1 500 s。
試驗前設定采樣頻率1 s/次,總采樣時長為 2 700 s,共采集2 700條排放數(shù)據(jù),排放試驗周期從拖拉機引擎啟動開始到結束為一次。試驗測試并記錄共有7個參數(shù),分別為轉(zhuǎn)速、油耗流量、燃燒比、CO、HC、NOx和PM。試驗獲取的部分數(shù)據(jù)如表2所示。
表2 部分試驗數(shù)據(jù)Table 2 Part of the test data
基于機器學習、神經(jīng)網(wǎng)絡和統(tǒng)計學的預測模型中數(shù)據(jù)集的屬性量綱及值域?qū)δP偷念A測精度和時間復雜度的影響較大[14]。依據(jù)排放試驗數(shù)據(jù)值域分布以及初步建模分析發(fā)現(xiàn),直接進行神經(jīng)網(wǎng)絡訓練會降低預測精度,并且增加訓練迭代次數(shù)。因此在建立排放時間序列深度極限學習機預測模型訓練之前對試驗數(shù)據(jù)進行標準化,進而提升模型的預測精度收斂速度。標準化公式為
(1)
對數(shù)據(jù)進行標準化后,輸出數(shù)據(jù)每列均值都聚集在0附近,方差為1,可減少神經(jīng)網(wǎng)絡訓練的計算量,進而提高模型訓練的效率。
ELM是求解單隱含層前饋神經(jīng)網(wǎng)絡的一種算法[15-17],通過隨機輸入權重和隱含層偏置,計算得到輸出層權重[18],從而學習速率快。但因為ELM是單隱含層結構,針對數(shù)據(jù)較多,數(shù)據(jù)維度過高等情況,不能捕捉到數(shù)據(jù)的有效特征,因此更多學者采用ELM的衍生算法DELM。基于此,提出采用深度極限學習機算法對尾氣排放量進行預測。
深度極限學習機利用極限學習機與自動編碼器相結合[19],形成極限學習機-自動編碼器(extreme learning machine-automatic encoder,ELM-AE),再將ELM-AE作為無監(jiān)督學習的基礎單元對輸入數(shù)據(jù)進行訓練與學習,并保存ELM-AE由最小二乘法獲得的輸出權值矩陣用于堆棧深度極限學習機[20-21]。ELM-AE的結構如圖1所示。
g(WX+b)為隱含層神經(jīng)元的輸出矩陣計算公式;g為激活函數(shù);W為輸出層與隱含層之間的權值矩陣;X為輸入層矩陣;b為偏移量圖1 ELM-AE結構Fig.1 ELM-AE structure
假設給定n個不同的樣本集合,xn=[x1,x2,…,xn]T為輸入數(shù)據(jù);ym=[y1,y2,…,yn]T為輸出數(shù)據(jù);hx為隱含層的函數(shù);β為連接隱含層和輸出層的權重;βT為隱含層和輸出層的權重的轉(zhuǎn)置矩陣。
ELM-AE是由輸入層、隱含層和輸出層構成[22]。輸出層權重β可表示為
(2)
式(2)中:E為單位矩陣;C為正則化系數(shù);H為隱含層輸出矩陣;X為輸入和輸出。
DELM相當于多個ELM連接在一起,相較于ELM更能全面捕獲數(shù)據(jù)之間的映射關系,從而提高其精確度。且DELM沒有反向調(diào)優(yōu)的過程,這樣訓練網(wǎng)絡的時間就會大大減少[23-24],DELM網(wǎng)絡結構如圖2所示。在訓練的過程中,若給定N個樣本,輸入樣本數(shù)據(jù)為X,DELM模型的隱含層為M,然后依據(jù)ELM-AE網(wǎng)絡結構得到第一個權重矩陣β1,隱含層特征向量為h1,并作為下一層網(wǎng)絡結構的輸入。以此類推,最終可得M層輸入權重矩陣βM和隱含層特征向量hM,也就完成了深度極限學習機的訓練過程。
x為輸入數(shù)據(jù);β1為連接第一層隱含層和輸出層的權重;(β1)T為β1的轉(zhuǎn)置矩陣;hi為隱含層的特征向量;ym=[y1,y2,…,yn]T為輸出數(shù)據(jù);βi+1為第i+1層隱含層和輸出層的權重;(βi+1)T為第i+1層隱含層和輸出層的權重的轉(zhuǎn)置矩陣圖2 DELM結構Fig.2 DELM structure
數(shù)據(jù)挖掘中,為提高預測模型的擬合能力和泛化性能,需采用盡可能多的高精度數(shù)據(jù)對模型進行訓練[25]。訓練模型時,數(shù)據(jù)集中訓練集和測試集的比例劃分對最終的模型精度的影響較大,常用的數(shù)據(jù)劃分方法有留出法、交叉驗證法和自助法等。排放試驗數(shù)據(jù)集的劃分根據(jù)排放時間序列的數(shù)據(jù)量和值域分布現(xiàn)狀應用留出法確定訓練集和測試集比例,即取80%的數(shù)據(jù)作為訓練集用于模型的訓練,20%作為測試集用于驗證預測模型的預測性能。
所提出的DELM預測模型是使用MATLAB2019a軟件編程設計完成。模型性能評價以平均絕對百分誤差(mean absolute percent error,MAPE)作為衡量預測模型的精確度的一個重要指標,應用均方根誤差(root mean squared error,RMSE)和平均絕對誤差(mean absolute error,MAE)指標評價實際輸出和預測輸出之間的偏差,可較好地評價模型的預測能力。RMSE表示模型的回歸精度和學習能力,數(shù)值越小,表明該模型的回歸能力和學習能力及穩(wěn)定性越好,MAE和MAPE指標值越小,表明模型預測精確度越高。指標的具體公式為
(3)
(4)
(5)
基于DELM的拖拉機排放時間序列預測流程主要包括以下步驟。
步驟1基于SEMTECH-DS平臺采集2 700 s獲得的發(fā)動機轉(zhuǎn)速、油耗流量、燃燒比、CO、HC、NOx和PM等構成原始樣本數(shù)據(jù)集{M1,M2,…,M2 700},其中每個樣本包含7個屬性,前3個屬性為模型輸入,后4個為模型輸出。
步驟2對原始樣本數(shù)據(jù)集進行標準化處理,得到處理后的樣本{D1,D2,…,D2 700}。
步驟3將預處理后的樣本數(shù)據(jù){D1,D2,…,D2 700}根據(jù)拖拉機不同運行狀態(tài)試驗時長分為3個子集{subset1,subset2,subset3},然后將每個子集安1.2.1節(jié)中比例劃分為訓練集和測試集。
步驟4以訓練集的發(fā)動機轉(zhuǎn)速、油耗流量、燃燒比作為DELM算法輸入,CO、HC、NOx和PM作為輸出訓練拖拉機污染物排放模型。
步驟5基于訓練得到的DELM預測模型,將測試集的轉(zhuǎn)速、油耗流量、燃燒比作為輸入預測其輸出,并通過2.3節(jié)模型性能評價指標對其進行分析。
基于DELM模型在柴油機3種工況下預測其尾氣排放水平。實驗過程中,采用氣態(tài)污染物分析儀實時監(jiān)測柴油機污染物排放情況,并根據(jù)試驗數(shù)據(jù)研究柴油機在怠速、行走及旋耕3種工況下的排放實驗結果與預測結果的差異。
3.1.1 怠速狀態(tài)排放預測分析
準確預測拖拉機等柴油機械實際工況污染物排放在排放清單建立和區(qū)域污染物排放控制方面具有重要意義。首先以怠速狀態(tài)600個樣本為數(shù)據(jù)源,取其480個樣本(即80%)為訓練集,并基于深度極限學習機方法和2.4建模流程建立拖拉機怠速狀態(tài)CO、HC、NOx、PM污染物排放預測模型。然后用訓練好的模型和測試集的輸入進行預測。最后結合模型性能評價指標分析預測模型。結果如圖3所示。
觀察圖3可知,DELM模型在對拖拉機怠速狀態(tài)下的CO、HC、NOx、PM預測方面有較好的優(yōu)勢,數(shù)據(jù)擬合程度較高,為了進一步定量分析其預測精度,應用MAPE、RMSE和MAE 3個評價指標進行分析,結果如表3所示。
圖3 怠速狀態(tài)CO、HC、NOx和PM預測結果Fig.3 CO,HC,NOx and PM prediction result in idling state
由表3結果可以看出,DELM模型在柴油機怠速狀態(tài)下擬合CO的MAPE為1.547×10-2,RMSE為7.192×10-5,MAE為5.874×10-5,均小于HC、NOx、PM的MAPE、RMSE和MAE值,說明在怠速狀態(tài)下,CO預測效果較好。PM的MAPE為4.745×10-2,RMSE為2.189×10-4,可以看出,PM的預測誤差相較于CO較大,但PM預測值與實際值誤差平均值為1.786×10-4,由此可見,預測模型輸出結果與實際結果很接近,差值很小,表明DELM模型在柴油機排放預測方面具有較好的擬合學習能力。
表3 怠速狀態(tài)模型預測誤差Table 3 Prediction error of idling state model
3.1.2 行走狀態(tài)排放預測分析
按照模型數(shù)據(jù)劃分方法確定行走狀態(tài)600個樣本的訓練集和測試集。結合建模流程建立拖拉機行走狀態(tài)CO、HC、NOx、PM污染物排放預測模型。然后用訓練好的模型和行走狀態(tài)測試集的輸入進行預測,最后分析其誤差,結果如圖4所示。
由圖4可以發(fā)現(xiàn),行走狀態(tài)下柴油機排放污染物CO和PM預測值相較于真實值結果偏低,HC和NOx較真實值結果偏高。這可能是因為拖拉機在行走過程中轉(zhuǎn)速不穩(wěn)定,油耗流量相較于怠速狀態(tài)下增加,燃燒比增大,進而導致模型訓練的數(shù)據(jù)值有波動,模型預測結果存在偏差;其次在試驗過程中,試驗采集數(shù)據(jù)存在干擾異常值,對模型的預測精度有影響。為了進一步分析上述預測偏差的大小,應用MAPE、RMSE和MAE 3個指標對建立的柴油機耕作狀態(tài)下預測模型的性能進行評估分析,結果如表4所示。
通過表4結果可以看出,雖然在圖4中DELM模型預測精度存在一些偏差,但其誤差較小。其中,PM預測值的MAPE為1.713×10-2,RMSE為8.031×10-5,MAE為6.496×10-5,均小于CO、HC和NOx的MAPE、RMSE和MAE值,說明在行走狀態(tài)下,PM預測效果較好。NOx預測值的MAPE為1.806×10-2,RMSE為8.419×10-5,可以看出,NOx的預測誤差相較于PM預測誤差大,但NOx預測值與實際值誤差平均值為6.846×10-5,總體上差值很小,由此可見預測模型輸出結果與實際結果很接近,模型具有較高的預測精度,進而表明DELM模型在柴油機行走狀態(tài)下同樣具有較好的預測能力。
表4 行走狀態(tài)模型預測誤差Table 4 Prediction error of walking state model
圖4 行走狀態(tài)CO、HC、NOx和PM預測結果Fig.4 CO,HC,NOx and PM prediction result for walking state
3.1.3 旋耕狀態(tài)排放預測分析
拖拉機結束怠速和行走狀態(tài)的排放試驗后,進入田間進行旋耕作業(yè),此狀態(tài)具有發(fā)動機轉(zhuǎn)速高、燃油消耗和前兩種狀態(tài)相比猛增的特點,同時是排放預測中的重點工況。本階段首先將取1 500個樣本的80%,并訓練DELM排放預測模型。然后,基于測試集輸入進行預測分析。最后分析其預測性能。為了直觀地與其他兩個狀態(tài)下的預測結果進行對比,選取120個預測值制圖,如圖5所示。
由圖5可知,旋耕狀態(tài)下污染物預測值與真實值趨勢大致相同,但存在較大波動,可能是因為拖拉機在旋耕過程中轉(zhuǎn)速上下波動范圍相差較大,油耗流量相較于怠速和行走狀態(tài)過大,柴油燃燒不完全,燃燒比有波動,進而導致數(shù)據(jù)波動較大,為了進一步解析圖中呈現(xiàn)出的趨勢,應用MAPE、RMSE和MAE 3個指標對建立的柴油機耕作狀態(tài)下預測模型的性能進行評估分析,結果如表5所示。
圖5 旋耕狀態(tài)CO、HC、NOx和PM預測結果Fig.5 CO,HC,NOx and PM prediction result for rotary tillage state
旋耕狀態(tài)下模型的預測結果表明,DELM模型在柴油機旋耕狀態(tài)預測HC的MAPE為2.320×10-2,RMSE為1.097×10-5,MAE為8.796×10-5。通過表5分析可知,旋耕狀態(tài)下HC的預測性能均優(yōu)于CO、NOx和PM,表明旋耕狀態(tài)下,DELM模型預測HC效果最佳。PM的MAPE為2.847×10-3,RMSE為1.342×10-4,可以看出,PM的預測結果相較于CO預測誤差較大,但PM預測值與實際值誤差平均值為1.079×10-4,差值較小,且CO、HC、NOx和PM的預測值和實測值的平均絕對百分誤差分別為:2.474%、2.32%、2.392%和2.847%,誤差值都在5%之內(nèi),可以滿足較準確地預測拖拉機等柴油機械尾氣排放的需要。
表5 旋耕狀態(tài)模型預測誤差Table 5 Prediction error of rotary tillage state model
3.2.1 不同模型預測
為了進一步評估DELM模型的適應性,以CO為例,分別用BP和SVM模型對拖拉機怠速、行走和旋耕工況下CO排放進行預測,并與DELM模型進行對比分析。DELM、BP神經(jīng)網(wǎng)絡和SVM模型不同工況下CO的預測結果如表6所示。
3.2.2 不同模型預測結果對比分析
由表6可以看出,怠速狀態(tài)下DELM模型預測CO的RMSE、MAPE和MAE均小于BP和SVM模型的預測誤差,DELM模型用于柴油機尾氣排放預測時,排放預測值與試驗實際值之間的平均絕對百分誤差僅為1.547×10-2,比BP神經(jīng)網(wǎng)絡和SVM預測模型低98.18%、91.40%,由此可見該DELM模型預測怠速狀態(tài)下的污染物排放方面和其他2種方法相比優(yōu)勢較明顯。
表6 不同狀態(tài)下不同模型的預測誤差對比Table 6 Comparison of prediction errors of different models under different states
不同模型的預測結果對比可知,行走狀態(tài)下DELM模型在RMSE和MAE誤差指標方面比BP神經(jīng)網(wǎng)絡和SVM模型均有所減少,并且DELM模型比BP神經(jīng)網(wǎng)絡和SVM模型的平均絕對百分誤差低11.06%、10.85%,表明DELM模型預測精度優(yōu)于BP神經(jīng)網(wǎng)絡和SVM預測模型。
旋耕狀態(tài)下DELM模型比BP和SVM模型預測CO的平均絕對百分誤差低57.40%、34.87%,對比各項評價指標,DELM模型比其他2種模型的誤差值更小,其預測效果也最佳。
綜上所述,拖拉機不同工況下DELM模型的預測性能優(yōu)于BP和SVM模型。SVM預測性能優(yōu)于BP,這可能是因為BP神經(jīng)網(wǎng)絡容易陷入局部最優(yōu)而訓練失敗,從而也導致訓練時間較長。然而,DELM模型在訓練過程中無需迭代微調(diào),耗時較短,準確率高,在學習速率和泛化能力上具有較強的優(yōu)勢,能快速準確地預測柴油機污染物排放。
(1)建立了基于DELM算法的拖拉機尾氣排放預測模型,并對怠速、行走和旋耕3種工況下的NOx、HC、CO和PM排放進行預測分析,結果發(fā)現(xiàn),DELM模型預測4種污染物排放均方根誤差均值分別為5.269×10-5、5.195×10-5、5.135×10-5和2.795×10-5。表明DELM算法在預測排放時間序列方面具有顯著優(yōu)勢。
(2)對比3種模型的CO預測精度發(fā)現(xiàn),DELM預測誤差顯著低于SVM和BP,表明DELM在預測污染物排放方面較好的泛化能力。
(3)不同運行狀態(tài)下,DELM模型可為拖拉機等柴油機械的污染物排放時間序列預測提供新途徑,進而建立為拖拉機不同工況排放模型提供方法。