吉黎明 熊興旺 楊子榮
(1-中國合格評定國家認可中心 北京 100062 2-中汽研新能源汽車檢驗中心(天津)有限公司)
氮氧化物(NOx)是重型柴油機主要的污染物之一,為應(yīng)對嚴格的重型柴油機排放法規(guī),重型柴油機對后處理系統(tǒng)提出了越來越高的要求[1-2]。發(fā)動機運行工況對于氮氧化物生成量有重要影響[3],研究人員采用機器學習算法,根據(jù)發(fā)動機運行工況參數(shù)對柴油機氮氧化物排放進行預(yù)測,如采用神經(jīng)網(wǎng)絡(luò)回歸算法[4],向量回歸機(SVR)[5]等方式。重型柴油機NOx的機外凈化技術(shù)路線中,SCR 系統(tǒng)凈化效率較高,在重型柴油機匹配的后處理系統(tǒng)中得到廣泛應(yīng)用[6]。SCR 系統(tǒng)正常工作時,在合適的排氣溫度區(qū)間內(nèi),SCR 系統(tǒng)轉(zhuǎn)化NOx效率較高[7-8]。排氣溫度和NOx濃度可以作為SCR 系統(tǒng)確定開啟尿素噴射時刻的參考依據(jù)。
本文將排氣溫度和原始排放NOx體積濃度耦合為一個新的變量,作為發(fā)動機運行工況的標識變量,即依據(jù)排氣溫度值和原始排放NOx體積濃度值,對所有發(fā)動機運行工況進行二值化狀態(tài)標識(0 或1),標識出適合噴射尿素的發(fā)動機運行工況。選取5 項發(fā)動機運行參數(shù)序列作為輸入變量,二值化后的工況點狀態(tài)標識序列作為輸出變量,構(gòu)造邏輯回歸分類模型。構(gòu)造的邏輯回歸分類模型用于預(yù)測適合尿素噴射的發(fā)動機運行工況,對于SCR 系統(tǒng)合理確定開啟尿素噴射時刻具有一定參考意義。
發(fā)動機及后處理系統(tǒng)安裝在臺架上,氣體排放分析儀采樣管安裝在后處理系統(tǒng)入口之前,分析儀采樣管從發(fā)動機原始排氣中取樣。燃用市售國六柴油,按照標準GB 17691-2018 進行了熱態(tài)WHTC 循環(huán)試驗。圖1 給出了發(fā)動機在熱態(tài)WHTC 循環(huán)試驗中各工況點的轉(zhuǎn)速和轉(zhuǎn)矩。
圖1 試驗發(fā)動機熱態(tài)WHTC 循環(huán)工況
圖2 所示為熱態(tài)WHTC 循環(huán)試驗中排氣溫度曲線和原機NOx濃度曲線。
圖2 試驗循環(huán)中排溫和原機NOx 濃度曲線
從圖2 中可以看到,在整個循環(huán)中,排溫曲線和原機NOx濃度曲線波動劇烈,NOx排放高值工況頻繁出現(xiàn)。通常當排氣溫度大于等于特定的溫度閾值時,SCR 轉(zhuǎn)化效率較高,SCR 系統(tǒng)才能較好發(fā)揮凈化作用[9]。SCR 系統(tǒng)工作時需要根據(jù)當前工況對應(yīng)的排氣溫度和原始排氣中NOx濃度等條件,來判定當前工況是否啟動尿素噴射對NOx進行凈化。為篩選適合SCR系統(tǒng)噴射尿素進行NOx凈化的工況,需要構(gòu)造一個綜合考慮排氣溫度和原始排放NOx濃度的變量。根據(jù)排氣溫度和原始排放NOx濃度數(shù)據(jù)序列,按照以下規(guī)則對WHTC 循環(huán)每個工況點進行二值化狀態(tài)標識:
1)若當前工況對應(yīng)的排氣溫度小于設(shè)定的排氣溫度閾值或原始排放NOx濃度低于設(shè)定的NOx濃度閾值,則該工況不適合SCR 系統(tǒng)噴射尿素進行NOx凈化,將該工況標識為0;
2)若當前工況對應(yīng)的排氣溫度大于等于設(shè)定的排氣溫度閾值且原始排放NOx濃度大于等于設(shè)定的NOx濃度閾值,則該工況適合SCR 系統(tǒng)噴射尿素進行NOx凈化,將該工況標識為1。
WHTC 循環(huán)工況二值化狀態(tài)標識規(guī)則可用式(1)表示如下:
二值化狀態(tài)標識數(shù)據(jù)序列與發(fā)動機工況狀態(tài)參數(shù)緊密相關(guān),考慮利用機器學習算法建立模型來表征發(fā)動機工況狀態(tài)參數(shù)與二值化狀態(tài)標識的對應(yīng)關(guān)系。根據(jù)建立的模型,依據(jù)發(fā)動機運行狀態(tài)參數(shù)來預(yù)測當前工況的二值化狀態(tài),判定是否適合SCR 系統(tǒng)噴射尿素進行NOx凈化,為SCR 系統(tǒng)合理確定開啟尿素噴射時刻提供參考。
二值化狀態(tài)標識只有0 和1 兩種狀態(tài),建立的預(yù)測模型實際上屬于一種二分類模型。常見的機器學習算法中,邏輯回歸模型是一種基于概率分布的非線性二分類模型,廣泛應(yīng)用于多種場景。作為一種常用的定性變量分析機器學習算法,邏輯回歸模型對數(shù)據(jù)的正態(tài)性和自變量的類型沒有過多的限制要求,邏輯回歸模型在實際應(yīng)用中表現(xiàn)出了較好的預(yù)測能力[10]。
邏輯回歸模型由條件概率分布P(y|x)表示,其中y 表示預(yù)測值,x 表示多維特征向量。當預(yù)測任務(wù)為二分類問題時,隨機變量y 的取值為0 或1,用y=0 來表示事件未發(fā)生,用y=1 來表示事件發(fā)生。對于給定的數(shù)據(jù)集T={(x1,y1),(x2,y2),……,(xn,yn)},其中xi∈Rn為二分類模型的輸入變量,yi∈{0,1}為二分類模型的輸出變量,在對二分類函數(shù)進行分析時,通常使用Sigmoid 函數(shù)來實現(xiàn)邏輯回歸分類器,預(yù)測函數(shù)如式(2)、式(3)和式(4)所示[11]:
式中:θ=[θ1,θ2,…,θn]∈Rn為n 個待定的系數(shù),稱之為權(quán)向量。
邏輯回歸一般使用交叉熵作為代價函數(shù),代價函數(shù)如式(5)所示[12]:
根據(jù)式(5),使用梯度下降法最小化代價函數(shù),可求得權(quán)值向量θ 的一組最佳參數(shù)。
對于訓練好的邏輯回歸二分類模型,根據(jù)給定的輸入變量x,根據(jù)式(3)和式(4)可以分別求得條件概率分布P(1|x)及P(0|x)的值。然后,算法比較兩個概率分布值的大小,當P(1|x)大于等于P(0|x)時,算法的輸出預(yù)測值為1,當P(1|x)小于P(0|x)時,算法的輸出預(yù)測值為0。即邏輯回歸算法總是將樣本分到概率值較大的那一類[13-14]。
發(fā)動機轉(zhuǎn)速、轉(zhuǎn)矩等較多的發(fā)動機運行參數(shù)與NOx具有較強的相關(guān)性,建模時可作為模型輸入變量[15-17]。結(jié)合臺架試驗實際情況,選取發(fā)動機轉(zhuǎn)速、進氣空氣流量、燃油流量、功率和轉(zhuǎn)矩等運行參數(shù)作為邏輯回歸模型的輸入變量,以WHTC 循環(huán)每個工況點二值化后的狀態(tài)標識變量作為邏輯回歸二分類模型輸出變量。對于輸入變量樣本,由于不同變量序列的絕對值大小不同,如果直接進行模型訓練,會造成模型訓練結(jié)果被若干輸入變量樣本所主導,而受其它樣本的影響比較小的情況。為避免上述情況,輸入變量在模型中參與計算之前需先進行數(shù)據(jù)預(yù)處理,文中采用數(shù)據(jù)標準化的方式,標準化方法如式(6)、式(7)和式(8)所示[18]:
式中:z(i)為模型各輸入變量序列值,分別為發(fā)動機轉(zhuǎn)速、進氣空氣流量、燃油流量,功率和轉(zhuǎn)矩,其單位分別為r/min、kg/h、kg/h、kW 和N·m;N 為模型各輸入變量序列的長度;zˉ為模型各輸入變量序列的平均值,單位分別為r/min、kg/h、kg/h、kW 和N·m;s 為模型各輸入變量序列的標準差值,單位分別為r/min、kg/h、kg/h、kW 和N·m;z*(i)為標準化后的模型各輸入變量序列值,無量綱值。
對于SCR 系統(tǒng),當排氣溫度低于200 ℃時,尿素無法充分熱解與水解[19]。式(1)中用于工況二值化狀態(tài)標識的排氣溫度閾值設(shè)定為200℃,NOx濃度閾值可以根據(jù)實際情況進行調(diào)整,本文中分別將NOx濃度閾值設(shè)定為50×10-6、100×10-6、150×10-6、200×10-6、250×10-6和300×10-6,根據(jù)設(shè)定的閾值對所有工況進行二值化狀態(tài)標識,不同NOx濃度閾值得到的二值化狀態(tài)標識序列不同。
試驗循環(huán)中包含低轉(zhuǎn)速低負荷、高轉(zhuǎn)速高負荷等各種類型工況,為保證模型訓練工況點集對各類型工況的覆蓋,需要按照一定比例將所有采集的工況隨機劃分為訓練工況點集和測試工況點集。本文中邏輯回歸模型選用的訓練工況數(shù)據(jù)點集與測試工況數(shù)據(jù)點集數(shù)量比例為7 ∶3,圖3 所示為訓練工況點集與測試工況點集的劃分情況。
圖3 訓練工況點集與測試工況點集
將輸入變量和輸出變量分別按照圖3 所示的訓練工況點集與測試工況點集劃分方式進行分割,分別用于訓練模型和測試模型?;赑ython 和sklearn機器學習庫編程訓練模型。利用訓練好的模型對測試工況點集的數(shù)據(jù)進行模型預(yù)測效果評估。評估指標選取為模型準確率和模型對標識為1 的工況的召回率[20]。其中模型準確率和模型對標識為1 的工況的召回率定義分別如式(9)和式(10)所示:
式中:Rac為模型準確率,%;N(1,1)為實際是1 且模型識別為1 的測試工況個數(shù);N(0,0)為實際是0 且模型識別為0 的測試工況個數(shù);Nt為測試樣本工況總數(shù);Rre為模型對標識為1 的工況的召回率,%;N(1,0)為實際是1 且模型識別為0 的測試工況個數(shù)。
NOx濃度閾值分別設(shè)定為50×10-6、100×10-6、150×10-6、200×10-6、250×10-6和300×10-6時,訓練所得模型的預(yù)測效果評估指標如表1 所示。
表1 不同NOx濃度閾值時模型評估指標
表4 中結(jié)果表明,NOx濃度閾值設(shè)定為50×10-6、100×10-6、150×10-6、200×10-6、250×10-6和300×10-6時,訓練所得邏輯回歸二分類模型,用于對測試工況點集進行工況預(yù)測時,模型準確率和模型對標識為1的工況的召回率均大于83%。
本文主要得到了以下結(jié)論:
1)依據(jù)一定的排氣溫度閾值和NOx體積濃度閾值對WHTC 循環(huán)每個工況點進行了二值化狀態(tài)標識。
2)以發(fā)動機轉(zhuǎn)速、進氣空氣流量、燃油流量,功率和轉(zhuǎn)矩為模型輸入變量,二值化后的狀態(tài)標識變量作為模型輸出,構(gòu)建了邏輯回歸二分類模型。
3)設(shè)定不同NOx體積濃度閾值,分別得到不同的輸出變量序列用于訓練和測試模型。訓練所得模型,用于對測試工況點集進行預(yù)測時,模型準確率和模型對標識為1 的工況的召回率均大于83%。