潘恒斌 官維 潘明章 梁科 文濤 姜淑君
摘要: ?在嚴(yán)格的排放法規(guī)面前,柴油機(jī)后處理系統(tǒng)發(fā)揮了不可估量的作用,而獲取NO ?x 排放是后處理系統(tǒng)中SCR裝置得以正常工作的前提之一。建立一種使用獵人獵物優(yōu)化(HPO)算法優(yōu)化長(zhǎng)短期記憶(LSTM)網(wǎng)絡(luò)的虛擬預(yù)測(cè)模型,實(shí)現(xiàn)對(duì)柴油機(jī)NO ?x 排放準(zhǔn)確預(yù)測(cè),以代替現(xiàn)有物理傳感器或作為并行裝置監(jiān)控其運(yùn)行。試驗(yàn)在柴油機(jī)測(cè)功機(jī)上進(jìn)行,在高度瞬態(tài)的柴油機(jī)運(yùn)行周期內(nèi),輸入了若干種便于獲取且與NO ?x 形成密切相關(guān)的參數(shù)至模型中,結(jié)果表明:該優(yōu)化后的網(wǎng)絡(luò)應(yīng)用于測(cè)試集和全新的未知瞬態(tài)工況時(shí),與未優(yōu)化網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果相比,RMSE分別提高了29.1%和23.4%, R 2分別大于和接近0.95,預(yù)測(cè)結(jié)果與傳感器測(cè)量值呈現(xiàn)高度相同的變化趨勢(shì),滿(mǎn)足了車(chē)載運(yùn)用和準(zhǔn)確性的需求,驗(yàn)證了該方法的可行性。
關(guān)鍵詞: ?柴油機(jī);氮氧化物;預(yù)測(cè);獵人獵物優(yōu)化算法;長(zhǎng)短期記憶網(wǎng)絡(luò)
DOI ?: ??10.3969/j.issn.1001-2222.2024.01.011
中圖分類(lèi)號(hào): ?TK421.5 ??文獻(xiàn)標(biāo)志碼: ?B ??文章編號(hào): ??1001-2222(2024)01-0067-09
自從19世紀(jì)末柴油機(jī)問(wèn)世以來(lái),其便以熱效率、經(jīng)濟(jì)性和可靠性等方面的優(yōu)勢(shì)廣泛應(yīng)用于商用車(chē)領(lǐng)域和工業(yè)機(jī)械中。然而柴油機(jī)在排放方面的劣勢(shì)不容忽視,而排放法規(guī)日益嚴(yán)苛,2019年7月試點(diǎn)實(shí)施的國(guó)六排放標(biāo)準(zhǔn)更是對(duì)柴油機(jī)主要排放物NO ?x 和PM提出了新的要求。
NO ?x 虛擬預(yù)測(cè)是針對(duì)車(chē)輛實(shí)時(shí)排放控制要求而發(fā)展起來(lái)的一種新技術(shù)。傳統(tǒng)的物理傳感器受限于造價(jià)高昂和瞬態(tài)實(shí)時(shí)測(cè)量性能不佳等因素,在后處理系統(tǒng)中應(yīng)用存在一些弊端;而NO ?x 虛擬技術(shù)通過(guò)構(gòu)建模型,可以精準(zhǔn)地輸出目標(biāo)值與若干輸入量之間的關(guān)系,具有快速動(dòng)態(tài)響應(yīng)和離線預(yù)測(cè)能力。該模型可以是根據(jù)經(jīng)驗(yàn)或模型標(biāo)定擬合成的多項(xiàng)式函數(shù),亦可是無(wú)法獲取內(nèi)部詳細(xì)演算規(guī)律的黑箱模型。這種技術(shù)逐漸引起人們的關(guān)注,因?yàn)樗軌驈浹a(bǔ)傳統(tǒng)物理傳感器的不足,提供實(shí)時(shí)且準(zhǔn)確的NO ?x 排放預(yù)測(cè)值。
精準(zhǔn)地預(yù)測(cè)柴油機(jī)主要排放物便可以獲取實(shí)時(shí)的燃燒動(dòng)態(tài),進(jìn)而對(duì)缸內(nèi)燃燒進(jìn)行閉環(huán)反饋控制。通過(guò)調(diào)節(jié)噴油器的相關(guān)參數(shù)改善燃燒狀態(tài)量,從而達(dá)到降低排放的目的。此外,在SCR系統(tǒng)中為了保證NO ?x 和氨之間處于理想的化學(xué)計(jì)量比,提高還原反應(yīng)的效率,避免出現(xiàn)NO ?x 的不完全還原或氨的過(guò)量生成, 需要對(duì)下游的NO ?x 濃度進(jìn)行精準(zhǔn)測(cè)量,為尿素噴射量的確定提供依據(jù)。綜上所述, NO ?x 虛擬預(yù)測(cè)技術(shù)在后處理系統(tǒng)中的應(yīng)用具有巨大潛力。
針對(duì)NO ?x 的排放預(yù)測(cè),眾多學(xué)者進(jìn)行了大量研究。在排放物產(chǎn)生機(jī)制的建模方面,Jung Dohoy等[1]將燃油噴霧進(jìn)行分區(qū),用完整的發(fā)動(dòng)機(jī)循環(huán)直接預(yù)測(cè)NO ?x 排放,結(jié)果顯示兩者變化基本一致,但由于分區(qū)較多,循環(huán)仿真耗時(shí)較多,故計(jì)算速度較慢。Andersson等[2]以Zeldovich機(jī)理為基礎(chǔ),以噴油和進(jìn)氣參數(shù)作為輸入還原缸內(nèi)燃燒過(guò)程,但是由于模型過(guò)于理想化,僅在部分小負(fù)荷工況下預(yù)測(cè)結(jié)果較吻合,其余工況不理想。
在經(jīng)驗(yàn)擬合建模方面,Lopez等[3]利用缸壓信號(hào)和進(jìn)氣濃度基于經(jīng)驗(yàn)公式進(jìn)行NO ?x 排放建模,由于輸入?yún)?shù)量不足,表征的燃燒有效信息有限,穩(wěn)態(tài)工況下測(cè)量誤差就達(dá)10%,瞬態(tài)工況下則更大。Ebner等[4]基于缸壓開(kāi)發(fā)NO ?x 虛擬傳感器,模型是一個(gè)二次多項(xiàng)式函數(shù),與某型號(hào)NO ?x 物理傳感器相比,它在一個(gè)循環(huán)內(nèi)的響應(yīng)時(shí)間更快,可預(yù)測(cè)的工況范圍更廣,但是其預(yù)測(cè)精度不佳,僅能反映出NO ?x 的變化趨勢(shì)。除多項(xiàng)式回歸模型外,利用神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)污染物排放值的方法在過(guò)去二十年間得到了廣泛研究[5-8]。Atkinson等[9]提出基于循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)來(lái)估算柴油機(jī)和汽油機(jī)的瞬態(tài)NO ?x 排放,從結(jié)果直觀看出對(duì)柴油機(jī)的預(yù)測(cè)效果明顯優(yōu)于汽油機(jī)。通用汽車(chē)公司[10]提出一種基于前饋神經(jīng)網(wǎng)絡(luò)算法的NO ?x 排放預(yù)測(cè)方法,提取了與NO ?x 排放相關(guān)性較大的5個(gè)燃燒狀態(tài)參數(shù)作為輸入,以NO ?x 排放作為輸出來(lái)訓(xùn)練網(wǎng)絡(luò),并在模型中加入動(dòng)態(tài)補(bǔ)償項(xiàng)以提高加速工況中NO ?x 排放精度,結(jié)果表明總體預(yù)測(cè)精度仍有待提升。Alcan等[11]采用基于Sigmoid的具有外源輸入的非線性自回歸(NARX)模型來(lái)預(yù)測(cè)穩(wěn)態(tài)和瞬態(tài)循環(huán)下給定輸入集的NO ?x 排放,生成不同參數(shù)值的模型來(lái)分析對(duì)參數(shù)變化的敏感性,并提出了一種易于解釋的映射的參數(shù)選擇方法來(lái)找到最佳建模參數(shù);但試驗(yàn)結(jié)果表明,所獲得的大多數(shù)模型的穩(wěn)態(tài)和瞬態(tài)驗(yàn)證精度僅高于80%和70%。Tang等[12]以油耗、負(fù)荷和柴油混合比為輸入?yún)?shù),建立了生物柴油發(fā)動(dòng)機(jī)排放性能的雙隱層BP神經(jīng)網(wǎng)絡(luò)模型,得到了NO ?x 排放預(yù)測(cè)值和試驗(yàn)值隨燃油消耗量的變化曲線,結(jié)果表明NO ?x 排放的預(yù)測(cè)結(jié)果在燃油消耗量低時(shí)與試驗(yàn)結(jié)果吻合良好,相關(guān)系數(shù) R 很高,但是該預(yù)測(cè)值會(huì)隨著燃油消耗量的增加而逐漸偏離試驗(yàn)值,僅能確保兩者趨勢(shì)一致。
在前饋神經(jīng)網(wǎng)絡(luò)中,參數(shù)傳遞具有單向性,最終輸出只依賴(lài)于當(dāng)前輸入,該網(wǎng)絡(luò)處理的對(duì)象是具有一定因果關(guān)系的一組隨機(jī)變量之間的數(shù)值關(guān)系。而發(fā)動(dòng)機(jī)輸入?yún)?shù)為時(shí)序數(shù)據(jù),長(zhǎng)期處理此類(lèi)數(shù)據(jù)往往具有局限性。在深度學(xué)習(xí)中,模型的選擇取決于數(shù)據(jù)類(lèi)型與研究目的,以循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)為代表的模型常用于處理該類(lèi)序列數(shù)據(jù)。RNN神經(jīng)元不僅可以接收其他神經(jīng)元的信息,還能從自身提取信息,這就形成了有環(huán)路的網(wǎng)絡(luò)結(jié)構(gòu),反饋值隨時(shí)間反向傳播,算法按照時(shí)間逆序?qū)⒄`差往前傳遞作為 附加網(wǎng)絡(luò)進(jìn)行輸入??紤]到RNN網(wǎng)絡(luò)處理長(zhǎng)時(shí)間序列的局限性,本研究使 用RNN模型的改進(jìn)LSTM模型,將其離線訓(xùn)練完畢后對(duì)柴油機(jī)下游的NO ?x 排放進(jìn)行實(shí)時(shí)的虛擬預(yù)測(cè)。此外,獵人獵物優(yōu)化算法是近兩年提出的智能優(yōu)化算法,具有優(yōu)化迭代迅速、收斂效果顯著的優(yōu)勢(shì),該算法的使用旨在高效準(zhǔn)確尋找全局最優(yōu)的LSTM超參數(shù)組合,避免單一模型陷入局部最優(yōu)解,最終達(dá)到提高預(yù)測(cè)精度的目的。
1 ??試驗(yàn)
1.1 ?試驗(yàn)平臺(tái)
試驗(yàn)臺(tái)架由增壓水冷式高壓共軌柴油機(jī)、瞬態(tài)交流電力測(cè)功機(jī)、AVL735油耗儀、AVL PUMA臺(tái)架測(cè)試系統(tǒng)和AVL AMA氣體排放分析儀等組成。柴油機(jī)的基本參數(shù)如表1所示,試驗(yàn)臺(tái)架示意見(jiàn)圖1。
1.2 ?工況選取及數(shù)據(jù)獲取
根據(jù)中國(guó)現(xiàn)行的污染物排放限值及測(cè)量的相關(guān)法規(guī)進(jìn)行了世界統(tǒng)一瞬態(tài)試驗(yàn)循環(huán)(WHTC)測(cè)試,全程1 800 s。為了防止數(shù)據(jù)量過(guò)少產(chǎn)生過(guò)擬合或數(shù)據(jù)量太大模型收斂時(shí)間長(zhǎng)的情況,設(shè)定測(cè)試采樣頻率為0.1 s,可獲取約18 000個(gè)瞬態(tài)工況點(diǎn)的數(shù)據(jù)。此外為了驗(yàn)證模型的泛化能力,以歐洲瞬態(tài)循 環(huán)(ETC)測(cè)試作為驗(yàn)證工況,全程同樣1 800 s,采樣頻率仍為0.1 s,得到約18 000個(gè)瞬態(tài)工況點(diǎn)數(shù)據(jù)。
需要指出的是,柴油機(jī)SCR系統(tǒng)啟動(dòng)溫度約為200 ℃,柴油機(jī)在冷起動(dòng)狀態(tài)下尿素噴射裝置處于禁用狀態(tài),此時(shí)估算NO ?x 的排放值是無(wú)意義的。因此在進(jìn)行循環(huán)測(cè)試之前,對(duì)柴油機(jī)在最高轉(zhuǎn)速點(diǎn)和 轉(zhuǎn)矩點(diǎn)進(jìn)行了約5 min的充分預(yù)熱,緊接著操控臺(tái)架進(jìn)入WHTC循環(huán)程序,與此同時(shí)開(kāi)始記錄數(shù)據(jù)。
上述數(shù)據(jù)是通過(guò)標(biāo)定套件(INCA-ETAS數(shù)據(jù)采集和MDA數(shù)據(jù)分析)來(lái)獲取的,結(jié)合現(xiàn)有的傳感器等設(shè)備采集了8個(gè)預(yù)選輸入變量:進(jìn)氣流量、進(jìn)氣總管下游氧含量、廢氣溫度、進(jìn)氣溫度、增壓壓力、軌壓、轉(zhuǎn)速、當(dāng)前循環(huán)噴油量,還采集了需預(yù)測(cè)的輸出量NO ?x 排放值。
2 ??LSTM ?模型建立
2.1 ?RNN ?循環(huán)神經(jīng)網(wǎng)絡(luò)
如前所述,前饋神經(jīng)網(wǎng)絡(luò)中由于信息的單向傳遞性,各輸入和輸出之間彼此相互獨(dú)立,其數(shù)值在時(shí)間線上并無(wú)關(guān)聯(lián),且數(shù)據(jù)的順序具有任意交換性。該特點(diǎn)使得模型加快了獲得各輸入與輸出間的非線性關(guān)系,但同時(shí)會(huì)犧牲模型擬合的準(zhǔn)確性。特別是對(duì)于柴油機(jī)NO ?x 排放值這類(lèi)典型的時(shí)間序列,它在某瞬態(tài)工況點(diǎn)是受過(guò)去連續(xù)時(shí)刻內(nèi)多因素的共同作用,用前饋神經(jīng)網(wǎng)絡(luò)處理時(shí)無(wú)法直接利用過(guò)去的信息,因此需要采用以RNN為代表的神經(jīng)網(wǎng)絡(luò)模型處理時(shí)間序列預(yù)測(cè)的問(wèn)題。RNN的結(jié)構(gòu)中隱藏層之間有節(jié)點(diǎn)的連接,當(dāng)前隱藏層內(nèi)的神經(jīng)元由此刻的輸入以及前一個(gè)隱藏層的輸出組成,構(gòu)成了閉環(huán)的模型,可存儲(chǔ)過(guò)去時(shí)刻的信息,使其具有短期記憶功能,這就確保了過(guò)去時(shí)刻與當(dāng)前時(shí)刻的關(guān)聯(lián)性。
然而RNN模型存在以下的缺點(diǎn):首先是某一時(shí)刻的輸出只與上一時(shí)刻有關(guān),但實(shí)際上柴油機(jī)的燃燒是一種動(dòng)態(tài)過(guò)程,其N(xiāo)O ?x 在某一時(shí)刻的排放是過(guò)去連續(xù)時(shí)刻多變量累積的結(jié)果;其次在訓(xùn)練的過(guò)程中隨著輸入量的增多網(wǎng)絡(luò)結(jié)構(gòu)會(huì)展開(kāi)得更長(zhǎng),反向傳播算法無(wú)法避免產(chǎn)生梯度消失和梯度爆炸的問(wèn)題[13]。RNN神經(jīng)網(wǎng)絡(luò)僅具備短期記憶功能,而按照柴油機(jī)的連續(xù)運(yùn)行時(shí)間所構(gòu)成的工況點(diǎn)是較長(zhǎng)時(shí)間序列,因此引出了RNN模型的改進(jìn)結(jié)構(gòu)——LSTM模型。
2.2 ?LSTM ?長(zhǎng)短期記憶網(wǎng)絡(luò)
LSTM模型是RNN模型的變體,但特殊的結(jié)構(gòu)使其具備處理長(zhǎng)期和短期時(shí)間序列的功能。它總體結(jié)構(gòu)與RNN類(lèi)似,只是隱藏層有所差別且更為復(fù)雜,它的隱藏層結(jié)構(gòu)如圖2所示。
由圖2可知, LSTM隱藏層中創(chuàng)造性地提出了4個(gè)交互層,即包括3個(gè)Sigmoid和1個(gè)tanh的激活函數(shù),前者的功能是把從前的輸入值壓縮到0~1之間,“1”即為保留,“0”即為舍棄,這樣可達(dá)到選擇性通過(guò)信息的目的。而長(zhǎng)時(shí)間的記憶功能的實(shí)現(xiàn)是歸功于處于上方從左貫通至右的“傳送帶”,這條線上只有簡(jiǎn)單的線性交互層,確保了過(guò)去信息的流通并基本保持不變。
LSTM的隱藏層包括遺忘門(mén)、輸入門(mén)、輸出門(mén)和記憶細(xì)胞單元,它們各自的激活函數(shù)對(duì)過(guò)去的信息進(jìn)行篩選后匯入至“傳送帶”繼續(xù)進(jìn)行信息的傳遞。從左至右各單元及涉及的公式如下:
1) ?f t 是遺忘門(mén),用于決定 t -1時(shí)刻的信息量 h t-1 有多少能流入到 t 時(shí)刻狀態(tài) C t ,公式為
f t=σ W f · ?h t-1,x t +b f ?。 ?(1)
式中: σ= 1 1+e-x ?; W ?f是權(quán)重矩陣,其維度由輸入和隱藏層的維度決定; b ?f是偏置項(xiàng)。
2) ?i t 是輸入門(mén),用于決定 t 時(shí)刻的輸入量 x t 有多少能保留至 C t ,公式為
i t=σ W i · ?h t-1,x t +b i ?。 ?(2)
3) ???t 是候選記憶細(xì)胞單元,輸入量經(jīng)過(guò)tanh函數(shù)生成了一個(gè)候選值向量,公式為
t= tanh ?W C· h t-1,x t +b C ?。 ?(3)
4) ?C t 是記憶細(xì)胞單元, t 時(shí)刻的短時(shí)記憶 ??t 和歷史時(shí)刻的長(zhǎng)記憶 C t-1 會(huì)被共同加入到這個(gè)狀態(tài)中,遺忘門(mén)的存在可以使長(zhǎng)久前的記憶得以保留,輸入門(mén)的存在使得 t 時(shí)刻關(guān)鍵的信息被讀取,這就是LSTM隱藏層結(jié)構(gòu)的關(guān)鍵所在,其公式為
C t=f t · C t-1+i t · ??t 。 ?(4)
5) ?o t 是輸出門(mén),用于決定 t 時(shí)刻的記憶細(xì)胞單元 C t 的信息有多少能輸出到此刻的隱藏層輸出 h t ,其公式為
o t=σ W o · ?h t-1,x t +b o ?。 ?(5)
6) LSTM隱藏層最終輸出 h t ,公式為
h t=o t · ?tanh ?C t ?。 ?(6)
2.3 ?建立 LSTM ?模型
2.3.1 ?數(shù)據(jù)預(yù)處理與預(yù)選變量的選取
測(cè)量設(shè)備長(zhǎng)時(shí)間使用會(huì)造成短暫異?;蚴ъ`,因而產(chǎn)生較大測(cè)量誤差,為了不讓這些異常值對(duì)模型預(yù)測(cè)結(jié)果造成影響,務(wù)必對(duì)其進(jìn)行剔除。
在工程上使用3 σ 準(zhǔn)則處置:設(shè)一組數(shù)據(jù)為 X 1, X 2,X 3,…X n ,平均值為 ??,與均值的差為 d i= X i- (i=1,2,…n) ,即有下式:
σ= ?∑ n i=1 d2 i n-1 ??。 ?(7)
若某數(shù)據(jù)與均值的差滿(mǎn)足 ?d i >3σ ,就認(rèn)為此為粗大值,須予以剔除。
此外,各輸入?yún)?shù)間量級(jí)差別過(guò)大及量綱的差異性減緩了模型迭代處理的速度,故還需要對(duì)輸入量進(jìn)行歸一化處理,使所有的值落在[0,1]區(qū)間。
X??i= X i-X ?min ?X ?max -X ?min ??。 ?(8)
式中: X??i 是歸一化后的值。在最后輸出預(yù)測(cè)值之前還需要返回原量綱的值,即反歸一化:
X i=X??i X ?max -X ?min ?+X ?min ?。 ?(9)
本次采集數(shù)據(jù)共選擇了8個(gè)對(duì)NO ?x 生成具有潛在影響的預(yù)選變量,但對(duì)于神經(jīng)網(wǎng)絡(luò)而言,輸入的參數(shù)種類(lèi)過(guò)多會(huì)造成維度太大,影響處理速度,反之則會(huì)影響模型預(yù)測(cè)精度。為了平衡其中的利弊,實(shí)踐中一般選擇5個(gè)左右更具典型性的預(yù)選變量作為輸入。在統(tǒng)計(jì)學(xué)中,相關(guān)系數(shù)是衡量?jī)煞N變量間相關(guān)性程度的指標(biāo),其取值范圍是[-1,1],絕對(duì)值越大時(shí)相關(guān)性程度越高,常見(jiàn)的有Pearson系數(shù)和Spearson系數(shù)。Pearson系數(shù)對(duì)數(shù)據(jù)集本身要求較高,且強(qiáng)調(diào)的是兩個(gè)數(shù)據(jù)集間線性相關(guān)的程度,而此次分析中關(guān)注的是NO ?x 與其他預(yù)選變量間的單調(diào)關(guān)系,而非嚴(yán)格的線性關(guān)系,因此均采用Sperson系數(shù)進(jìn)行分析,得到了如圖3所示的相關(guān)性熱圖。
以圖3中的關(guān)聯(lián)度排序作為依據(jù),選取增壓壓力、進(jìn)氣流量、廢氣溫度、循環(huán)噴油量和軌壓作為輸入。盡管轉(zhuǎn)速的關(guān)聯(lián)度排名從理論上得出的結(jié)論是靠后的,但是該指標(biāo)反映柴油機(jī)在任一時(shí)刻的運(yùn)轉(zhuǎn)情況,是無(wú)法替代的重要參數(shù),因此也需將其作為輸入,至此共有6個(gè)預(yù)選變量被選取作為模型輸入?yún)?shù)。
2.3.2 ?訓(xùn)練集與測(cè)試集的劃分
訓(xùn)練集選取的原則是選擇的范圍盡可能涵蓋柴油機(jī)運(yùn)行的典型工況,以復(fù)現(xiàn)出任何瞬態(tài),使網(wǎng)絡(luò)具有更佳的泛化能力。WHTC循環(huán)測(cè)試是聯(lián)合國(guó)歐洲經(jīng)委會(huì)GRPE小組制定的全球技術(shù)法規(guī)第4號(hào)定義的瞬態(tài)發(fā)動(dòng)機(jī)測(cè)功表,涵蓋了全球統(tǒng)一的重型認(rèn)證發(fā)動(dòng)機(jī)尾氣排放程序,再現(xiàn)了歐盟、美國(guó)和日本等國(guó)家和地區(qū)具有代表性的駕駛工況。因此選用采集的WHTC循環(huán)的18 492個(gè)瞬態(tài)工況點(diǎn)對(duì)應(yīng)的6個(gè)預(yù)選變量,將前150 s符合粗大誤差的異常工況點(diǎn)剔除后,剩余的工況點(diǎn)按照70%、30%劃分為訓(xùn)練集和測(cè)試集(見(jiàn)圖4)。訓(xùn)練方法采用自適應(yīng)時(shí)刻估計(jì)(adam)學(xué)習(xí)算法。
2.3.3 ?基于網(wǎng)格搜索式的參數(shù)確定
在LSTM網(wǎng)絡(luò)中,參數(shù)可分為模型參數(shù)和超參數(shù)兩種:前者是在模型訓(xùn)練時(shí)隨著梯度下降法自動(dòng)更正的參數(shù),包括隱藏層各個(gè)門(mén)的權(quán)重矩陣及偏倚系數(shù)等;后者指的是訓(xùn)練前就已經(jīng)被設(shè)置為某一固定值的參數(shù),包括LSTM層數(shù)、每層神經(jīng)元數(shù)量、最大迭代次數(shù)和初始學(xué)習(xí)率等。超參數(shù)是模型訓(xùn)練過(guò)程的依據(jù),因此對(duì)其進(jìn)行最優(yōu)化的選取,可顯著提高模型學(xué)習(xí)的效果,以獲得更佳的預(yù)測(cè)能力。
網(wǎng)格搜索法是確定超參數(shù)的手段之一,通常是每種超參數(shù)均在合理數(shù)值范圍內(nèi)且按照一定間隔進(jìn)行選取,并進(jìn)行若干次訓(xùn)練,從而盡可能遍歷多種超參數(shù)組合,本質(zhì)上是一種窮舉法[14]。最后用評(píng)價(jià)指標(biāo)評(píng)價(jià),進(jìn)而選擇最優(yōu)項(xiàng)。常用的評(píng)價(jià)指標(biāo)有:均方根誤差RMSE、平均絕對(duì)誤差MAE、決定系數(shù) R 2,具體公式如式(10)~式(12)所示。
RMSE= ?1 ?n ∑ n i=1 ?y i-y ~ ?i 2 ?, ?(10)
MAE= 1 ?n ∑ n i=1 ?y i-y ~ ?i ?, ?(11)
R2=1- ∑ n i=1 ?y i-y ~ ?i 2 ∑ n i=1 ?y i-y i ?2 ?。 ?(12)
式中: y i 是實(shí)際值; ?y ~ ?i 是預(yù)測(cè)值; n 是工況點(diǎn)數(shù)目。
第一步確定LSTM層數(shù),當(dāng)按經(jīng)驗(yàn)指定其余超參數(shù)并保持其不變的情況下,從第1層開(kāi)始進(jìn)行訓(xùn)練并在測(cè)試集上進(jìn)行預(yù)測(cè)。重復(fù)若干次并記錄每次預(yù)測(cè)評(píng)價(jià)指標(biāo),取平均值后繼續(xù)逐一增加層數(shù),重復(fù)此步驟。一共進(jìn)行了4層的訓(xùn)練,得到的評(píng)價(jià)指標(biāo)如表2所示。
由表中數(shù)據(jù)可知,當(dāng)層數(shù)為2時(shí)RMSE和MAE值最低, R 2最接近1,且總耗時(shí)適中,因此LSTM層數(shù)設(shè)定為2。對(duì)于其余的超參數(shù),在合理數(shù)值范圍內(nèi)進(jìn)行多層網(wǎng)格搜索:每層神經(jīng)元數(shù)量從[20,50]按10的步長(zhǎng)搜索;初始學(xué)習(xí)率從[0.002,0.005]按0.001的步長(zhǎng)搜索;最大迭代次數(shù)從[150,300]按50的步長(zhǎng)搜索。由此遍歷了64次搜索后,最終確定當(dāng)每層神經(jīng)元數(shù)量均為40,初始學(xué)習(xí)率為0.004及最大迭代次數(shù)為250時(shí)評(píng)價(jià)指標(biāo)最佳。整個(gè)網(wǎng)絡(luò)的建立過(guò)程如圖5所示。
按照上述方式選取的超參數(shù)組合訓(xùn)練完畢后,模型應(yīng)用在測(cè)試集的預(yù)測(cè)效果和殘差統(tǒng)計(jì)分布區(qū)間如圖6和圖7所示。由圖6和圖7可見(jiàn),模型初步具備了預(yù)測(cè)總體趨勢(shì)的能力。僅66%的工況點(diǎn)落在[-50,50]的殘差區(qū)間,且在尖端點(diǎn)上誤差仍然較大,這也是仍有8%的工況點(diǎn)落在[-100,100]區(qū)間外的主要原因。若將訓(xùn)練完畢的網(wǎng)絡(luò)模型用于全新工況的預(yù)測(cè),結(jié)果將無(wú)法達(dá)到預(yù)期,這體現(xiàn)出網(wǎng)格搜索法的局限性。由于待選擇的超參數(shù)有4組,每組均有選取的范圍,且搜索步長(zhǎng)有一定的間隔,所以極有可能無(wú)法捕捉到全局最優(yōu)組合,得到的只是局部最優(yōu)解。綜上,采用一種優(yōu)化算法——獵人獵物算法(HPO)優(yōu)化LSTM的超參數(shù),通過(guò)該算法搜尋目標(biāo)范圍內(nèi)最優(yōu)的超參數(shù)組合,使模型得到令人滿(mǎn)意的預(yù)測(cè)精度。
2.3.4 ?基于獵人獵物優(yōu)化算法的超參數(shù)確定
獵人獵物優(yōu)化算法(HPO)是Naruei[15]等在2021年提出的基于種群優(yōu)化算法,靈感來(lái)源于大自然一個(gè)群體中捕食者捕食獵物的行為。算法的實(shí)現(xiàn)步驟如下:
1) 將所有群體成員的初始位置隨機(jī)設(shè)為 ?x ?= x 1 ,x 2 ,…x n ??,同時(shí)各自的目標(biāo)函數(shù)設(shè)置為 ?O ?= O 1,O 2,…O n ?;其中每個(gè)成員的位置 x i 與適應(yīng)度 O i 由式(13)和式(14)確定:
x i= rand ?p,d ??ub-lb +lb , ?(13)
O i=f x → ??。 ?(14)
式中: p 是種群個(gè)數(shù); d 是需優(yōu)化的超參數(shù)個(gè)數(shù); ub 和 lb 分別是各超參數(shù)的上下界; f(x → ) 在該算法中是一個(gè)求解模型中訓(xùn)練集RMSE的函數(shù),它是整個(gè)算法運(yùn)行的依據(jù),顯然最終的目標(biāo)是求解適應(yīng)度函數(shù)的最小值,并在最大迭代次數(shù)后輸出。實(shí)踐中無(wú)法通過(guò)一次迭代獲取超參數(shù)的最優(yōu)組合,因此定義了由探索和開(kāi)發(fā)兩個(gè)步驟組成的多次搜索機(jī)制:探索強(qiáng)調(diào)的是算法隨機(jī)搜索的行為,確保了算法不會(huì)陷入局部最優(yōu)解;開(kāi)發(fā)是在探索到目標(biāo)區(qū)域時(shí)停止對(duì)全局的隨機(jī)搜索,進(jìn)一步對(duì)該區(qū)域深度挖掘。
2) 針對(duì)獵人的更新機(jī)制,該算法提出式(15):
x i,j t+1 =x i,j t +0.5[ 2CZP ?pos( j)-x i,j t ?+ 2 1-C Zμ (j)-x i,j t ?] 。 ?(15)
式中: x i,j(t+1) 和 x i,j(t) 分別是獵人下一次迭代位置和當(dāng)前位置; P ?pos ?(j) 是獵物位置; μ (j) 是種群所有成員位置的平均值; Z 是由式(16)決定的適應(yīng)性參數(shù)。
P=r 1 <C; IDX = P= =0 ?;
Z=r 2 IDX +r 3~ IDX ??。 ?(16)
式中: r 1 ?和 r 3 ?是[0,1]內(nèi)的隨機(jī)向量; r ?2是[0,1]內(nèi)的隨機(jī)數(shù); P 和IDX是滿(mǎn)足等式條件的索引值; C 是決定了探索或開(kāi)發(fā)兩者占比的平衡參數(shù),由式(17)計(jì)算得到。
C=1-i ?0.98 I ?Max ??。 ?(17)
式中: i 是此時(shí)迭代次數(shù); I ?Max是最大迭代次數(shù)。從開(kāi)始至迭代完全結(jié)束 C 的值將從1減少到0.02,這意味著算法由探索至開(kāi)發(fā)的逐漸轉(zhuǎn)變。
3) 為了求出獵物的位置 P ?pos,先根據(jù)式(18)計(jì)算所有成員位置的平均值 μ ,
μ= ∑ n i=1 x i ?n ?; ?(18)
再根據(jù)式(19)計(jì)算獵物群體的 n 維歐氏距離,
D i = ∑ n j=1 ?x i,j-μ j 2 ?; ?(19)
最后根據(jù)上文提及的獵人捕食的思維,選擇距離群體最遠(yuǎn)的個(gè)體作為目標(biāo)獵物,因此有
P ?pos ?=x i 。 ?(20)
式中: i 是 D(i) ?max對(duì)應(yīng)的指標(biāo)。為了縮短算法收斂時(shí)間,根據(jù)實(shí)際狩獵場(chǎng)景提出了衰減機(jī)制:
k ?best=ceil ?C×p ?。 ?(21)
式中: p 是種群個(gè)數(shù); k ?best在開(kāi)始時(shí)為 p ,結(jié)束時(shí)為1,為此改用式(22)得到獵物位置。
P ?pos ?=x j 。 ?(22)
式中: j 是 D(k ?best) max中括號(hào)內(nèi)對(duì)應(yīng)的指標(biāo)。
4) 如前所述,目標(biāo)獵物意識(shí)到被獵人鎖定后會(huì)盡力逃脫至安全位置,提出式(23)更新獵物位置。
x i,j t+1 =T ?pos( j)+CZ cos 2π r 4 × T ?pos( j)-x i,j t ??。 ?(23)
式中: x i,j(t+1) 和 x i,j(t) 分別是獵物下一次迭代位置和當(dāng)前位置; ?T ?pos ?(j) 是安全位置; r ?4是[0,1]內(nèi)的隨機(jī)數(shù)。
5) 至此,獵人和獵物的初始位置及更新機(jī)制已給出,最后一步是給出一個(gè)判斷依據(jù),使算法選擇走獵人或是獵物的路線。因此,引入一個(gè)取值在[0,1]內(nèi)的隨機(jī)數(shù) r ?5和一個(gè)設(shè)值為0.1的選擇參數(shù) β 。當(dāng) r ?5< β 時(shí),算法走獵人的路線,即由式(15)更新位置;反之算法走獵物路線,即由式(23)更新位置。
結(jié)合目前的數(shù)據(jù)規(guī)模,為避免程序運(yùn)行時(shí)間過(guò)長(zhǎng),設(shè)定該算法的種群數(shù)量為20,最大迭代次數(shù)為40;對(duì)于待優(yōu)化的各超參數(shù)上下限,每層神經(jīng)元數(shù)量是[10,200],初始學(xué)習(xí)率是[0.001,0.200],最大迭代次數(shù)是[100,300]。優(yōu)化的流程如圖8所示。
當(dāng)優(yōu)化程序運(yùn)行完畢后,可以得到如圖9所示的進(jìn)化曲線。圖9表明當(dāng)?shù)M(jìn)行至15次時(shí)適應(yīng)度衰減至最低點(diǎn)并達(dá)到穩(wěn)定,此時(shí)對(duì)應(yīng)的超參數(shù)如下:第一、二隱藏層神經(jīng)元數(shù)目為100和30,初始學(xué)習(xí)率是0.015,最大迭代次數(shù)是255。隨后將上述訓(xùn)練完畢的網(wǎng)絡(luò)模型應(yīng)用至測(cè)試集中,所得到的在測(cè)試集上的預(yù)測(cè)效果和殘差分布見(jiàn)圖10和圖11。
從測(cè)試集的預(yù)測(cè)結(jié)果直觀看出,當(dāng)采用HPO優(yōu)化得出超參數(shù)組合,模型對(duì)數(shù)據(jù)的擬合效果有顯著提升,尖端點(diǎn)的預(yù)測(cè)效果得到明顯改善。從評(píng)價(jià)指標(biāo)來(lái)看, R 2由原來(lái)的0.927 8提高到0.963 5,RMSE由原來(lái)的65.439 8優(yōu)化到46.347 9,優(yōu)化了29.12%,這表示模型對(duì)于輸入數(shù)據(jù)的理解和學(xué)習(xí)能力更強(qiáng),可更好擬合真實(shí)情況。而從直方圖得知,落在[-50,50]殘差區(qū)間的工況點(diǎn)從66.2%提升至了85.5%,左右兩端的長(zhǎng)尾現(xiàn)象有所緩和,離群值數(shù)量已然降低。結(jié)果表明:HPO算法的優(yōu)勢(shì)在于由各超參數(shù)的上下限決定的探索空間內(nèi),獵人或獵物可以在該范圍進(jìn)行隨機(jī)性移動(dòng)和選擇,并且衰減機(jī)制的存在保證了算法必定會(huì)收斂,每一次迭代的超參數(shù)組合會(huì)被保留,并從中選擇適應(yīng)度最小的作為全局最優(yōu)解輸出。
3 ??結(jié)果對(duì)比與評(píng)估
為了進(jìn)一步驗(yàn)證模型的泛化能力,在測(cè)試集的基礎(chǔ)上引入另一種全新的工況,即ETC工況,以此測(cè)試如前所述的兩種訓(xùn)練完畢的模型應(yīng)對(duì)未知工況的預(yù)測(cè)精度。與此同時(shí),建立一個(gè)相同網(wǎng)絡(luò)架構(gòu)的BP模型與現(xiàn)有模型進(jìn)行橫向?qū)Ρ?,將其層?shù)、每層隱藏層的神經(jīng)元數(shù)目、最大迭代次數(shù)和初始學(xué)習(xí)率等設(shè)置成與優(yōu)化后的LSTM模型一致;再建立一個(gè)NARX模型,將其輸入和輸出延遲步數(shù)設(shè)定為1,隱藏層結(jié)構(gòu)也與優(yōu)化后的LSTM模型一致,兩者的訓(xùn)練集均為圖4中WHTC工況選定的部分。4種模型的預(yù)測(cè)結(jié)果、殘差絕對(duì)值構(gòu)成的散點(diǎn)圖以及評(píng)價(jià)指標(biāo)如圖12和表3所示。
由預(yù)測(cè)圖和評(píng)價(jià)指標(biāo)得知,BP模型和NARX模型在面對(duì)長(zhǎng)時(shí)間序列問(wèn)題時(shí)預(yù)測(cè)情況較不理想,大于400的殘差值占有相當(dāng)?shù)谋壤?。這是由于這兩種模型缺乏門(mén)控機(jī)制和記憶單元導(dǎo)致無(wú)法捕捉和存儲(chǔ)長(zhǎng)期依賴(lài)關(guān)系,以及在反向傳播算法訓(xùn)練時(shí)可能遇到了梯度消失或爆炸的問(wèn)題,這些因素都將導(dǎo)致預(yù)測(cè)精度的降低。對(duì)于未知工況,LSTM網(wǎng)絡(luò)的泛化能力得到了有力證明,預(yù)測(cè)精度的下降在合理范圍內(nèi),尤其是優(yōu)化后的LSTM網(wǎng)絡(luò)其RMSE比未優(yōu)化的提高了23.4%, R 2接近于0.95,殘差的絕對(duì)值普遍在200以?xún)?nèi)且離群值的比例占比很低,預(yù)測(cè)值與傳感器實(shí)測(cè)值的軌跡相當(dāng)近似。
4 ??結(jié)束語(yǔ)
柴油機(jī)NO ?x 排放是典型的連續(xù)型數(shù)值變量,因此提出了應(yīng)用于時(shí)序預(yù)測(cè)的LSTM網(wǎng)絡(luò)模型。將各預(yù)選變量對(duì)NO ?x 產(chǎn)生及變化的相關(guān)程度排序,選取了廢氣溫度、增壓壓力、進(jìn)氣流量、軌壓、循環(huán)噴油量和轉(zhuǎn)速作為輸入變量。采用了網(wǎng)格搜索法對(duì)LSTM網(wǎng)絡(luò)的各超參數(shù)進(jìn)行選取,并對(duì)WHTC工況剔除異常值的工況點(diǎn)進(jìn)行訓(xùn)練和測(cè)試,初步驗(yàn)證了模型的預(yù)測(cè)能力,結(jié)果表明在測(cè)試集上取得了較為一般的預(yù)測(cè)精度。
為了進(jìn)一步提高模型的預(yù)測(cè)準(zhǔn)確性,避免陷入局部最優(yōu)解,提出了HPO算法對(duì)LSTM超參數(shù)組合進(jìn)行更為合理的選擇。將使用HPO優(yōu)化得到的組合模型再次應(yīng)用于WHTC工況的測(cè)試集進(jìn)行驗(yàn)證,結(jié)果表明此次的模型預(yù)測(cè)精度取得了進(jìn)一步的改善, R 2由原來(lái)的0.927 8提高到0.963 5,RMSE也優(yōu)化了29.1%。
最后引進(jìn)ETC工況,將6個(gè)變量分別作為BP模型、NARX模型、網(wǎng)格搜索得到的LSTM模型和經(jīng)HPO優(yōu)化后的HPO-LSTM模型的輸入。經(jīng)對(duì)比得出BP模型和NARX模型預(yù)測(cè)效果有限,而HPO-LSTM模型在該工況下仍保持良好的預(yù)測(cè)精度,與未優(yōu)化的LSTM模型相比, R 2由原來(lái)的0.908 3提高到0.949 5,RMSE優(yōu)化了23.4%,具備預(yù)測(cè)未知瞬態(tài)工況下NO ?x 排放的能力。
參考文獻(xiàn):
[1] ?Jung Dohoy,Assanis Dennis.Quasidimensional Modeling of Direct Injection Diesel Engine Nitric Oxide,Soot,and Unburned Hydrocarbon Emissions[J].ASME J. Eng. Gas Turbines and Power,2006,128(2):388-396.
[2] Ericson C,Westerberg B,Andersson M,et al.Modelling diesel engine combustion and NO ?x ?formation for model based control and simulation of engine and exhaust aftertreatment systems[C].SAE Paper 2006-01-0687.
[3] Arrègle Jean,López J,Guardiola Carlos,et al.Sensitivity Study of a NO ?x ?Estimation Model for On-Board Applications[C].SAE Paper 2008-01-0640.
[4] Winkler-Ebner B,Hirsch M,Del Re L,et al.Comparison of virtual and physical NO ?x -sensors for heavy duty diesel engine application[J].SAE International Journal of Engines,2010,3(1):1124-1139.
[5] 周斌,譚達(dá)明,魏道遠(yuǎn),等.基于神經(jīng)網(wǎng)絡(luò)的內(nèi)燃機(jī)排放預(yù)測(cè)方法的研究[J].內(nèi)燃機(jī)學(xué)報(bào),2001,19(4):361-364.
[6] Perhinschi M G,Wayne W S,Clark N,et al.Neural Network Modeling of Emissions from Medium-Duty Vehicles Operating on Fisher-Tropsch Synthetic Fuel[C].SAE Paper 2007-01-1080.
[7] 胡杰,林峰,王天田,等.基于神經(jīng)網(wǎng)絡(luò)最小偏二乘法的柴油機(jī)NO ?x 排放預(yù)測(cè)模型[J].內(nèi)燃機(jī)學(xué)報(bào),2015,33 (6):510-515.
[8] 鄒浪,何超,李加強(qiáng),等.基于機(jī)器學(xué)習(xí)的柴油機(jī)顆粒物濃度預(yù)測(cè)[J].車(chē)用發(fā)動(dòng)機(jī),2020(2):84-92.
[9] Atkinson C M,Long T W,Hanzevack E L.Virtual sensing: a neural network-based intelligent performance and emissions prediction system for on-board diagnostics and engine control[J].Progress in Technology,1998,73(301-314):2-4.
[10] ?Wang Y Y,He Y,Rajagopalan S.Design of Engine-Out Virtual NO ?x ?Sensor Using Neural Networks and Dynamic System Identification[J].SAE International Journal of Engines,2011,4(1):828-836.
[11] Alcan G,Unel M,Aran V,et al.Predicting NO ?x ?emissions in diesel engines via sigmoid NARX models using a new experiment design for combustion identification[J].Measurement,2019,137:71-81.
[12] Tang D,Xu Y C,Yao S D,et al.Prediction of emission performance in a diesel engine fuelled with bio-diesel based on double-hidden layer BP neural network[J].Applied Mechanics and Materials,2013,278:370-373.
[13] 梁宏濤,劉碩,杜軍威,等.深度學(xué)習(xí)應(yīng)用于時(shí)序預(yù)測(cè)研究綜述[J/OL].計(jì)算機(jī)科學(xué)與探索:1-21.[2023-05-27].http://kns.cnki.net/kcms/detail/11.5602.TP.20230310.0857.002.html.
[14] 王鑫,吳際,劉超,等.基于LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的故障時(shí)間序列預(yù)測(cè)[J].北京航空航天大學(xué)學(xué)報(bào),2018,44(4):772-784.
[15] Naruei I,Keynia F,Sabbagh Molahosseini A.Hunter-prey optimization: Algorithm and applications[J].Soft Computing,2022,26(3):1279-1314.
NO ?x ?Virtual Prediction Technology of Diesel Engine Based on HPO-LSTM
PAN Hengbin1,GUAN Wei1,PAN Mingzhang1,LIANG Ke1,WEN Tao1,JIANG Shujun2
(1.School of Mechanical Engineering,Guangxi University,Nanning 530004,China;2.Wuxi Institute of Technology,Wuxi 214121,China)
Abstract: ?In the face of strict emission regulations, the diesel engine post-treatment system plays an immeasurable role, and the acquisition of NO ?x ?emissions is one of the prerequisites for the normal operation of SCR device in the post-treatment system. A virtual prediction model that used hunter-prey optimization (HPO) algorithm to optimize long short term memory(LSTM) network was established to accurately predict NO ?x ?emissions of diesel engine in place of existing physical sensors or as a parallel device to monitor their operation. The test was carried out on a dynamometer of diesel engine. During the highly transient operation cycle of ?diesel engine, several parameters that were easy to obtain and closely related to NO ?x ?formation were input into the model. The results show that, compared with the prediction results of non-optimized network, RMSE increases by 29.1% and 23.4%, and ?R 2 is greater than and close to 0.95 respectively when the optimized network is applied to the test set or to a new unknown transient condition. The prediction results show a highly identical trend with the measured values of sensor, which meets the requirements of on-board application and accuracy and hence verifies the feasibility of this method.
Key ?words: ?diesel engine;NO ?x ;prediction;hunter-prey optimization algorithm;long short term memory network
[編輯: 潘麗麗]
收稿日期: ??2023-07-26; [HT6H]修回日期: ??2023-10-26
基金項(xiàng)目: ???國(guó)家自然科學(xué)基金面上項(xiàng)目(22172038);廣西重點(diǎn)研發(fā)計(jì)劃 (桂科AB21220059,桂科AB22080085)
作者簡(jiǎn)介: ???潘恒斌(1999—),男,碩士,主要研究方向?yàn)椴裼蜋C(jī)排放控制;601570994@qq.com。
通訊作者: ???姜淑君(1980—),女,高級(jí)工程師,碩士,主要研究方向?yàn)閮?nèi)燃機(jī)燃燒排放;956671743@qq.com。