周華劉昱 郭謹(jǐn)瑋沈姝
(1.吉林大學(xué),長(zhǎng)春 130022;2.中國(guó)汽車技術(shù)研究中心有限公司,天津 300300)
主題詞:差分進(jìn)化算法 相關(guān)向量機(jī) 油耗 預(yù)測(cè)
輕型汽車燃料消耗量公示制度規(guī)定,汽車生產(chǎn)企業(yè)和進(jìn)口汽車經(jīng)銷商應(yīng)保證其汽車產(chǎn)品在銷售時(shí)都粘貼有《汽車燃料消耗量標(biāo)識(shí)》。公告的油耗通過型式認(rèn)證試驗(yàn)獲得,而型式認(rèn)證的結(jié)果比用戶實(shí)際使用時(shí)的油耗低約34%[1],且不同車型間具有明顯差異。產(chǎn)生這種差異的原因主要有:我國(guó)乘用車燃油消耗量型式認(rèn)證試驗(yàn)采用新歐洲駕駛循環(huán)(New European Driving Cycle,NEDC),該循環(huán)在平均速度、怠速比例和加、減速特征方面與我國(guó)車輛的實(shí)際運(yùn)行特征存在明顯差異;測(cè)試程序的設(shè)置與實(shí)際不符。針對(duì)這一問題,工業(yè)和信息化部已委托中國(guó)汽車技術(shù)研究中心聯(lián)合行業(yè)力量共同開發(fā)能夠全面反映我國(guó)車輛實(shí)際運(yùn)行狀況的中國(guó)工況,并計(jì)劃將該工況與新的測(cè)試規(guī)程一起寫入油耗測(cè)試標(biāo)準(zhǔn)。但從工況的開發(fā)到油耗標(biāo)準(zhǔn)的實(shí)施需要較長(zhǎng)的時(shí)間周期,因此,開發(fā)一種車輛實(shí)際油耗預(yù)測(cè)方法非常必要。
Tolouei[2]、莊仲達(dá)[3]和蔡鳳田[4]等分別從不同角度分析了影響汽車油耗的主要因素,但均采用定性描述的方式。程曉娟[5]和周道良[6]等利用神經(jīng)網(wǎng)絡(luò)對(duì)汽車燃油消耗進(jìn)行了定量預(yù)測(cè),但神經(jīng)網(wǎng)絡(luò)存在著過學(xué)習(xí)、欠學(xué)習(xí)和隱含層網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)量難以確定等問題。
本文總結(jié)了車輛實(shí)際運(yùn)行特征和設(shè)計(jì)參數(shù)中對(duì)車輛油耗有影響的特征參數(shù),并利用互信息方法確定了油耗敏感特征。以敏感特征和公告油耗為輸入?yún)?shù),車輛實(shí)際油耗為輸出參數(shù),建立了油耗預(yù)測(cè)模型。最后,利用該模型對(duì)車輛實(shí)際油耗進(jìn)行了預(yù)測(cè)。
車輛運(yùn)行實(shí)際特征和設(shè)計(jì)參數(shù)對(duì)車輛的油耗有重要影響。運(yùn)行特征參數(shù)包括平均速度和怠速比例;設(shè)計(jì)參數(shù)包括車身參數(shù)、發(fā)動(dòng)機(jī)參數(shù)和傳動(dòng)系統(tǒng)特征參數(shù)等[5]。表1統(tǒng)計(jì)了車輛運(yùn)行實(shí)際特征和設(shè)計(jì)參數(shù),并給出了量化結(jié)果。
表1 車輛實(shí)際運(yùn)行特征和設(shè)計(jì)參數(shù)量化結(jié)果
互信息[7]屬于非線性度量標(biāo)準(zhǔn),并且無(wú)需預(yù)先知道樣本數(shù)據(jù)的分布。因此它在特征選擇、相關(guān)性分析等領(lǐng)域得到廣泛關(guān)注。離散變量X和Y的互信息MI(X;Y)定義為:
式中,H(X)、H(Y)分別為變量X、Y的信息熵;H(X|Y)為變量X關(guān)于Y的條件熵;H(X,Y)為變量X和Y的聯(lián)合熵。
本文以300輛輕型車作為研究樣本,采用互信息方法計(jì)算表1中各參數(shù)與車輛油耗的相關(guān)程度,進(jìn)而確定車輛油耗的敏感特征參數(shù)。各參數(shù)與車輛油耗的相關(guān)性(互信息MI)計(jì)算結(jié)果如表2所示,其中MIi為第i個(gè)特征與車輛油耗的互信息。
由表2可知,平均速度、發(fā)動(dòng)機(jī)排量、整車質(zhì)量、發(fā)動(dòng)機(jī)最大功率和變速箱類型是影響車輛油耗的關(guān)鍵因素;車身結(jié)構(gòu)、怠速比例和發(fā)動(dòng)機(jī)氣缸排列形式也會(huì)對(duì)油耗產(chǎn)生較大影響;發(fā)動(dòng)機(jī)氣缸數(shù)目、升功率和進(jìn)氣方式對(duì)油耗的影響較小。因此,建立油耗預(yù)測(cè)模型時(shí)可以根據(jù)各參數(shù)對(duì)油耗的敏感程度確定是否將其用于模型構(gòu)建。
表2 各特征與實(shí)際油耗的相關(guān)性分析
已知訓(xùn)練樣本集{xn,tn},其中xn為輸入變量,tn為類別標(biāo)號(hào),n=1,2,…,N為樣本標(biāo)簽。相關(guān)向量機(jī)(Rele?vance Vector Machine,RVM)的決策函數(shù)可以定義為[8]:
式中,K(x,xn)為核函數(shù);w=(w1,w2,…,wN)T為權(quán)重向量;w0為偏置。
RVM核函數(shù)選擇徑向積核函數(shù):
式中,σ為函數(shù)的寬度參數(shù)。
假設(shè)預(yù)測(cè)概率模型P(t|x)服從伯努利分布,并將logistic sigmoid連接函數(shù)應(yīng)用于預(yù)測(cè)函數(shù)y(x),最終似然函數(shù)為:
式中,t=(t1,t2,…,tN)T為目標(biāo)值向量;α=(α1,α2,…,αN)為超參數(shù)向量。
定義權(quán)值wn的高斯先驗(yàn)概率分布為:
Tipping等提出了一種基于拉普拉斯方法的逼近方法,具體過程見文獻(xiàn)[9]。隨著迭代的進(jìn)行,許多超參數(shù)趨近于無(wú)窮大,找出與之對(duì)應(yīng)的模型的權(quán)值并刪除,最終可以獲得模型的稀疏解,剩余的權(quán)重不為零的樣本即為相關(guān)向量。
核函數(shù)參數(shù)是影響相關(guān)向量機(jī)性能的關(guān)鍵參數(shù),如何對(duì)它們的取值進(jìn)行優(yōu)化是近年來(lái)非線性預(yù)測(cè)領(lǐng)域研究的熱點(diǎn)。典型的優(yōu)化方法包括遺傳算法、粒子群算法和差分進(jìn)化(Differential Evolution,DE)算法等。遺傳算法采用二進(jìn)制編碼,計(jì)算量較大。粒子群算法簡(jiǎn)單,可調(diào)參數(shù)少,但易陷入局部最優(yōu)解。DE算法計(jì)算復(fù)雜度較低,同時(shí)可以通過設(shè)置相對(duì)可靠的變異策略提高算法的全局搜索能力,因此近年來(lái)得到了較多的應(yīng)用,差分進(jìn)化算法包括以下步驟[10-11]:
a.初始化種群
對(duì)于D維空間的優(yōu)化問題,算法首先在問題的可行解空間隨機(jī)初始化得到包含NP個(gè)個(gè)體的種群。種群中的第i個(gè)個(gè)體xi可以表示為xi=(xi1,xi2,…,xiD),其中i=1,2,…,NP。
b.變異操作
差分進(jìn)化算法通過變異操作產(chǎn)生新的個(gè)體。變異算子vi的生成方式為:
式中,下標(biāo)m、q和k為[1,NP]范圍內(nèi)互不相等的隨機(jī)數(shù),每個(gè)變異算子均隨機(jī)生成1次;F為縮放比例因子,用于控制差分向量的影響程度。
c.交叉操作
對(duì)變異算子vi和相應(yīng)的目標(biāo)個(gè)體xi進(jìn)行交叉操作,得到ui=(ui1,ui2,…,uiD)。
式中,rb∈[0,1]為隨機(jī)數(shù);CR為交叉概率,用于控制從變異算子抽取元素的比例;rr∈[1,D]為隨機(jī)整數(shù),用于確保試驗(yàn)個(gè)體ui與目標(biāo)個(gè)體xi保持一定的差異。
如果交叉、變異操作后試驗(yàn)個(gè)體的取值超出了規(guī)定范圍,則初始化種群重新隨機(jī)生成該個(gè)體。
隨后,計(jì)算所有試驗(yàn)個(gè)體的適應(yīng)度。設(shè)試驗(yàn)個(gè)體和相應(yīng)目標(biāo)個(gè)體ui的適應(yīng)度分別為f(ui)和f(xi),如f(ui)≤f(xi),在下一代循環(huán)中,利用ui代替xi作為新種群個(gè)體,否則保留xi作為新種群個(gè)體。
重復(fù)以上變異、交叉和選擇操作直到滿足終止條件。
試驗(yàn)采用自主駕駛法采集了300輛輕型車的運(yùn)行數(shù)據(jù),采集時(shí)間為2016年5月1日至2017年1月31日,累計(jì)行駛里程為1 500 000 km。試驗(yàn)系統(tǒng)由車載數(shù)據(jù)采集終端(采樣頻率為1 Hz)和數(shù)據(jù)管理平臺(tái)組成。車載數(shù)據(jù)采集終端將采集信息按照統(tǒng)一的數(shù)據(jù)協(xié)議編碼,并通過GPRS網(wǎng)絡(luò)實(shí)時(shí)發(fā)送到工況數(shù)據(jù)管理平臺(tái),其數(shù)據(jù)來(lái)源包括GPS信號(hào)和車載診斷系統(tǒng)(OBD)信號(hào),采集流程如圖1所示。用于油耗預(yù)測(cè)的參數(shù)包括GPS速度、發(fā)動(dòng)機(jī)轉(zhuǎn)速、油耗等。其中,油耗通過進(jìn)氣質(zhì)量流量和空燃比計(jì)算得到:
圖1 數(shù)據(jù)采集示意
采集的部分?jǐn)?shù)據(jù)及車輛運(yùn)行特征和設(shè)計(jì)參數(shù)的統(tǒng)計(jì)結(jié)果如表3所示。
表3 部分采集數(shù)據(jù)和車輛特征參數(shù)
為了建立油耗敏感特征與實(shí)際油耗間的映射關(guān)系,本節(jié)將非線性預(yù)測(cè)方法RVM引用到車輛油耗預(yù)測(cè)模型中,具體如圖2所示。
圖2 基于DE-RVM的車輛油耗預(yù)測(cè)模型構(gòu)建和預(yù)測(cè)流程
從300輛輕型車的試驗(yàn)數(shù)據(jù)中隨機(jī)選擇200組數(shù)據(jù)用于構(gòu)建DE-RVM預(yù)測(cè)模型,剩余的100組數(shù)據(jù)用于對(duì)訓(xùn)練好的模型進(jìn)行測(cè)試。模型的輸入?yún)?shù)包括平均速度、發(fā)動(dòng)機(jī)排量、整車質(zhì)量、發(fā)動(dòng)機(jī)最大功率、變速箱類型、車身結(jié)構(gòu)、怠速比例、發(fā)動(dòng)機(jī)氣缸排列形式和型式認(rèn)證油耗;輸出參數(shù)為車輛的實(shí)際油耗。設(shè)DE算法種群個(gè)體數(shù)目為10,縮放因子F=0.5,交叉概率CR=0.3,進(jìn)化代數(shù)為100,適應(yīng)度函數(shù)選擇預(yù)測(cè)平均誤差率[10]。通過DE算法迭代尋優(yōu)最終確定最優(yōu)核函數(shù)參數(shù)σ=1.7。DE-RVM算法的適應(yīng)度如圖3所示。
圖3 DE-RVM平均適應(yīng)度
利用訓(xùn)練好的DE-RVM模型,對(duì)剩余的100組數(shù)據(jù)進(jìn)行測(cè)試,并將測(cè)試結(jié)果與實(shí)際油耗進(jìn)行比較,部分結(jié)果如圖4所示。此外,為了說明本文方法的有效性,采用BP神經(jīng)網(wǎng)絡(luò)代替DE-RVM模型進(jìn)行油耗預(yù)測(cè),BP神經(jīng)網(wǎng)絡(luò)[12-13]輸入層節(jié)點(diǎn)數(shù)目為9,隱含層節(jié)點(diǎn)數(shù)目為10,輸出層節(jié)點(diǎn)數(shù)目為1,其訓(xùn)練樣本和預(yù)測(cè)樣本與DE-RVM相同,BP神經(jīng)網(wǎng)絡(luò)方法計(jì)算結(jié)果見圖4。
圖4 部分預(yù)測(cè)結(jié)果
由圖4可以看出,DE-RVM模型的預(yù)測(cè)精度明顯高于BP神經(jīng)網(wǎng)絡(luò)模型,進(jìn)一步計(jì)算可知,DE-RVM和BP神經(jīng)網(wǎng)絡(luò)算法的平均相對(duì)誤差分別為4.9%、9.2%。綜上可知,本文提出的基于DE-RVM的油耗預(yù)測(cè)方法優(yōu)于BP神經(jīng)網(wǎng)絡(luò),可以有效描述車輛運(yùn)行特征和設(shè)計(jì)參數(shù)與實(shí)際油耗特征的映射關(guān)系,適用于車輛油耗預(yù)測(cè)。
本文總結(jié)了車輛運(yùn)行和設(shè)計(jì)參數(shù)中與油耗直接相關(guān)的參數(shù),并利用互信息方法對(duì)敏感特征參數(shù)進(jìn)行了篩選,結(jié)果顯示:平均速度、發(fā)動(dòng)機(jī)排量、整車質(zhì)量、發(fā)動(dòng)機(jī)最大功率和變速箱類型是影響車輛油耗的關(guān)鍵因素;車身結(jié)構(gòu)、怠速比例和發(fā)動(dòng)機(jī)氣缸排列形式也會(huì)對(duì)油耗產(chǎn)生較大影響;氣缸數(shù)目、升功率和進(jìn)氣方式對(duì)油耗的影響較小。將非線性預(yù)測(cè)方法RVM引入車輛油耗的預(yù)測(cè)中,并利用DE算法對(duì)RVM核函數(shù)參數(shù)進(jìn)行了優(yōu)化。結(jié)果表明,本文提出的方法可以對(duì)車輛實(shí)際油耗進(jìn)行準(zhǔn)確預(yù)測(cè)。