司明玉,周金應(yīng),褚觀耀,龍軍,程前
(中國(guó)汽車工程研究院股份有限公司,重慶 401122)
自適應(yīng)巡航控制系統(tǒng)作為一種先進(jìn)的駕駛輔助系統(tǒng),可以實(shí)時(shí)控制自車與前車的距離,顯著提高了道路車輛的行駛安全性,受到了廣泛的關(guān)注。文獻(xiàn)[1-2]研究了自適應(yīng)巡航控制的經(jīng)濟(jì)性,采用基于動(dòng)態(tài)規(guī)劃的算法,兼顧了安全與節(jié)油。文獻(xiàn)[3]提出了基于多目標(biāo)優(yōu)化的模型預(yù)測(cè)控制算法,以提高車輛跟隨工況下的燃油經(jīng)濟(jì)性和跟隨性能。文獻(xiàn)[4]設(shè)計(jì)了一種魯棒的自適應(yīng)巡航控制器,用于改善車輛加速度和換擋策略,使車輛在不同交通狀況下都能保持良好的燃油經(jīng)濟(jì)性,但由于換擋策略是離線設(shè)計(jì)的,無(wú)法保證發(fā)動(dòng)機(jī)處于最佳工作點(diǎn)。文獻(xiàn)[5-6]采用脈沖滑??刂品椒?,使發(fā)動(dòng)機(jī)在高效率的區(qū)域工作,可有效降低車輛行駛時(shí)的燃油消耗。文獻(xiàn)[7-8]將道路坡度和車距信息加入到控制系統(tǒng),優(yōu)化了車輛的加速度輸出,可改善車輛的燃油經(jīng)濟(jì)性。
綜上所述,針對(duì)自適應(yīng)巡航控制的研究日益得到重視,但對(duì)于如何基于車輛的動(dòng)力響應(yīng)特性,實(shí)現(xiàn)安全與節(jié)油的協(xié)同控制并兼顧控制的最優(yōu)性,還有待進(jìn)一步研究。
本文以自適應(yīng)巡航控制器為研究對(duì)象,在分析其結(jié)構(gòu)與特性的基礎(chǔ)上,提出一種基于在線學(xué)習(xí)的經(jīng)濟(jì)自適應(yīng)巡航控制器,該控制器可以同時(shí)實(shí)現(xiàn)換擋控制和牽引力控制,以提高燃油經(jīng)濟(jì)性和行駛安全性?;趫?zhí)行依賴啟發(fā)式動(dòng)態(tài)規(guī)劃(ADHDP)方法得到車輪牽引力,控制車輛速度,確保安全行駛。通過(guò)設(shè)定換擋控制策略,調(diào)整發(fā)動(dòng)機(jī)工作點(diǎn),從而提高車輛的燃油經(jīng)濟(jì)性。
本文設(shè)計(jì)的經(jīng)濟(jì)自適應(yīng)巡航控制器的主要優(yōu)點(diǎn)有:1)所提出的控制方法是基于在線學(xué)習(xí)的,不依賴于車輛動(dòng)力學(xué)模型,可以適應(yīng)不同的行駛工況;2)將牽引力與換擋控制相結(jié)合,兼顧車輛的燃油經(jīng)濟(jì)性和行車安全性,可實(shí)現(xiàn)在線計(jì)算。
本文研究的汽車跟隨過(guò)程如圖1所示。vp和vh分別表示前車和自車速度,L為兩車的實(shí)際距離,可以通過(guò)雷達(dá)傳感器等測(cè)得。在跟隨前車過(guò)程中,自車在自適應(yīng)巡航控制器的作用下,保持期望的安全距離Ldes行駛。
圖1 跟車工況
自車的縱向動(dòng)力學(xué)模型如式(1)所示。
(1)
其中:Ft是車輪的牽引力,當(dāng)Ft<0時(shí),表示其為制動(dòng)力;ρ為空氣密度;A為車身迎風(fēng)面積;Cd為空氣阻力系數(shù);m為車輛質(zhì)量;f為滾動(dòng)阻力系數(shù);α為路面坡度。
燃油消耗率如圖2所示。燃油消耗率是發(fā)動(dòng)機(jī)轉(zhuǎn)矩Te和發(fā)動(dòng)機(jī)轉(zhuǎn)速ωe的非線性函數(shù),可表示為
圖2 燃油消耗率圖
(2)
自車采用自動(dòng)機(jī)械傳動(dòng)(AMT),將發(fā)動(dòng)機(jī)轉(zhuǎn)矩傳遞到車輪上,以滿足行駛動(dòng)力要求,發(fā)動(dòng)機(jī)和車輪的速度和轉(zhuǎn)矩關(guān)系分別由下式確定:
(3)
其中:ig為齒輪位置g對(duì)應(yīng)的傳動(dòng)比;rw為車輪半徑;ηg為傳動(dòng)效率。
AMT中的換擋策略決定了齒輪傳動(dòng)比,并以此調(diào)整發(fā)動(dòng)機(jī)的工作點(diǎn)。為了避免跳躍式換擋所帶來(lái)的車輛舒適性變差的問(wèn)題,僅允許順序換擋。設(shè)計(jì)的換擋策略根據(jù)上一時(shí)刻的齒輪位置g(t-1)來(lái)控制當(dāng)前時(shí)間步長(zhǎng)的齒輪位置g(t),并且根據(jù)如下的動(dòng)態(tài)模型來(lái)發(fā)出換擋指令:
g(t)=g(t-1)+ug(t)
(4)
其中:ug屬于集合{-1,0,1},-1表示下降,1表示上升,0表示保持不變。
在車輛跟隨情況下,經(jīng)濟(jì)自適應(yīng)巡航控制的目標(biāo)有兩個(gè):最低燃油消耗率和為了保證安全行駛所需的期望車輛間距Ldes。車輛距離偏差定義為ΔL=L-Ldes,相對(duì)速度偏差定義為Δv=vp-vh,Ldes的表達(dá)式如下:
Ldes=τhvh+d0
(5)
其中:τh是采樣時(shí)間間隔;d0是靜止距離。
車輛距離偏差ΔL和相對(duì)速度偏差Δv的動(dòng)態(tài)模型可以表示為:
(6)
其中ap是前車加速度。
通過(guò)車輛距離偏差和車速偏差來(lái)評(píng)價(jià)車輛跟車工況下的跟蹤性能,為了改善燃油經(jīng)濟(jì)性和跟蹤性能,設(shè)置目標(biāo)函數(shù)為
(7)
其中Tcyc是車輛的行駛里程。
經(jīng)濟(jì)自適應(yīng)巡航控制的最優(yōu)問(wèn)題是綜合考慮經(jīng)濟(jì)和安全指標(biāo),求解控制變量u=[Ft,ug]T,使得目標(biāo)函數(shù)式(7)最小。因此,設(shè)置如下的約束條件:
amin≤ah≤amax
ΔLmin≤ΔL≤ΔLmax
Δvmin≤Δv≤Δvmax
Te,min≤Te≤Te,max
ωe,min≤ωe≤ωe,max
ig∈{ig1,ig2,ig3,ig4,ig5}
(8)
本節(jié)介紹基于Actor-Critic結(jié)構(gòu)的自適應(yīng)動(dòng)態(tài)規(guī)劃(ADP),并討論其在經(jīng)濟(jì)自適應(yīng)巡航控制中的應(yīng)用。
ADP作為強(qiáng)化學(xué)習(xí)的一種主要變體,是一種基于學(xué)習(xí)的控制方法,它根據(jù)與環(huán)境的交互進(jìn)行決策。
如圖3所示的Actor-Critic結(jié)構(gòu),從Actor網(wǎng)絡(luò)中可生成一個(gè)行為,并使用Critic網(wǎng)絡(luò)進(jìn)行評(píng)估,得到一個(gè)增強(qiáng)信號(hào)。通過(guò)最小化從Critic網(wǎng)絡(luò)獲得的值來(lái)改善控制策略。ADP通??梢栽诓灰蕾囅到y(tǒng)模型的情況下,在線近似地求解最優(yōu)控制問(wèn)題[9]。
圖3 Action-Critic結(jié)構(gòu)
設(shè)有如下非線性離散時(shí)間系統(tǒng):
r(xt,ut)=r(xi,ut)+βV(xt+1)
(9)
其中:0<β<1;r(xi,ui)是根據(jù)控制輸入ui和狀態(tài)量xi得到的瞬時(shí)值。
ut=h(xt)的貝爾曼最優(yōu)方程如下:
(10)
由式(10)可得
h*(xk)=argmin[r(xt,h(xt))+βV*(xt+1)]
(11)
1)Critic網(wǎng)絡(luò)和在線學(xué)習(xí)
圖4 Critic網(wǎng)絡(luò)的結(jié)構(gòu)
Critic網(wǎng)絡(luò)的誤差函數(shù)定義為估計(jì)值與實(shí)際值之間的誤差,如下所示:
(12)
其中r(t)為外部增強(qiáng)信號(hào)。
Critic網(wǎng)絡(luò)的學(xué)習(xí)目標(biāo)是通過(guò)更新參數(shù)wc,使誤差函數(shù)ec(t)最小化,如下所示:
(13)
基于鏈推導(dǎo)規(guī)則的梯度下降自適應(yīng)算法可用于更新權(quán)重,得到修正的權(quán)重為[10]:
(14)
其中ηc(t)是Critic網(wǎng)絡(luò)的學(xué)習(xí)速率。
2)Action網(wǎng)絡(luò)與在線學(xué)習(xí)
(15)
Action網(wǎng)絡(luò)的訓(xùn)練和Critic網(wǎng)絡(luò)類似,其權(quán)重如下所示:
(16)
其中ηa(t)是Action網(wǎng)絡(luò)的學(xué)習(xí)速率。
經(jīng)濟(jì)自適應(yīng)巡航控制的目標(biāo)是保持與前車的安全距離,并且使相同時(shí)間內(nèi)的燃油消耗最小。通過(guò)調(diào)整牽引力Ft來(lái)控制自車的速度,使其跟隨前車安全行駛,并由最優(yōu)換擋控制ug來(lái)調(diào)整發(fā)動(dòng)機(jī)工作點(diǎn),總體控制算法如圖5所示。
圖5 控制算法
假設(shè)已經(jīng)測(cè)得車輛距離偏差ΔL和車速偏差Δv,在每個(gè)時(shí)間步長(zhǎng),可以從集合{-1,0,1}選擇換擋指令ug。由式(3)和式(4)可得ug對(duì)應(yīng)的發(fā)動(dòng)機(jī)轉(zhuǎn)矩和發(fā)動(dòng)機(jī)轉(zhuǎn)速。牽引力Ft可由Action網(wǎng)絡(luò)中的ADHDP方法計(jì)算得到。
在學(xué)習(xí)過(guò)程開始時(shí),Critic和Action網(wǎng)絡(luò)的參數(shù)在[0,0.4]中隨機(jī)選取。在每一個(gè)時(shí)間步長(zhǎng)中,利用Critic網(wǎng)絡(luò)對(duì)式(13)進(jìn)行迭代。迭代停止判據(jù)為最大迭代次數(shù)Nc和容差Tc。如果迭代滿足任意一個(gè)條件,則停止迭代過(guò)程,并從Critic網(wǎng)絡(luò)中導(dǎo)出近似值函數(shù)。同理,利用Action網(wǎng)絡(luò)對(duì)式(15)進(jìn)行迭代,迭代停止判據(jù)為最大迭代次數(shù)Na和容差Ta,當(dāng)滿足任意一個(gè)條件時(shí),停止迭代過(guò)程,并從Action網(wǎng)絡(luò)中導(dǎo)出最優(yōu)牽引力和換擋指令,最終應(yīng)用于車輛。
針對(duì)城市道路和高速公路的行駛場(chǎng)景,對(duì)所提出的控制方法進(jìn)行了仿真。仿真參數(shù)如表1所示。
表1 仿真參數(shù)
針對(duì)城市道路循環(huán)工況(UDDS)進(jìn)行了經(jīng)濟(jì)自適應(yīng)巡航控制器的仿真。前300 s的仿真結(jié)果如圖6所示,自車的速度曲線與前車的速度曲線非常接近,距離偏差保持在-2 m~2 m的范圍內(nèi),這表明車輛具有良好的跟蹤性能和安全性。車輛的加速度<2 m/s2,可保證良好的乘坐舒適性。
圖6 城市道路循環(huán)工況(UDDS)仿真
與文獻(xiàn)[11]中給出的基于規(guī)則控制策略產(chǎn)生的擋位相比,獲得了更高的擋位,這有利于發(fā)動(dòng)機(jī)燃油經(jīng)濟(jì)性。
UDDS工況仿真的燃油消耗量如表2所示。相比本文提出的換擋策略,基于規(guī)則的換擋控制方法的燃油消耗率要高出23.3%。另外,在仿真過(guò)程中,前車所消耗的燃油量比同一檔位的自車多3.7%左右。由此表明,本文設(shè)計(jì)的經(jīng)濟(jì)自適應(yīng)巡航控制器不僅能保證行車安全,而且能夠提高燃油經(jīng)濟(jì)性。
表2 UDDS仿真燃油消耗量對(duì)比
高速公路燃油經(jīng)濟(jì)性測(cè)試(HWFET)工況前300 s仿真結(jié)果如圖7所示。自車的速度可以很好地跟隨前車的速度,使得車距偏差的變化范圍很小,并保持安全行車所需的車輛間距。
圖7 HWFET仿真
車輛行駛過(guò)程中,加速度始終處于小范圍內(nèi),因此可保證車輛具有良好的舒適性。相對(duì)于基于規(guī)則的控制策略,本文所提出的換擋方案能夠產(chǎn)生更高的擋位調(diào)節(jié)發(fā)動(dòng)機(jī)工作點(diǎn),從而改善車輛的燃油經(jīng)濟(jì)性。
表3給出了高速公路燃油經(jīng)濟(jì)性測(cè)試的仿真燃油消耗量。基于規(guī)則的控制方案燃油消耗比本文所提出的換擋策略高3.8%,并且,與相同換擋控制的前車相比,自車的燃油消耗少0.7%。
表3 HWFET仿真燃油消耗量對(duì)比
本文基于車輛縱向動(dòng)力學(xué)特性分析與辨識(shí),設(shè)計(jì)了一種兼顧安全與節(jié)油的車輛經(jīng)濟(jì)自適應(yīng)巡航控制器。采用執(zhí)行依賴啟發(fā)式動(dòng)態(tài)規(guī)劃(ADHDP)方法控制車輪的牽引力,實(shí)現(xiàn)跟車功能。通過(guò)設(shè)置在線換擋策略來(lái)調(diào)整發(fā)動(dòng)機(jī)工作點(diǎn),從而改善車輛的燃油經(jīng)濟(jì)性。通過(guò)仿真對(duì)比,驗(yàn)證了系統(tǒng)的有效性,得出如下結(jié)論:
1)基于在線學(xué)習(xí)的經(jīng)濟(jì)自適應(yīng)巡航控制器,能在保證安全跟車的前提下,改善車輛的燃油經(jīng)濟(jì)性。仿真結(jié)果表明,該控制器實(shí)現(xiàn)了車輛的安全與節(jié)油的協(xié)同優(yōu)化。
2)設(shè)計(jì)的控制器無(wú)需模型,通過(guò)在線計(jì)算可以適應(yīng)不同的行駛工況,在兼顧最優(yōu)性的同時(shí),能夠保證控制的實(shí)時(shí)性。