李松
(重慶交通大學(xué)機(jī)電與車輛工程學(xué)院,重慶400074)
縮略語(yǔ)
PP Pure Pursuit
PID Proportional Integral Derivative
LQR Linear Quadratic Regulator
MPC Model Predictive Control
ESO Extended State Observer
SMC Sliding Mode Control
ADRC Active Disturbance Rejection Control
FC Fuzzy Control
AC Adaptive Control
KF Kalman Filter
EKF Extended Kalman Filter
UKF Unscented Kalman algorithm
CKF Cubature Kalman Filter
PF Particle Filter
DL Deep Learning
RL Reinforcement Learning
CNN Convolutional Neural Network
PSO Particle Swarm Optimization
ILC Iterative Learning Control
DDPG Deep Deterministic Policy Gradient
智能汽車研發(fā)是汽車產(chǎn)業(yè)向智能化轉(zhuǎn)型的核心,智能汽車核心技術(shù)研發(fā)也得到了學(xué)術(shù)界和產(chǎn)業(yè)界廣泛和高度的關(guān)注。智能汽車不僅能實(shí)現(xiàn)基礎(chǔ)的駕駛動(dòng)作,還能規(guī)避人為不良駕駛操作,大幅度降低安全風(fēng)險(xiǎn),極大程度地減少交通事故發(fā)生率,同時(shí)也改善城市交通擁堵?tīng)顩r。智能汽車發(fā)展趨勢(shì)不可逆轉(zhuǎn),由計(jì)算機(jī)、人工智能和控制工程等多學(xué)科領(lǐng)域共同發(fā)力,為中國(guó)智能汽車產(chǎn)業(yè)貢獻(xiàn)高新技術(shù)和創(chuàng)新發(fā)展新方案。軌跡跟蹤控制是智能汽車的核心技術(shù)之一,其本質(zhì)是使智能汽車按照所設(shè)定的路徑行駛,同時(shí)確保智能汽車操控穩(wěn)定與安全。軌跡跟蹤控制技術(shù)確保并期望改善智能汽車行駛舒適性和平穩(wěn)性。
智能汽車的跟蹤分為路徑跟蹤和軌跡跟蹤2類[1]。不同之處是,路徑跟蹤問(wèn)題中的參考軌跡是相對(duì)獨(dú)立的,與時(shí)間關(guān)系不密切。而軌跡跟蹤問(wèn)題中,參考軌跡與時(shí)間密切相關(guān),且對(duì)智能汽車隨時(shí)間的響應(yīng)速度和軌跡誤差精度要求更高。為此,研究人員就不得不將軌跡和時(shí)間與空間建立密切關(guān)聯(lián),以保證軌跡跟蹤過(guò)程的實(shí)時(shí)性,因此必須將智能汽車橫向和縱向運(yùn)動(dòng)都與時(shí)間建立關(guān)系,從而實(shí)現(xiàn)智能汽車橫向和縱向運(yùn)動(dòng)協(xié)調(diào)一致,使得智能駕駛行駛時(shí)能夠迅速且平穩(wěn)地按照參考軌跡運(yùn)行。
本文以跟蹤控制為重點(diǎn)研究對(duì)象,主要從基于幾何運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)的跟蹤控制算法及其優(yōu)化方向進(jìn)行研究,通過(guò)例舉法和對(duì)比法,詳細(xì)分析目前通用的跟蹤控制方法原理及其優(yōu)缺點(diǎn),直觀感受各種方法的試用范圍和情景。
智能汽車的軌跡跟蹤定義為:在車輛中,通常將質(zhì)心(或后輪中心)選作控制點(diǎn),由軌跡規(guī)劃模塊選擇出當(dāng)前時(shí)刻期望軌跡上的一個(gè)點(diǎn)作為合適的參考點(diǎn),計(jì)算相應(yīng)的速度、橫向誤差,使得控制點(diǎn)向參考點(diǎn)逼近,從而完成對(duì)期望軌跡跟蹤過(guò)程[2],軌跡跟蹤模型見(jiàn)圖1。
圖1 軌跡跟蹤模型[2]
智能車輛的軌跡跟蹤主要分為2類:(1)單純基于幾何運(yùn)動(dòng)學(xué)的跟蹤算法,如純跟蹤算法(Pure Pursuit,PP)和斯坦利(Stanley)算法;(2)基于運(yùn)動(dòng)學(xué)模型和動(dòng)力學(xué)模型的跟蹤算法,如比例積分控制(Proportional Integral Derivative,PID)、線性二次調(diào)節(jié)器(Linear Quadratic Regulator,LQR)、模型預(yù)測(cè)控制(Model Predictive Control,MPC)、滑??刂坪妥钥箶_控制等。表1中按軌跡跟蹤算法分類,對(duì)當(dāng)前軌跡跟蹤控制和優(yōu)化算法進(jìn)行了總結(jié)。
表1 軌跡跟蹤控制及優(yōu)化算法
運(yùn)動(dòng)學(xué)是從幾何學(xué)的角度對(duì)物體的運(yùn)動(dòng)規(guī)律進(jìn)行分析,它包含了物體在空間中的速度和位置隨時(shí)間而發(fā)生的改變。所以,車輛運(yùn)動(dòng)學(xué)模型可以反映車輛位置、速度、加速度與時(shí)間的關(guān)系。在建立汽車運(yùn)動(dòng)學(xué)模型時(shí),必須綜合考慮汽車的橫向位置信息和汽車的偏航角。汽車動(dòng)力學(xué)建模必須要考慮到汽車與路面間的作用力,考慮輪胎的側(cè)偏特性。在高速行駛條件下,汽車運(yùn)動(dòng)學(xué)模型推導(dǎo)中,汽車前后車輪的運(yùn)動(dòng)軌跡與車輪的速度矢量不再一致。動(dòng)力學(xué)模型比運(yùn)動(dòng)學(xué)模型增加了動(dòng)態(tài)參數(shù),更能表征汽車實(shí)際運(yùn)行狀態(tài),因此,采用動(dòng)力學(xué)模型對(duì)車輛的軌跡跟蹤十分必要。
基于幾何與運(yùn)動(dòng)學(xué)的跟蹤算法常只適用于智能汽車車速<70 km/h 時(shí)軌跡跟蹤,當(dāng)車速≥70 km/h 時(shí)往往采用基于動(dòng)力學(xué)以及考慮其他算法進(jìn)行軌跡跟蹤,如多算法融合、多約束等來(lái)提高精度與保證操縱穩(wěn)定性。
純跟蹤控制算法是一種典型的橫向控制方法,最早由卡內(nèi)基梅隆大學(xué)學(xué)者Wallace在20世紀(jì)八十年代提出[3],該方法對(duì)外界的魯棒性較好。PP 算法利用期望路徑與行駛路徑的距離偏差來(lái)測(cè)量汽車位置信息、前輪轉(zhuǎn)向角數(shù)據(jù),來(lái)實(shí)現(xiàn)智能汽車的路徑跟蹤。純跟蹤算法具有實(shí)現(xiàn)簡(jiǎn)單、數(shù)據(jù)計(jì)算直觀的優(yōu)點(diǎn),在跟蹤過(guò)程中呈現(xiàn)出很好的魯棒性。圖2給出了純跟蹤算法控制的幾何關(guān)系示意[4],該方法的基本原理是在對(duì)汽車轉(zhuǎn)彎半徑R進(jìn)行控制的基礎(chǔ)上,以汽車后軸中心為控制點(diǎn),從該點(diǎn)出發(fā)到前視距為ld的參考路徑目標(biāo)點(diǎn)(Gx,Gy),再根據(jù)阿克曼轉(zhuǎn)向模型(Ackerman Turing Model),計(jì)算出所需要的前輪轉(zhuǎn)動(dòng)角度[1]。
圖2 純路徑跟蹤模型[4]
根據(jù)幾何關(guān)系:
可得車輛轉(zhuǎn)向半徑R和轉(zhuǎn)向曲率ρ分別為:
式中,α為車輛中心平面與前視矢量的夾角;ye為側(cè)向位移的誤差。
算法可以理解為轉(zhuǎn)向曲率ρ是關(guān)于側(cè)向位移誤差ye且增益系數(shù)為2/l2d的比例控制。
參考需求的轉(zhuǎn)向半徑R,l為車輛前后輪距離,結(jié)合阿克曼轉(zhuǎn)向模型,可以計(jì)算出前輪轉(zhuǎn)向角δf:
純跟蹤算法(PP)方法簡(jiǎn)便,對(duì)路面曲率擾動(dòng)有較強(qiáng)的抗干擾能力,但其對(duì)前視點(diǎn)選取的依賴性較強(qiáng),且最優(yōu)化結(jié)果難以獲得。另外,單純的跟蹤方法建立在一個(gè)簡(jiǎn)單的幾何模型上,沒(méi)有充分地考慮汽車動(dòng)力學(xué)特征以及轉(zhuǎn)向執(zhí)行器的動(dòng)態(tài)特征。在車速為100 km/h 行駛條件下,由于轉(zhuǎn)彎曲率急劇改變?nèi)菀滓鹌噦?cè)滑,且由于系統(tǒng)建模與真實(shí)汽車特征差異過(guò)大,跟蹤效果不理想。
Stanley 算法也稱之為前輪反饋控制算法。Stanley 算法基本思路是根據(jù)前輪中心的路徑跟蹤偏差值進(jìn)行計(jì)算,得到轉(zhuǎn)向盤的轉(zhuǎn)向控制量。Stanley 算法模型見(jiàn)圖3。該算法以車輛前軸中心到最近參考軌跡點(diǎn)的距離為基礎(chǔ)的非線性反饋函數(shù),可以使橫向跟蹤誤差指數(shù)收斂到零。通過(guò)汽車姿態(tài)和參考路徑之間的幾何關(guān)系,可以直接得到汽車轉(zhuǎn)向盤的控制量。前輪轉(zhuǎn)角的控制變量主要包括2個(gè)方面:
圖3 Stanley運(yùn)動(dòng)學(xué)模型[5]
(1)航向誤差形成的轉(zhuǎn)角,就是期望軌跡上與車身最近點(diǎn)的切線方向與車輛方向的夾角。
(2)由橫向誤差造成的夾角,也就是在側(cè)向偏差下,前軸車輪的中心與期望軌跡最近的點(diǎn)之間的夾角[5]。
在不計(jì)橫向誤差的前提下,汽車前輪的偏角必須與已期望路徑參考點(diǎn)的切線方向一致。如果忽略了航向跟蹤的偏差,則會(huì)使橫向跟蹤誤差增大,從而使前輪轉(zhuǎn)向角變大。
與純跟蹤算法相比,Stanley 算法的優(yōu)勢(shì)在于該算法同時(shí)兼顧了車輛偏航角和車輛與跟蹤路徑之間的橫向誤差,其核心思路是根據(jù)前輪的軌跡追蹤偏移量來(lái)確定轉(zhuǎn)向盤的轉(zhuǎn)向控制量。在此基礎(chǔ)上,提出了一種非線性反饋函數(shù)方法,該方法以車輛前軸中心與最近路徑點(diǎn)的間距為基礎(chǔ),將橫向跟蹤誤差指數(shù)收斂到零。利用汽車姿態(tài)和參考路徑之間的空間位置相關(guān)性,可直接得到汽車轉(zhuǎn)向軸角度的控制量。
當(dāng)路徑為連續(xù)可導(dǎo)且路徑曲率變化時(shí),Stanley 算法前輪反饋系統(tǒng)具有一定的局部指數(shù)收斂特性。但是可以看到,這種方法并不適合在汽車倒車的情況下使用,在像自動(dòng)泊車這樣需要短距離倒車的情況下也不能使用。此外,還需要有更高的期望路線的光滑平整度,在道路曲率光滑度不佳的時(shí)候,很可能會(huì)發(fā)生車輛響應(yīng)超調(diào)過(guò)大的問(wèn)題[6]。
傳統(tǒng)PID 控制算法發(fā)展較早,相對(duì)也更為成熟,由于PID 不需要對(duì)被控對(duì)象進(jìn)行建模,而且其控制需要的參數(shù)較少,多應(yīng)用于智能汽車縱向軌跡跟蹤控制。此外,該算法在應(yīng)用于智能汽車的橫向軌跡跟蹤控制時(shí),由于單獨(dú)的傳統(tǒng)PID 控制算法已經(jīng)無(wú)法滿足如今多變的智能汽車參數(shù)及道路環(huán)境,無(wú)法適應(yīng)高度自動(dòng)駕駛汽車軌跡跟蹤控制。目前純粹的傳統(tǒng)PID控制應(yīng)用也已很少,應(yīng)用更多的軌跡跟蹤控制算法是和其他控制器聯(lián)合實(shí)現(xiàn)復(fù)合控制,如Tsai 等[7]基于預(yù)測(cè)控制和輸出遞歸模糊小波神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行在線參數(shù)學(xué)習(xí)和自適應(yīng)PID 算法,Phu 等[8]利用模糊PID 來(lái)提高PID 的適用性,以PID 為基礎(chǔ),研究其他彌補(bǔ)短板的優(yōu)化方向。
MARINO 等[9]提出了一種新型串級(jí)PID 橫向控制方案,該方案采用外環(huán)回路,利用橫向誤差值間接獲得所需的期望橫擺角速度,內(nèi)環(huán)采用比例積分(Proportional Integral,PI)控制,實(shí)現(xiàn)了對(duì)橫擺角速度的實(shí)時(shí)追蹤,并利用極點(diǎn)配置對(duì)控制器的參數(shù)進(jìn)行調(diào)節(jié),實(shí)現(xiàn)整體的漸近穩(wěn)定性。然而,該算法僅根據(jù)智能汽車與路徑之間的運(yùn)動(dòng)規(guī)律進(jìn)行了線性化,不能實(shí)現(xiàn)較大幅度的橫向位移量的遞增收斂,也不能充分考慮執(zhí)行器的限制因素。
北京理工大學(xué)趙熙俊等[10]提出了一種新的航向偏差反饋控制策略。分析運(yùn)動(dòng)學(xué)方程,獲得了目標(biāo)航向角誤差。并在這基礎(chǔ)上,以車與路耦合系統(tǒng)為基礎(chǔ),根據(jù)車速不同分段,提出了一種分段固定增益PID 控制算法,并通過(guò)實(shí)車實(shí)驗(yàn)驗(yàn)證了其對(duì)非結(jié)構(gòu)性路面的良好跟蹤性能,其橫向控制系統(tǒng)試驗(yàn)結(jié)果如圖4 所示。
圖4 橫向控制系統(tǒng)試驗(yàn)結(jié)果[10]
以上文獻(xiàn)所提出的PID 控制方法在單一變量的情況下,能體現(xiàn)出較強(qiáng)的跟蹤性能,包括速度、橫擺角速度和航向角。盡管PID 控制方法簡(jiǎn)便、高效,從理論上講,根據(jù)模型調(diào)整PID 參數(shù)能獲得最佳結(jié)果。但在不知道模型或處于時(shí)變系統(tǒng)的情況下,調(diào)整PID 參數(shù)通常需要大量經(jīng)驗(yàn),且計(jì)算復(fù)雜度較高。同時(shí),由于外界干擾和不確定因素的影響,使得難以達(dá)到大范圍內(nèi)的漸近穩(wěn)定性。此外,常規(guī)PID 控制方法還存在著因執(zhí)行器容量飽和而引起的積分操作發(fā)散現(xiàn)象,因此必須對(duì)其進(jìn)行進(jìn)一步的改進(jìn)以防止積分飽和。
LQR 采用全狀態(tài)線性反饋控制器,構(gòu)建閉環(huán)最優(yōu)化控制系統(tǒng),對(duì)二次優(yōu)化問(wèn)題進(jìn)行歸一化處理,給出優(yōu)化結(jié)果的解析解,并在保證多個(gè)性能目標(biāo)的前提下,進(jìn)行優(yōu)化設(shè)計(jì),可以較好地完成對(duì)目標(biāo)路徑的最優(yōu)跟蹤控制,因此常被用于智能汽車橫向運(yùn)動(dòng)控制中[11]。
徐明澤等[12]和張栩源等[13]都提出了融合LQR 和PID 算法,前者采用遺傳算法對(duì)橫向LQR 控制的關(guān)鍵參數(shù)進(jìn)行了確定,后者提出了前輪轉(zhuǎn)角補(bǔ)償控制,都能提高智能汽車軌跡跟蹤的精度及魯棒性。
Snider[6]簡(jiǎn)要闡述了LQR 在軌跡跟蹤方面的應(yīng)用。采用汽車質(zhì)心為控制點(diǎn),對(duì)含有路面彎曲干擾的汽車進(jìn)行建模,采用不考慮干擾項(xiàng)的線性二次型調(diào)節(jié)器,雖能保證系統(tǒng)的穩(wěn)定性,但因干擾項(xiàng)的存在,其穩(wěn)態(tài)誤差依然存在。針對(duì)這一問(wèn)題,又提出了一種在LQR 反饋控制的基礎(chǔ)上增加道路曲率前饋環(huán)節(jié)的控制方法,以減小橫向位移的穩(wěn)定誤差。但因?yàn)榭刂泣c(diǎn)在質(zhì)心位置的預(yù)瞄距離為零,所以前饋信號(hào)只有被動(dòng)響應(yīng),超調(diào)比較明顯,而預(yù)瞄信號(hào)的加入可以提高控制效果。
二次調(diào)節(jié)控制器在多目標(biāo)跟蹤控制的表現(xiàn)良好,徐明澤等[12]和張栩源等[13]結(jié)合PID 算法進(jìn)行橫向控制,能發(fā)揮出2 種算法的優(yōu)點(diǎn)。但LQR 結(jié)合PID 算法缺點(diǎn)也很明顯,即在整個(gè)過(guò)程中都進(jìn)行了線性化處理,將環(huán)境干擾和路面情況理想化,在鄉(xiāng)村道路或人流量較大的胡同環(huán)境下不穩(wěn)定性大大增加,需要制定合理的優(yōu)化方法或者引入新的算法結(jié)合,降低外界干擾帶來(lái)的影響。
由于智能汽車所面對(duì)的是一個(gè)不斷發(fā)生變化的復(fù)雜環(huán)境,必須要符合關(guān)鍵安全約束和執(zhí)行器約束條件。而MPC算法可以對(duì)預(yù)測(cè)信息進(jìn)行全面分析,對(duì)多約束優(yōu)化有著很強(qiáng)的處理能力。同時(shí),其在理論與計(jì)算方面的同步發(fā)展,拓展了實(shí)時(shí)MPC的適用領(lǐng)域。傳統(tǒng)MPC 已經(jīng)較為成熟,如今更多的還是對(duì)MPC 算法進(jìn)行改進(jìn),如基于參數(shù)自適應(yīng)、變步長(zhǎng)、時(shí)域自適應(yīng)等的AMPC 算法,如基于多控制器、引入其他智能算法的蟻群算法、神經(jīng)網(wǎng)絡(luò)算法和遺傳算法等。為此,研究人員在模型預(yù)測(cè)控制技術(shù)的基礎(chǔ)上進(jìn)行了大量的算法研究。Mata 等[14]提出了一種以多重約束為基礎(chǔ)的最優(yōu)軌跡跟蹤控制策略,該策略采用了連續(xù)線性化誤差模型,并采用二次規(guī)劃求解MPC,從而實(shí)現(xiàn)了較好的軌跡跟蹤精度?;谠摲椒ǎ琒on 等[15]提出了一種面向倒車行駛的轉(zhuǎn)向控制方法,該方法具有比斯坦利(Stanley)方法更強(qiáng)的魯棒性和更高的追蹤準(zhǔn)確率。
李伯雄等[16]提出一種將擴(kuò)展卡爾曼濾波法與模型預(yù)測(cè)控制法結(jié)合的控制算法,模型結(jié)構(gòu)如圖5所示。試驗(yàn)采用3種不同的路面附著系數(shù)來(lái)模擬路面附著情況,用于實(shí)現(xiàn)車輛橫向軌跡跟蹤,以保證智能汽車在未知路面工況下的行駛安全,使智能汽車跟隨預(yù)期軌跡行駛,有效提高了智能汽車在不同附著系數(shù)路面行駛時(shí)橫向軌跡跟蹤的穩(wěn)定性及魯棒性。
圖5 橫向跟蹤控制算法模型[16]
趙樹(shù)恩等[17]針對(duì)下智能汽車軌跡跟蹤的精確性和車輛行駛穩(wěn)定性等要求,提出一種基于擴(kuò)張狀態(tài)觀測(cè)器(Extended State Observer,ESO)的MPC 策略,利用ESO 對(duì)車輛狀態(tài)時(shí)變特性、道路環(huán)境不確定性因素引起的干擾進(jìn)行在線估計(jì),從而提高智能汽車在彎道且存在干擾環(huán)境下進(jìn)行軌跡跟蹤的魯棒性和實(shí)時(shí)性。
相比較前面的PID 和LQR 軌跡跟蹤算法,MPC算法在處理多約束問(wèn)題上有更大的優(yōu)勢(shì),在處理外界干擾和路面附著問(wèn)題方面,跟蹤算法精度更高,魯棒性更好。但在實(shí)際應(yīng)用過(guò)程中運(yùn)算復(fù)雜,多約束處理時(shí)存在沖突,無(wú)法找到最優(yōu)解,成本也高。
由于滑模控制(Sliding Mode Control,SMC)對(duì)參數(shù)變化及擾動(dòng)不敏感,系統(tǒng)具有極強(qiáng)的魯棒性且當(dāng)其應(yīng)用于非線性系統(tǒng)時(shí),無(wú)須進(jìn)行復(fù)雜的線性化,能更便捷穩(wěn)定地實(shí)現(xiàn)控制,也常應(yīng)用于軌跡跟蹤,如王俊昌等[18]基于快速冪次趨近律設(shè)計(jì)智能汽車軌跡跟蹤SMC,通過(guò)智能汽車自主轉(zhuǎn)向控制跟蹤參考軌跡,通過(guò)橫擺力矩控制跟蹤參考橫擺角速度。此外,利用橫擺力矩控制量設(shè)計(jì)了前輪轉(zhuǎn)向角補(bǔ)償模塊,通過(guò)軌跡跟蹤和橫擺穩(wěn)定控制器的協(xié)調(diào),進(jìn)一步修正軌跡跟蹤精度。
李鶴年等[19]基于遺傳算法整定滑模參數(shù)、馬瑞梓等[20]基于神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)滑模變結(jié)構(gòu)來(lái)提高控制精度和效果。Aslam 等[21]利用模糊滑??刂苼?lái)對(duì)滑移轉(zhuǎn)向智能汽車進(jìn)行軌跡跟蹤控制。
滑模控制和改進(jìn)型自抗干擾控制算法本身在提高智能汽車操控性能、安全性和適應(yīng)多樣路況方面有顯著優(yōu)勢(shì)。在此基礎(chǔ)上使用快速冪次律、遺傳算法、神經(jīng)網(wǎng)絡(luò)方法提高跟蹤精度?;?刂破饔捎诔杀靖?、耗能大和維護(hù)頻繁的問(wèn)題限制了其使用范圍。表2總結(jié)了軌跡跟蹤算法優(yōu)缺點(diǎn)。
表2 軌跡跟蹤控制算法優(yōu)缺點(diǎn)
傳統(tǒng)軌跡跟蹤控制算法大多只能適用于智能汽車中低速工況,高速工況下可能會(huì)失穩(wěn),精度有所降低。為提高智能汽車軌跡跟蹤精度,通常會(huì)采用以下方法對(duì)軌跡跟蹤算法進(jìn)行優(yōu)化。
周云等[23]針對(duì)基于壓縮感知技術(shù)的目標(biāo)跟蹤算法存在的跟蹤漂移問(wèn)題,提出了一種采用改進(jìn)壓縮感知算法和卡爾曼濾波(Kalman Filter,KF)方法相結(jié)合的車輛目標(biāo)跟蹤算法,通過(guò)KF 增益系數(shù)對(duì)預(yù)測(cè)值與觀測(cè)值進(jìn)行修正,獲得最終目標(biāo)跟蹤結(jié)果。最后,在修正后的目標(biāo)區(qū)域周圍進(jìn)行正負(fù)樣本采樣,以實(shí)現(xiàn)樸素貝葉斯分類器更新,進(jìn)而實(shí)現(xiàn)目標(biāo)跟蹤軌跡的實(shí)時(shí)更新。
于晨等[24]基于擴(kuò)展卡爾曼濾波算法(Extended Kalman Filter,EKF)融合慣性傳感器、地磁傳感器與編碼器數(shù)據(jù),解決輪式移動(dòng)機(jī)器人在實(shí)際軌跡跟蹤任務(wù)中存在傳感器測(cè)量誤差且測(cè)量噪聲統(tǒng)計(jì)信息獲取困難的問(wèn)題。
陳瑩等[25]利用平方根卡爾曼濾波(Unscented Kalman Filter,UKF)提出了一種多傳感器融合跟蹤方法,以協(xié)方差平方根陣代替協(xié)方差陣參加迭代運(yùn)算,可有效抑制濾波后的誤差,提高系統(tǒng)的跟蹤準(zhǔn)確率。
卡爾曼濾波是比較成熟的狀態(tài)估計(jì)算法,應(yīng)用在智能汽車軌跡跟蹤中,能很好地提高實(shí)時(shí)性和精確性,針對(duì)模型要求高和噪音測(cè)量誤差問(wèn)題,可以使用擴(kuò)展卡爾曼濾波和粒子濾波方法進(jìn)行改進(jìn)。
Jia 等[26]提出了一種基于粒子濾波(Particle Filter,PF)的自適應(yīng)強(qiáng)跟蹤粒子濾波算法。根據(jù)每時(shí)刻實(shí)際測(cè)量值和預(yù)測(cè)測(cè)量值之間的殘差,通過(guò)特定算法流程,自適應(yīng)地對(duì)遺忘因子和弱化因子進(jìn)行調(diào)整,來(lái)提高跟蹤精度。
Lin 等[27]提出了一種改進(jìn)的基于PF 的跟蹤算法,將所有顆粒分為2部分并分開(kāi)放置。第一次放置的粒子數(shù)量足夠大,以確??梢愿采w目標(biāo)的粒子數(shù)量盡可能多,然后將第二部分粒子放置在與第一次放置粒子中的模板最高相似度的粒子位置,以提高跟蹤精度,在復(fù)雜場(chǎng)景下的魯棒性,并解決由快速移動(dòng)目標(biāo)引起的漂移問(wèn)題。
粒子濾波性能與粒子數(shù)目有關(guān),過(guò)多和過(guò)少粒子數(shù)目都會(huì)影響測(cè)試結(jié)果,Lin 等[27]提出了分步放置的方式解決了粒子濾波的估計(jì)結(jié)果不準(zhǔn)確和復(fù)雜度高的問(wèn)題。此外粒子濾波還存在采樣偏差和粒子退化的問(wèn)題,Jia等[26]對(duì)遺忘因子和弱化因子進(jìn)行調(diào)整。除了上述方法外還可以通過(guò)基于樹(shù)結(jié)構(gòu)、基于網(wǎng)格方法對(duì)粒子濾波優(yōu)化方法進(jìn)行完善。
增強(qiáng)學(xué)習(xí)是一種通過(guò)學(xué)習(xí)從狀態(tài)到行為進(jìn)行匹配來(lái)獲得最大收益的一種學(xué)習(xí)機(jī)制。這學(xué)習(xí)機(jī)制必須在外界條件下持續(xù)試驗(yàn),并根據(jù)外界條件(激勵(lì)),持續(xù)地進(jìn)行狀態(tài)-行為優(yōu)化對(duì)應(yīng)關(guān)系。反復(fù)試驗(yàn)(Trial and error)和延時(shí)獎(jiǎng)勵(lì)(Delayed reward)是強(qiáng)化學(xué)習(xí)中的2 個(gè)主要特點(diǎn)。將其用于車輛跟蹤,其背景包括車輛模型、跟蹤模型、路面模型以及回報(bào)函數(shù)。
賀伊琳等[28]在此基礎(chǔ)上,利用強(qiáng)化學(xué)習(xí)的深度確定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法,在目標(biāo)跟蹤過(guò)程中,根據(jù)目標(biāo)的橫向偏差、角度偏差以及路徑曲率,判斷目標(biāo)的轉(zhuǎn)向角,進(jìn)而完成目標(biāo)的自動(dòng)追蹤,并進(jìn)一步提升追蹤準(zhǔn)確度。
夏家偉等[29]提出一種基于近端策略優(yōu)化的深度強(qiáng)化學(xué)習(xí)軌跡跟蹤控制算法,生成軌跡任務(wù)數(shù)據(jù)集來(lái)模擬復(fù)雜的任務(wù)環(huán)境,以此作為深度強(qiáng)化學(xué)習(xí)控制器的訓(xùn)練樣本輸入,增強(qiáng)控制器的魯棒性。
強(qiáng)化學(xué)習(xí)能在無(wú)模型情況下,機(jī)器學(xué)習(xí)駕駛數(shù)據(jù)是一種模仿人類駕駛的方式。在上述文獻(xiàn)中可以看出強(qiáng)化學(xué)習(xí)提高了目標(biāo)跟蹤的精確性和智能化程度。與傳統(tǒng)的控制算法結(jié)合,能實(shí)現(xiàn)更高級(jí)的軌跡跟蹤效果,但需要在訓(xùn)練時(shí)間和樣本效率方面做出更有效的改進(jìn)。
如Vaquero 等[30]利用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)來(lái)對(duì)圖像序列進(jìn)行處理,可以有效地提取特征并預(yù)測(cè)物體的運(yùn)動(dòng)軌跡。
金輝等[31]提出了一種利用前饋神經(jīng)網(wǎng)絡(luò)對(duì)所處路段進(jìn)行路面附著系數(shù)辨識(shí)的新算法,并提出了一種多參數(shù)的預(yù)測(cè)控制軌道追蹤算法,從而在確保跟蹤準(zhǔn)確率和行駛平順性的前提下,進(jìn)一步提升了其運(yùn)算效率。
李志堅(jiān)等[32]結(jié)合高速公路監(jiān)控視頻,設(shè)計(jì)了高效的CG3 瓶頸層結(jié)構(gòu)來(lái)優(yōu)化Yolov5 目標(biāo)檢測(cè)算法,并利用改進(jìn)了損失函數(shù)的Deepsort多目標(biāo)追蹤算法進(jìn)行車輛軌跡檢測(cè)與跟蹤,優(yōu)化后的算法得出的車輛檢測(cè)精度由92.8%提高到了96.3%,精度提高了3.5%。
肖宗鑫[33]等基于徑向基神經(jīng)網(wǎng)絡(luò)的自適應(yīng)補(bǔ)償和魯棒控制設(shè)計(jì)了優(yōu)化后的MPC軌跡跟蹤控制系統(tǒng),減輕智能汽車側(cè)滑程度,提高智能汽車行駛穩(wěn)定性。
相比于強(qiáng)化學(xué)習(xí),深度學(xué)習(xí)在數(shù)據(jù)驅(qū)動(dòng)學(xué)習(xí)、特征學(xué)習(xí)和表征能力、高級(jí)模式識(shí)別方面更有優(yōu)勢(shì),同時(shí)也存在數(shù)據(jù)需求量大和解釋性差的缺點(diǎn),可以結(jié)合強(qiáng)化學(xué)習(xí)、可視化、注意力機(jī)制(Attention Mechanism)技術(shù)來(lái)改善。
對(duì)于具有重復(fù)運(yùn)行這種特質(zhì)的系統(tǒng),采用迭代式學(xué)習(xí)控制,根據(jù)已有動(dòng)作的誤差信息,對(duì)當(dāng)前動(dòng)作的輸入信號(hào)進(jìn)行修正,從而實(shí)現(xiàn)對(duì)已有動(dòng)作的最優(yōu)控制。
裴九芳等[34]采用了迭代學(xué)習(xí)控制(Iterative Learning Control, ILC)來(lái)對(duì)所述移動(dòng)機(jī)器人運(yùn)動(dòng)軌跡進(jìn)行控制和跟蹤。
卜旭輝等[35]利用ILC 理論對(duì)農(nóng)機(jī)作業(yè)車的行駛軌跡進(jìn)行了分析,利用壓縮映射法對(duì)其進(jìn)行了收斂分析。
姚文龍等[36]將時(shí)變、非線性因素納入到一個(gè)迭代域下全格式動(dòng)態(tài)線性化數(shù)據(jù)模型,并在此基礎(chǔ)上,利用時(shí)間差分的思想,研究一種新的、具有最優(yōu)特性的、無(wú)需建模的自適應(yīng)迭代控制方法,有效提升了軌跡跟蹤的準(zhǔn)確性與魯棒性。
由于迭代學(xué)習(xí)控制能適應(yīng)非線性系統(tǒng),有較小的模型依耐性。很多學(xué)者將其應(yīng)用在軌跡跟蹤方面,需要注意的是要對(duì)其初始化進(jìn)行合理選擇,以滿足其收斂性較高的要求。
除以上優(yōu)化方向外,其他如多控制組合優(yōu)化算法、粒子群優(yōu)化算法、遺傳優(yōu)化算法等也有應(yīng)用。例如呂文杰等[37]利用了模糊控制(Fuzzy Control,F(xiàn)C)的思路和純跟蹤的算法,將智能汽車行駛速度和航向偏角作為模糊控制器輸入,以此將前視距進(jìn)行合理動(dòng)態(tài)調(diào)整。相對(duì)于固定前視距離的純跟蹤算法,該方法可以顯著地改善目標(biāo)的跟蹤性能。
王鑫等[38]將PP 算法與Stanley 算法結(jié)合,對(duì)車輪轉(zhuǎn)角的計(jì)算方式進(jìn)行改進(jìn),根據(jù)智能汽車航向角、橫向偏差、車速特性,基于合適的預(yù)瞄距離,實(shí)時(shí)計(jì)算智能汽車在當(dāng)前車速下合適的車輪轉(zhuǎn)角,更好地滿足智能汽車跟蹤精確度和平滑性要求。
唐傳茵等[39]提出了一種可以調(diào)節(jié)參數(shù)的基于PSO算法的模型預(yù)測(cè)控制器,結(jié)合輪胎的動(dòng)力學(xué)特性及智能汽車動(dòng)態(tài)特性對(duì)輪胎側(cè)偏角、質(zhì)心側(cè)偏角進(jìn)行約束來(lái)提高智能汽車在高速下的路徑跟蹤效果。
苑風(fēng)霞等[40]在遺傳算法的基礎(chǔ)上,引入了衰減速率先慢后快的高斯衰減函數(shù),使其能夠合理分配預(yù)測(cè)量和控制量的權(quán)重,證實(shí)了這樣的策略對(duì)目標(biāo)軌跡跟蹤精度效果顯著。
不同算法和調(diào)節(jié)參數(shù)方法引入,都是為了跟蹤的效果又快又穩(wěn),滿足乘坐安全性、平穩(wěn)性和舒適行要求。要特別強(qiáng)調(diào)外界干擾、道路附著系數(shù)變化和動(dòng)態(tài)場(chǎng)景下的實(shí)時(shí)性和精確度。隨著技術(shù)不斷突破,軌跡跟蹤控制的效果也不斷增強(qiáng),多算法融合已經(jīng)成為一種新趨勢(shì)。
本文綜述了智能車輛軌跡跟蹤控制的相關(guān)研究。從幾何運(yùn)動(dòng)學(xué)、運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)建模分類出發(fā),對(duì)相關(guān)軌跡跟蹤算法以及它們的優(yōu)化方向進(jìn)行了探討。分析總結(jié)得到以下結(jié)論和展望:
(1)當(dāng)前,智能車輛的軌跡跟蹤研究并不滿足于中低速車速的單一控制算法,需要多方向、多層次深入研究,縱向發(fā)展單一算法的延伸方向彌補(bǔ)原有不足,橫向結(jié)合其他智能優(yōu)化算法或者將多種軌跡跟蹤算法結(jié)合來(lái)提高其控制精度和操縱穩(wěn)定性。
(2)在智能化不斷發(fā)展的時(shí)代,深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)凸顯智能化算法與智能汽車軌跡跟蹤控制聯(lián)系會(huì)不斷加深,應(yīng)當(dāng)拓展智能算法在軌跡跟蹤上的應(yīng)用場(chǎng)景。
(3)當(dāng)前,軌跡跟蹤應(yīng)用場(chǎng)景簡(jiǎn)單,參考軌跡也大多較簡(jiǎn)單,軌跡跟蹤控制算法很少得到應(yīng)用于一些極端條件的場(chǎng)景上。在此基礎(chǔ)上,針對(duì)城區(qū)、山區(qū)的復(fù)雜路況,充分利用實(shí)時(shí)感知和預(yù)報(bào)信息,開(kāi)展基于不確定因素的智能汽車運(yùn)動(dòng)軌跡跟蹤與控制方法研究。