肖宗鑫,李曉杰,肖宗爍,張志文,董小瑞
(1.中北大學(xué) 能源動(dòng)力工程學(xué)院,太原 030051;2.東北林業(yè)大學(xué) 經(jīng)濟(jì)管理學(xué)院,哈爾濱 150040)
由于在提升車輛主動(dòng)安全性、改善交通效率以及降低能耗等方面的巨大潛能,無人駕駛技術(shù)已經(jīng)成為當(dāng)前車輛行業(yè)的研究熱點(diǎn)[1-2],而軌跡跟蹤是無人駕駛車輛的研究重點(diǎn)之一[3]。
模型預(yù)測控制(MPC)[4-5]具有很高的控制精度,且便于添加約束條件,在過程控制中被廣泛應(yīng)用[6]。Borrelli等[7]、Falcone等[8-9]設(shè) 計(jì)了MPC控制器,實(shí)現(xiàn)了車輛前輪的自動(dòng)轉(zhuǎn)向,較好地完成了軌跡跟蹤任務(wù);ATTIA等[10]基于非線性模型預(yù)測控制設(shè)計(jì)了側(cè)向控制器,計(jì)算負(fù)擔(dān)大,不適于高速工況;對于線性模型預(yù)測控制,李培新等[11]只考慮了運(yùn)動(dòng)學(xué)因素的影響,王秋等[12]僅建立了2自由度的車輛動(dòng)力學(xué)預(yù)測模型,孫銀?。?3]研究了車輛在低附著路面的軌跡跟蹤問題,將最高安全速度限定在12 m/s內(nèi);線性時(shí)變模型預(yù)測控制實(shí)時(shí)計(jì)算量相對較小,但當(dāng)狀態(tài)偏離線性化工作點(diǎn)時(shí)可能會(huì)產(chǎn)生較大的預(yù)測誤差從而導(dǎo)致系統(tǒng)不穩(wěn)定[14];鄒凱等[15]考慮輪胎力進(jìn)入非線性區(qū)[16]的情況,設(shè)計(jì)了增量線性MPC(ILTV-MPC)提高了計(jì)算的實(shí)時(shí)性。
HU Jianjun等[17]提出利用模糊控制對ILTVMPC補(bǔ)償控制,但模糊控制器不具備自適應(yīng)能力,無法滿足復(fù)雜的行駛工況,且缺乏理論上的穩(wěn)定性證明;引入包絡(luò)線約束的ILTV-MPC優(yōu)化方法[18-19]和變步長的模型離散化方法[20-22]僅集中于對轉(zhuǎn)向的優(yōu)化;BROWN M等[23]提出了N-MPC并進(jìn)行了實(shí)車驗(yàn)證,但可能陷入局部最優(yōu)。
傳統(tǒng)MPC對系統(tǒng)不確定性的處理能力有限,當(dāng)系統(tǒng)模型描述不準(zhǔn)確或者存在外部擾動(dòng)時(shí),往往難以實(shí)現(xiàn)既定的控制目標(biāo)[24]。神經(jīng)網(wǎng)絡(luò)具有并行運(yùn)算能力強(qiáng)、學(xué)習(xí)和容錯(cuò)能力強(qiáng)等優(yōu)點(diǎn),研究基于神經(jīng)網(wǎng)絡(luò)的自適應(yīng)軌跡跟蹤算法具有重要的實(shí)際意義,其中RBF(徑向基函數(shù))網(wǎng)絡(luò)是連續(xù)函數(shù)的最佳逼近[25]。同時(shí),為了滿足不確定性系統(tǒng)的控制需求,魯棒模型預(yù)測控制是未來的發(fā)展方向[26]。
本研究在ILTV-MPC基礎(chǔ)上,利用RBF的局部逼近特性,設(shè)計(jì)了RBF自適應(yīng)補(bǔ)償控制器對MPC模型的不精確部分進(jìn)行逼近;但由于在逼近過程中仍會(huì)存在誤差,進(jìn)而將RBF神經(jīng)網(wǎng)絡(luò)與魯棒控制相結(jié)合,設(shè)計(jì)了RBF魯棒優(yōu)化控制器,將逼近誤差作為外部干擾予以抑制;應(yīng)用Lyapunov函數(shù)推導(dǎo)了隱含層網(wǎng)絡(luò)權(quán)值訓(xùn)練規(guī)則,并證明了2個(gè)控制系統(tǒng)的穩(wěn)定性。最后,搭建Simulink/Carsim聯(lián)合仿真平臺(tái)對3種軌跡跟蹤控制系統(tǒng)進(jìn)行對比仿真驗(yàn)證。
采用3自由度車輛-輪胎模型進(jìn)行動(dòng)力學(xué)分析,為簡化計(jì)算,在較為準(zhǔn)確地描述車輛動(dòng)力學(xué)過程的基礎(chǔ)上,進(jìn)行如下假設(shè):①假設(shè)無人駕駛車輛只做前輪轉(zhuǎn)向;② 忽略車輛垂向運(yùn)動(dòng)、縱向和橫向空氣動(dòng)力學(xué)的影響;③忽略懸架運(yùn)動(dòng)及其對耦合關(guān)系的影響;④用非線性單軌模型描述車輛運(yùn)動(dòng),不考慮載荷左右轉(zhuǎn)移。
利用Pacejka提出的魔術(shù)公式(magic formula,MF)對每個(gè)控制周期進(jìn)行線性化處理,計(jì)算出適用范圍更大的輪胎縱向力、側(cè)向力和回正力矩等輸出變量,得到輪胎時(shí)變模型,進(jìn)而結(jié)合車輛3自由度單軌模型[4]。
得到基于上述假設(shè)的3自由度車輛非線性動(dòng)力學(xué)模型:
式中:a、b分別為質(zhì)心到前、后軸的距離;m為車輛整備質(zhì)量;Iz為車輛繞z軸的轉(zhuǎn)動(dòng)慣量;δf為前輪轉(zhuǎn)角;φ為質(zhì)心橫擺角;Cl為輪胎縱向側(cè)偏剛度;Cc為輪胎橫向側(cè)偏剛度。
由車身坐標(biāo)系和慣性坐標(biāo)系之間的轉(zhuǎn)換關(guān)系,可得:
將車輛的動(dòng)力學(xué)模型近似線性化,在任意點(diǎn)(ξt,ut)處進(jìn)行泰勒展開并只保留1階項(xiàng),忽略高階項(xiàng),則可得到:
對式(4)進(jìn)行近似離散化處理,同時(shí)結(jié)合系統(tǒng)的狀態(tài)量和狀態(tài)量參考值之間的偏差,表示為:
式中各狀態(tài)系數(shù)矩陣、控制系數(shù)矩陣和輸出系數(shù)矩陣為:
設(shè)定系統(tǒng)的預(yù)測時(shí)域?yàn)镹p,控制時(shí)域?yàn)镹c,從而實(shí)現(xiàn)模型預(yù)測控制算法的預(yù)測功能。
車輛動(dòng)力學(xué)模型雖已經(jīng)過一定程度的簡化,但仍有較大的計(jì)算復(fù)雜度,而且系統(tǒng)的模型是實(shí)時(shí)變化的,可能會(huì)出現(xiàn)規(guī)定時(shí)間內(nèi)無法得到最優(yōu)解的情況,所以引入松弛因子,使每次優(yōu)化都能得到可行解。由文獻(xiàn)[4]優(yōu)化目標(biāo)函數(shù)設(shè)為以下形式:
式中:ρ表示權(quán)重系數(shù);ε表示松弛因子;Q表示輸出偏差的權(quán)值矩陣,R表示控制增量的權(quán)重系數(shù)。
為保證車輛能夠平穩(wěn)地跟蹤期望軌跡,設(shè)計(jì)了前輪轉(zhuǎn)角及其增量約束、質(zhì)心側(cè)偏角約束、加速度約束和輪胎側(cè)偏角約束,其中為防止求解失敗,在加速度約束中引入松弛因子,設(shè)為軟約束。
將ILTV-MPC每一步帶約束的目標(biāo)函數(shù)優(yōu)化求解問題轉(zhuǎn)換為如下二次規(guī)劃問題以方便計(jì)算機(jī)求解:
式中:yhc為硬約束輸出;ysc為軟約束輸出;yhc,min和yhc,max為硬約束輸出極限值;ysc,min和ysc,max為軟約束輸出極限值。
在每個(gè)控制周期內(nèi)完成對式(8)的求解后,可以得到控制時(shí)域內(nèi)一系列控制輸入增量:
將得到的控制序列中的第1個(gè)元素作為實(shí)際輸入增量,可得到未來時(shí)刻的輸入量:
Δut作用于系統(tǒng)的當(dāng)前時(shí)刻,系統(tǒng)執(zhí)行這一控制量直到下一時(shí)刻,在新的時(shí)刻,系統(tǒng)根據(jù)狀態(tài)信息重新預(yù)測下一段時(shí)域的輸出,再次求解優(yōu)化目標(biāo)函數(shù),可得到一個(gè)新的控制增量序列,再將其作用于系統(tǒng)的下下個(gè)時(shí)刻,循環(huán)往復(fù),形成最優(yōu)滾動(dòng)控制[4]。
如此,完成了增量線性時(shí)變模型預(yù)測軌跡跟蹤控制器的建立。
由于在建立ILTV-MPC預(yù)測模型過程中進(jìn)行了諸多假設(shè)和簡化,這些假設(shè)和簡化的存在必然會(huì)導(dǎo)致控制器模型存在一定的不精確部分f,進(jìn)而導(dǎo)致軌跡跟蹤誤差的增大,因此,設(shè)計(jì)了RBF自適應(yīng)補(bǔ)償控制器對不精確部分進(jìn)行逼近。
將建立的車輛動(dòng)力學(xué)模型式(1)以狀態(tài)方程的形式表示:
令q=[Y ]φT,則可將式(11)寫為
式中:A0、B0和C0在實(shí)車模型中為未知參數(shù),但在本節(jié)設(shè)計(jì)的車輛動(dòng)力學(xué)模型中若暫時(shí)忽略建模過程中的假設(shè)和簡化,可認(rèn)為其是已知量,即式(12)所示的車輛動(dòng)力學(xué)模型是精確的,則控制律暫可設(shè)計(jì)為:
將式(13)代入式(12),可得:
此時(shí)可認(rèn)為系統(tǒng)是閉環(huán)穩(wěn)定的,但由于真實(shí)的車輛模型很難得到,故假設(shè)實(shí)際的車輛模型為:
將式(13)代入實(shí)際的車輛模型式(15),可得到
式中:ΔA=A-A0、ΔB=B-B0、ΔC=C-C0。結(jié)合式(14)(16)可取ILTV-MPC控制器中由于建模過程的假設(shè)和簡化而產(chǎn)生的不精確部分為f=
因此,控制律(13)可修正為
本文建立的RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為2-5-1,輸入向量為橫向位置和橫擺角誤差e及其誤差變化率隱含層以高斯函數(shù)作為核函數(shù);輸出向量為模型的不精確部分。
隱含層高斯基函數(shù)按下式計(jì)算:
式中:x為網(wǎng)絡(luò)的輸入;cj為第j個(gè)節(jié)點(diǎn)的中心值向量;bj為第j個(gè)節(jié)點(diǎn)的高斯基函數(shù)基寬值;h(x)=[h1h2h3h4h5]T為高斯基函數(shù)的輸出;ω為神經(jīng)網(wǎng)絡(luò)權(quán)值。
假設(shè)x=(e˙e)T,可得到在控制律(17)下的誤差狀態(tài)方程:
由文獻(xiàn)[23]可知,RBF神經(jīng)網(wǎng)絡(luò)的建模誤差η是有界的,假設(shè)其上界為 ηsup,即 ηsup=
因此,RBF神經(jīng)網(wǎng)絡(luò)輸出的估計(jì)值為:
由此可得到車輛動(dòng)力學(xué)模型前輪轉(zhuǎn)角:
針對本節(jié)控制系統(tǒng),采用Lyapunov穩(wěn)定性分析的方法對雙移線期望軌跡的數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)權(quán)值訓(xùn)練。
定義Lyapunov函數(shù)為:
式中:γ為待定系數(shù),本節(jié)γ取20;P為對稱正定矩陣,且滿足Lyapunov方程:
對V求導(dǎo)并代入式(21)(25)得到:
由式(28)可知,Q的特征值越大,P的特征值越??;建模誤差上界ηsup越小時(shí),x的收斂半徑越小,所建立的控制器補(bǔ)償能力越好,軌跡跟蹤效果越好。因此,本節(jié)設(shè)計(jì)的控制系統(tǒng)是穩(wěn)定的。
由此,完成了RBF神經(jīng)網(wǎng)絡(luò)對ILTV-MPC軌跡跟蹤控制器不精確部分的補(bǔ)償控制。
由于RBF神經(jīng)網(wǎng)絡(luò)逼近過程中仍會(huì)存在一定的逼近誤差,因此將RBF神經(jīng)網(wǎng)絡(luò)和魯棒控制相結(jié)合,利用魯棒抑制外界干擾的特性,將逼近誤差作為外部干擾,設(shè)計(jì)了RBF魯棒優(yōu)化控制器,對其予以抑制。
仍采取所設(shè)計(jì)的2-5-1結(jié)構(gòu)的RBF神經(jīng)網(wǎng)絡(luò),但定義輸入向量為:
式中,α為待定系數(shù),經(jīng)多次仿真實(shí)驗(yàn)測試,α值取0.3。
當(dāng)考慮模型不精確部分和外部干擾時(shí),式(12)可修正為:
式中:f為模型的不精確部分;d為外部干擾。
通過采用前饋項(xiàng)進(jìn)行非線性補(bǔ)償,取控制律為:
ε表示RBF神經(jīng)網(wǎng)絡(luò)的逼近誤差,結(jié)合式(30)和(31),可得到系統(tǒng)的狀態(tài)誤差方程:
結(jié)合式(32),式(29)可轉(zhuǎn)化為:
控制器u控制律設(shè)計(jì)為:
系統(tǒng)的L2增益可體現(xiàn)控制系統(tǒng)對外界干擾的抑制能力,控制系統(tǒng)的干擾抑制問題可歸結(jié)為設(shè)計(jì)控制器使L2增益盡可能小或者小于給定值γ,γ>0[27]。
對于上述閉環(huán)控制系統(tǒng),設(shè)定評價(jià)信號(hào)z=pe=px1,若其中的參數(shù)p滿足:
式中:ε0為給定常數(shù),則該閉環(huán)系統(tǒng)的L2增益小于給定值 γ,γ值取0.1。
針對建立的閉環(huán)控制系統(tǒng),定義Lyapunov函數(shù)為:
對V求導(dǎo),同時(shí)代入式(34)(35),可得:
取自適應(yīng)律為:
結(jié)合式(38)(39)可知
根據(jù)L的定義,可知
由HJI(Hamilton Jacobi Issacs)不等式定理可知,此時(shí)控制系統(tǒng)L2增益小于γ,性能指標(biāo)滿足J≤γ,即本節(jié)設(shè)計(jì)的閉環(huán)控制系統(tǒng)是穩(wěn)定的。
綜上所述,完成了RBF魯棒優(yōu)化控制器對RBF補(bǔ)償控制的改善,即完成了對ILTV-MPC軌跡跟蹤控制器的再次優(yōu)化。
針對所設(shè)計(jì)的RBF補(bǔ)償-ILTV-MPC和RBF魯棒-ILTV-MPC兩種控制系統(tǒng),無人駕駛車輛的輸入前輪轉(zhuǎn)角δf由ILTV-MPC軌跡跟蹤控制器輸出δf0和RBF補(bǔ)償控制器或者RBF魯棒控制器輸出δf1共同組成。
系統(tǒng)控制框圖如圖1、2所示。
圖1 RBF補(bǔ)償-ILTV-MPC系統(tǒng)控制框圖
圖2 RBF魯棒-ILTV-MPC系統(tǒng)控制框圖
搭建Simulink和Carsim聯(lián)合仿真平臺(tái),其中Carsim測試車型選用E-Class,SUV。設(shè)置了不同縱向行駛速度和路面附著系數(shù)的3種仿真工況:①v=30 km/h,μ=0.8(工況1);②v=50 km/h,μ=0.8(工況2);③v=50 km/h,μ=0.4(工況3),分別對優(yōu)化前后3種控制系統(tǒng)進(jìn)行不同工況下的雙移線[9]仿真對比。仿真過程中參數(shù)值見表1。
表1 仿真參數(shù)設(shè)置
控制器的軌跡跟蹤精度通過橫向位置及橫擺角的跟蹤誤差判定,無人駕駛車輛在3種雙移線仿真工況下的橫向位置Y隨橫向位置X跟蹤結(jié)果及誤差e1隨時(shí)間t變化如圖3、4所示。
由圖3、4可知:在工況1條件下,ILTV-MPC軌跡跟蹤控制器橫向位置最大誤差為0.125 7 m,經(jīng)RBF自適應(yīng)補(bǔ)償控制后減小至0.077 02 m,約38.73%,均方根誤差減小32.35%;經(jīng)RBF魯棒優(yōu)化控制后減小至0.039 68 m,約68.42%,均方根誤差減小60.29%;隨著速度的提高,誤差逐漸增大,在工況2條件下,與傳統(tǒng)ILTV-MPC相比,RBF補(bǔ)償-ILTV-MPC均方根誤差減小23.24%,RBF魯棒-ILTV-MPC均方根誤差減小49.01%。
圖3 橫向位置軌跡跟蹤結(jié)果
圖4 橫向位置誤差
在良好路面上,3種控制系統(tǒng)均可較好地完成雙移線路徑的軌跡跟蹤。RBF魯棒控制較RBF補(bǔ)償控制可進(jìn)一步提高ILTV-MPC控制器的跟蹤精度。
在工況3條件下,仿真前期可較好地完成軌跡跟蹤,但后期由于控制量(δf)大幅度增大而出現(xiàn)較大偏差,雖車輛仍處于可控狀態(tài),但易發(fā)生轉(zhuǎn)向失控等危險(xiǎn)工況。與傳統(tǒng)ILTV-MPC相比,RBF補(bǔ)償-ILTV-MPC均方根誤差減小20.38%,RBF魯棒-ILTV-MPC均方根誤差減小45.86%。此時(shí)經(jīng)RBF魯棒控制優(yōu)化后的控制器在仿真前期精度雖有所下降,但在可接受范圍內(nèi)。
當(dāng)車輛以較高速度行駛在附著系數(shù)小的路面上時(shí),3種控制系統(tǒng)在仿真后期均出現(xiàn)不同程度側(cè)滑;RBF魯棒控制較RBF補(bǔ)償控制可進(jìn)一步減小ILTV-MPC控制器的誤差,減輕車輛側(cè)滑程度,在一定程度上提高車輛行駛穩(wěn)定性,減少危險(xiǎn)的發(fā)生。
車輛在3種工況下橫擺角φ隨橫向位置X跟蹤結(jié)果如圖5所示。
圖5 橫擺角軌跡跟蹤結(jié)果
由圖5可知,2種經(jīng)RBF優(yōu)化后的ILTV-MPC控制器,對橫擺角的跟蹤雖然精度有所提高,但仍存在一定時(shí)間的延遲。
此外,經(jīng)多次仿真可知,ILTV-MPC軌跡跟蹤控制器最高安全縱向行駛速度為67 km/h,當(dāng)速度超出最高安全速度時(shí),橫向位置出現(xiàn)明顯偏差,車輛發(fā)生大幅度側(cè)滑;經(jīng)RBF自適應(yīng)補(bǔ)償控制后的控制器雖未有效提高臨界縱向行駛速度,但橫向位置偏差明顯減小,車輛側(cè)滑程度減弱;經(jīng)RBF魯棒優(yōu)化后的控制器最高安全縱向行駛速度可明顯提升至90 km/h。
3種控制系統(tǒng)不同縱向行駛速度橫向位置跟蹤結(jié)果如圖6所示。
圖6 不同縱向速度的橫向位置跟蹤結(jié)果
設(shè)計(jì)了RBF補(bǔ)償-ILTV-MPC和RBF魯棒-ILTV-MPC 2種控制系統(tǒng),與傳統(tǒng)ILTV-MPC軌跡跟蹤器相比,均可提高軌跡跟蹤精度。當(dāng)以30 km/h速度行駛在良好路面時(shí),與傳統(tǒng)ILTV-MPC相比,RBF補(bǔ)償-ILTV-MPC最大誤差減小約38.73%;RBF魯棒-ILTV-MPC最大誤差減小約68.42%。結(jié)果表明,經(jīng)RBF魯棒控制優(yōu)化后的ILTV-MPC控制器與經(jīng)RBF補(bǔ)償后的控制器相比,可進(jìn)一步減小軌跡跟蹤誤差,提高車輛的行駛穩(wěn)定性。
但本研究僅考慮了3種工況,未能完全體現(xiàn)控制器所有工作環(huán)境,且優(yōu)化后的2種控制系統(tǒng)對于橫擺角的跟蹤仍存在一定時(shí)間的延遲,導(dǎo)致誤差的產(chǎn)生;同時(shí)經(jīng)RBF魯棒優(yōu)化后的ILTV-MPC控制器臨界速度僅提升至90 km/h,對于高速下的無人駕駛車輛無軌跡跟蹤效果還需進(jìn)一步改善。
下一步計(jì)劃對2種控制系統(tǒng)的實(shí)時(shí)性進(jìn)行研究,并于多種工況下進(jìn)行實(shí)驗(yàn)驗(yàn)證。