張良 祁永芳 趙曉敏 張國棟 蔣瑞洋
(合肥工業(yè)大學,合肥 230009)
主題詞:無人駕駛 軌跡跟蹤 門控循環(huán)單元 多點預瞄
軌跡跟蹤控制作為無人駕駛系統(tǒng)中關鍵的執(zhí)行層控制技術,主要控制車輛的橫、縱向運動,使車輛沿著參考軌跡行駛,是影響智能車輛安全性與舒適性的關鍵技術[1-2]。
20 世紀80 年代,郭孔輝院士提出“預瞄-跟隨”理論,自此,軌跡跟蹤控制研究主要應用該理論開展[3]。胡杰等[4]提出一種基于模糊線性二次型調節(jié)器(Linear Quadratic Regulator,LQR)的智能汽車路徑跟蹤控制方法,采用單點預瞄PID方法進行轉角補償,并使用模糊調節(jié)策略改善控制器適應性較差的問題,但在初始曲率變化時會出現(xiàn)較大的路徑偏離。查云飛等[5]針對線控轉向車輛的軌跡跟蹤問題,提出基于橫擺角速度對轉向盤轉角的穩(wěn)態(tài)增益修正系數(shù)搭建單點預瞄模型,實現(xiàn)了將預瞄控制與線控轉向變角傳動比控制相結合。程慧等[6]研究了基于兩點預瞄的軌跡跟蹤模型,但在預瞄時間內通過曲率變化較大處,會產生偏差。楊浩等[7]提出了一種基于三點預瞄的智能控制補償駕駛員模型,以車速、航向角、中點側向誤差為輸入,轉向盤轉角為輸出的模糊智能控制駕駛員模型,并對轉向角進行補償校正,但路徑跟蹤的穩(wěn)定性有待改進。張炳力等[8]研究了基于模糊神經網(wǎng)絡的智能汽車軌跡跟蹤控制,利用反向傳播(Backpropagation,BP)神經網(wǎng)絡對車速進行預測,并將其輸出和側向偏差等參數(shù)作為模糊神經網(wǎng)絡的輸入,控制轉向盤轉角,但BP神經網(wǎng)絡和模糊神經網(wǎng)絡的局限性導致跟蹤精度不高。Li等[9]基于循環(huán)神經網(wǎng)絡(Recurrent Neural Network,RNN)的驅動程序模型開發(fā)了一個數(shù)據(jù)驅動的類人駕駛員模型,能在彎曲的道路上獲取轉向盤角度,但在數(shù)據(jù)量較大時會出現(xiàn)梯度爆炸消失的問題。Zhang等[10]基于門控循環(huán)單元(Gate Recurrent Unit,GRU)網(wǎng)絡進行動態(tài)滑坡預測,避免RNN網(wǎng)絡的梯度爆炸消失問題的同時展現(xiàn)了良好的時序預測能力。趙穎等[11]在探究車輛軌跡跟蹤模型的性能時,分別構建基于預瞄的純跟蹤算法、前輪反饋控制算法和模型預測控制(Model Predictive Control,MPC)算法的車輛模型,并在不同工況下進行仿真,結果表明,MPC 模型的跟蹤性能最優(yōu),但是計算復雜度也更大。Pang 等[12]提出了一種非線性模型預測控制(Nonlinear Model Predictive Control,NMPC),通過實車驗證了其能夠提高車輛的軌跡跟蹤能力,但由于模型收斂速度慢,存在一定的延時。
針對預瞄模型受曲率變化影響不穩(wěn)定的問題,本文在前人研究的基礎上建立了多點預瞄軌跡跟蹤模型,同時結合GRU 神經網(wǎng)絡對時序序列良好的預測能力,設計了GRU優(yōu)化的多點預瞄軌跡跟蹤控制模型,以較好地實現(xiàn)對目標道路軌跡的跟蹤,提高軌跡跟蹤控制的循跡精度。
本文采用線性二自由度車輛模型作為控制系統(tǒng)的參考模型,如圖1所示,并作如下假設:車輛以恒定速度行駛在平坦的路面上;前輪轉角足夠小;忽略空氣動力學的影響。
圖1 線性二自由度車輛模型
車輛的軌跡跟蹤控制由側向軌跡跟蹤控制和縱向跟蹤控制組成,而道路預瞄偏差主要由車輛的側向控制影響和決定,因此,這里將車輛動力學模型進行解耦,建立車輛側向動力學模型[13]。
根據(jù)牛頓第二定律,結合車輛前、后輪受力,有:
式中,m為車輛質量;ay為車輛在y方向的加速度分量,由車輛沿車身橫向運動產生的平動加速度和車身橫擺運動產生的向心加速度vxω組成;vx為縱向車速;ω為橫擺角速度;Fyf、Fyr分別為前、后輪側偏力;δf為前輪轉角。
根據(jù)力矩平衡,有:
式中,IZ為轉動慣量;lf、lr分別為質心與前、后軸的距離。
車輛在y方向的加速度分量為:
式中,ψ為航向角。
將式(3)代入式(1),得:
假定汽車前、后輪速度方向與x軸的夾角分別為θvf、θvr,則前、后輪側偏角分別為:
汽車前、后輪受到的側偏力分別為:
式中,Cαf、Cαr分別為前、后輪側偏剛度。
假設汽車以恒定速度運動,可得:
將式(9)、式(10)代入式(1)、式(2),因δf較小,故cosδf≈1,化簡并整理可得線性二自由度車輛動力學模型的狀態(tài)方程為:
2.2.1 單點預瞄模型
單點預瞄模型[14]假設駕駛員的視線集中于車輛前方固定距離的某一點,且車輛以恒定的車速和航向角行駛,預測車輛在固定的預瞄時間后的軌跡與預期軌跡之間的橫向位移偏差,為使車輛逼近預期軌跡行駛,通過控制算法盡量減小橫向位移偏差,如圖2所示。
圖2 單點預瞄模型
車輛以恒定的車速和航向角沿著預期路徑曲率半徑為r的一段圓弧行駛,令|OP1|=h、|CP1|=d,由圖2可知,預瞄偏差e為:
由余弦定理可得:
式中,γ為質心側偏角。
預瞄偏差e為:
式中,v為車輛速度。
轉向盤轉角δ與前輪轉角δf只相差一個系數(shù),即δ=8δf。
2.2.2 兩點預瞄模型
兩點預瞄模型綜合考慮道路前方遠、近2個區(qū)域的信息來指引行駛,如圖3所示。其中近點為距離車輛前方不遠處的預期路徑上的一點,遠點為彎道行駛時車道內側邊緣上的切點。近點和遠點對應預瞄點的橫向位移偏差分別為e1、e2,如圖3所示。
圖3 兩點預瞄模型
則兩點預瞄總位移偏差為:
式中,ω1=e1/(e1+e2)、ω2=e2/(e1+e2)分別為近點與遠點的預瞄加權系數(shù)。
2.2.3 多點預瞄模型
為了在實際行駛過程中得到更多的道路信息,可采用多點預瞄[16]。預瞄點信息包含大地坐標系中的坐標(x,y)、道路曲率ρ、位移s、道路切線與x軸間的角度ψ。多點預瞄模型如圖4所示,其中Pi為預瞄點,ei為預瞄偏差。
圖4 多點預瞄模型
綜合車速和預瞄時間的影響,擬選取的預瞄距離表達式為:
式中,d0為常量;dp(t)為t時刻預瞄點Pi與車輛質心的距離;tp為預瞄時間。
由圖4可知,各預瞄點的坐標為:
式中,(xp(t),yp(t))為預瞄點Pi的坐標;(xc(t),yc(t))為車輛質心坐標;Ai為第i個預瞄點到車輛質心的距離與擬選取預瞄距離的比值;φ為航向角。
第i個預瞄點的預瞄誤差為:
式中,(xQ(t),yQ(t))為車輛實際位置坐標。
在多點預瞄模型中,各預瞄偏差的權重和即為多點預瞄的總偏差:
式中,ωi=ei/(e1+e2+e3+…+en)為第i個預瞄點的預瞄加權系數(shù),表示對不同預瞄點的重視程度;n為預瞄點數(shù)量。
2.3.1 評價指標
最大位移偏差為:
平均位移偏差為:
均方根誤差為:
2.3.2 對比分析
將上述3種預瞄模型在雙移線路徑上以36 km/h的車速進行仿真對比,橫向位移偏差對比結果如圖5 所示,轉向盤轉角的對比結果如圖6所示。
圖5 3種預瞄模型跟隨雙移線的路徑對比
圖6 3種預瞄模型跟隨雙移線的轉向盤轉角對比
表1和表2所示分別為3種預瞄模型跟隨雙移線的路徑和轉向盤轉角對比結果。由表1、表2可知,當車速為36 km/h 時,多點預瞄的橫向位移綜合偏差最小。其次,在轉向盤轉角方面,多點預瞄的轉角平順性明顯優(yōu)于單點和兩點預瞄模型,但在曲率變化較大處跟隨效果不佳。
表1 3種預瞄模型跟隨雙移線的路徑對比結果分析
表2 3種預瞄模型跟隨雙移線的轉向盤轉角對比結果分析
GRU 是RNN 的一種,與長短期記憶(Long-Short Term Memory,LSTM)相同,是為了解決長期記憶和反向傳播中的梯度等問題而提出的。GRU神經網(wǎng)絡的記憶單元結構如圖7所示[17-18]。
圖7 GRU網(wǎng)絡記憶單元結構
在t時刻,GRU的輸入為xt,前一時刻隱藏層狀態(tài)為ht-1。首先將xt和ht-1連接成新的向量,作為重置門和更新門的輸入:
式中,rt為重置門的輸出;Wrx為重置門對應輸入的權重矩陣;Wrh為重置門對應隱藏層的權重矩陣;[xt,ht-1]為xt和ht-1連接而成的輸入向量;br為重置門的偏置矩陣;zt為更新門的輸出;Wzx為更新門對應輸入的權重矩陣;Wzh為更新門對應隱藏層的權重矩陣;bz為更新門的偏置矩陣;σ(x)=1/(1+e-x)為sigmoid 激活函數(shù),輸出值的范圍為(0,1)。
輸入轉換、單元狀態(tài)更新:
最后計算出當前時刻隱藏層輸出的ht:
GRU網(wǎng)絡的評價指標為平均絕對誤差:
GRU 神經網(wǎng)絡由1 個輸入層、2 個隱藏層和1 個輸出層組成,在訓練過程中,每個隱藏層含有50 個神經元,GRU 的學習率為0.001,迭代次數(shù)為150 次,在PyCharm中進行代碼編寫及運行。
由CarSim和Simulink聯(lián)合仿真得到的車輛車速、橫向位移偏差、橫擺角速度、前一時刻轉向盤轉角[19]數(shù)據(jù)作為GRU 網(wǎng)絡的輸入,輸出預測的下一時刻轉向盤轉角如圖8所示。
圖8 GRU網(wǎng)絡優(yōu)化示意
訓練樣本共2 600 組,將車輛無橫向偏差通過預期路徑時得到的參數(shù)作為GRU 網(wǎng)絡訓練數(shù)據(jù),將車輛采用多點預瞄模型通過預期路徑時輸出的參數(shù)作為驗證數(shù)據(jù),訓練過程如圖9 所示,網(wǎng)絡訓練的均方根誤差為0.13 m,平均絕對誤差為0.11 m。預期路徑與GRU網(wǎng)絡優(yōu)化驗證路徑對比如圖10 所示,由圖10 可見,GRU 網(wǎng)絡對軌跡跟蹤具有良好的效果。
圖9 GRU模型訓練誤差與驗證誤差曲線
圖10 預期路徑與GRU網(wǎng)絡優(yōu)化路徑對比
針對上述模型,在合肥工業(yè)大學駕駛模擬器上進行驗證。駕駛模擬器由仿真硬件平臺、已校準的車輛模型和試驗管理軟件共同組成,并將其整體稱為硬件在環(huán)(Hardware-In-the-Loop,HIL)系統(tǒng),如圖11所示。
圖11 駕駛模擬器基本組成
設置預期路徑分別為雙移線路徑和S型曲線路徑,給定恒定車速為36 km/h,基于車輛二自由度模型,分別搭建多點預瞄軌跡跟蹤模型和GRU 優(yōu)化跟蹤模型,利用駕駛模擬器進行相關操作,如圖12 所示。驗證結果對比如圖13、圖14所示。
圖12 駕駛模擬器驗證過程
圖13 多點預瞄和GRU算法跟隨雙移線結果對比
圖14 多點預瞄和GRU算法跟隨S型曲線結果對比
多點預瞄模型輸出的位移偏差是每個時刻預瞄道路多個點的平均位移偏差,在曲率變化較大處雖然相比單點、兩點預瞄模型的精度有所提高,仍然存在一定的偏差,而GRU 網(wǎng)絡具有對時序序列數(shù)據(jù)強大的預測能力和收斂能力,兩者結合可以大幅度改善多點預瞄模型的跟蹤精度和穩(wěn)定性。
表3、表4所示為多點預瞄和GRU網(wǎng)絡優(yōu)化的雙移線路徑和轉向盤轉角對比結果,表5和表6所示為多點預瞄和GRU 網(wǎng)絡優(yōu)化的S 型路徑和轉向盤轉角對比結果。從表3~表6 的試驗結果可以看出,基于GRU 神經網(wǎng)絡優(yōu)化的多點預瞄軌跡跟蹤模型在雙移線道路和S型道路上均具有良好的跟蹤特性,跟蹤精度高,且轉向盤轉角平順。
表3 多點預瞄和GRU算法跟隨雙移線的路徑對比結果分析
表4 多點預瞄和GRU算法跟隨雙移線的轉角對比結果分析
表5 多點預瞄和GRU算法跟隨S型曲線的路徑對比結果分析
表6 多點預瞄和GRU算法跟隨S型曲線的路徑對比結果分析
本文針對智能汽車的軌跡跟蹤精度問題,基于預瞄理論和神經網(wǎng)絡模型,提出了一種基于GRU 神經網(wǎng)絡優(yōu)化的多點預瞄軌跡跟蹤模型。該模型在雙移線路徑和S 型曲線路徑上均較單一的預瞄模型有更佳的跟蹤效果。
驗證結果表明,GRU 優(yōu)化的軌跡跟蹤模型在直道行駛和彎道行駛時均能實現(xiàn)較高的精度和較好的穩(wěn)定性,展現(xiàn)了良好的跟蹤能力。