熊明強,譙 杰,夏 芹
(1.汽車噪聲振動和安全技術(shù)國家重點實驗室,重慶 401122;2.中國汽車工程研究院股份有限公司 重慶 401122)
自動駕駛近年受到全世界廣泛關(guān)注[1-10],普遍認為該技術(shù)可以有效解決交通擁堵,提高交通安全性[1,6,11]。目前一些自動駕駛廠商已經(jīng)進行了大規(guī)模的道路測試,比如谷歌自動駕駛汽車和蘋果自動駕駛汽車。然而,由于交通系統(tǒng)的復(fù)雜性,現(xiàn)在的自動駕駛或多或少都存在著一些安全性問題,導(dǎo)致這些自動駕駛車輛在進行測試時發(fā)生了一系列事故,其主要原因是自動駕駛車輛內(nèi)部的自動駕駛算法不足以應(yīng)對動態(tài)變化的交通環(huán)境。據(jù)研究[12],目前近三分之一的交通事故是由不安全的換道操作導(dǎo)致的。
利用機器學(xué)習(xí)進行人類換道執(zhí)行模型屬于數(shù)據(jù)驅(qū)動模型,其模型參數(shù)需要經(jīng)過大量換道執(zhí)行數(shù)據(jù)的訓(xùn)練而確定。目前,利用機器學(xué)習(xí)進行人類換道軌跡規(guī)劃的研究還很少[13-15],YAO Wen 等[13]將k最近鄰算法應(yīng)用到換道軌跡規(guī)劃中,然而該模型用到的數(shù)據(jù)量非常有限;考慮到已有的機器學(xué)習(xí)算法只能預(yù)測換道車輛的位置,DING Chenxi 等[14]構(gòu)建了兩層BP 神經(jīng)網(wǎng)絡(luò)對車輛換道進行實時預(yù)測,該模型對NGSIM 數(shù)據(jù)[16]進行學(xué)習(xí),在已有研究的基礎(chǔ)上擴大了數(shù)據(jù)量。但是,換道數(shù)據(jù)是一種時間序列,以上兩種機器學(xué)習(xí)方法只是單一的復(fù)制車輛在某個狀態(tài)下的位置,并沒有考慮到換道時每個規(guī)劃步長之間的換道數(shù)據(jù)存在聯(lián)系[17]。在此基礎(chǔ)上,XIE Dongfan 等[15]構(gòu)建了LSTM 神經(jīng)網(wǎng)絡(luò)對車輛換道軌跡進行預(yù)測,對于人類換道軌跡學(xué)習(xí)取得了99%以上的精度。盡管都是在對人類換道行為進行學(xué)習(xí),但這些研究沒有考慮到換道過程中產(chǎn)生的安全性問題,而基于規(guī)則的換道模型對于換道軌跡的數(shù)學(xué)描述不統(tǒng)一,產(chǎn)生了大量的軌跡曲線方程,比如極坐標(biāo)多項式軌跡和五次多項式的軌跡等[18-27]。此外,對何種方程可以最佳地描述換道軌跡曲線尚無定論,當(dāng)前對換道過程的運動學(xué)模型描述也有較大的誤差,考慮到現(xiàn)有方法存在的不足,本文對LSTM 神經(jīng)網(wǎng)絡(luò)進行了改造,提出了一種新的基于安全性敏感的改進長短期記憶網(wǎng)絡(luò)的自動駕駛換道軌跡規(guī)劃模型。
用傳統(tǒng)運動學(xué)描述自動駕駛換道軌跡規(guī)劃的方式存在著誤差大、無法發(fā)現(xiàn)隱形因素之間的關(guān)系、不能充分利用真實數(shù)據(jù)等方面的不足。LSTM[28]神經(jīng)網(wǎng)絡(luò)可以彌補以上不足,且相對其他深度學(xué)習(xí)方法可以更好地處理時間序列數(shù)據(jù),但經(jīng)典LSTM 神經(jīng)網(wǎng)絡(luò)無法對換道數(shù)據(jù)的安全性進行判別和校驗,因此選擇LSTM 神經(jīng)網(wǎng)絡(luò)進行改進。傳統(tǒng)LSTM 神經(jīng)網(wǎng)絡(luò)主要由“遺忘門、輸入門、輸出門、狀態(tài)”組成,這些“門”結(jié)構(gòu)實際上是全連接神經(jīng)網(wǎng)絡(luò)構(gòu)成的,如圖1 所示。
圖1 經(jīng)典LSTM 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
LSTM 神經(jīng)網(wǎng)絡(luò)有著高效的學(xué)習(xí)優(yōu)勢,這種神經(jīng)網(wǎng)絡(luò)被認為是研究和預(yù)測時間序列極佳的方法,但由于神經(jīng)網(wǎng)絡(luò)中隱層神經(jīng)元的物理作用不明確,訓(xùn)練過程不可控,這樣建立的換道軌跡規(guī)劃模型可能隱含著人類不良駕駛習(xí)慣,最終無法滿足安全性和舒適性的換道要求,所以在傳統(tǒng)LSTM 神經(jīng)網(wǎng)絡(luò)中引入“安全門”,在訓(xùn)練過程中對數(shù)據(jù)進行安全性監(jiān)控和校驗,有目的地提高模型安全性,“安全門”輸入的運動學(xué)軌跡包括最優(yōu)軌跡約束和安全性約束數(shù)據(jù),從而提出安全性敏感的自動駕駛換道軌跡規(guī)劃LSTM 神經(jīng)網(wǎng)絡(luò)模型,嵌入結(jié)構(gòu)如圖2虛線框所示。
圖2 改進LSTM 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
在這個結(jié)構(gòu)中,神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)xt包括換道車輛以及周邊車輛的軌跡數(shù)據(jù),xt將會同時被傳遞給各個“門”結(jié)構(gòu)以及嵌入的運動學(xué)模型結(jié)構(gòu),進行神經(jīng)網(wǎng)絡(luò)的迭代訓(xùn)練。改進之后的LSTM 神經(jīng)網(wǎng)絡(luò)如圖3 所示。
圖3 改進LSTM 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
1.1.1 神經(jīng)網(wǎng)絡(luò)各個部分的計算方式
當(dāng)前時刻數(shù)據(jù)傳入長短期記憶網(wǎng)絡(luò)時要決定哪些歷史數(shù)據(jù)需要從細胞狀態(tài)ht-1中刪除。這是由遺忘門決定的:
式中:Wf為遺忘門的權(quán)重;ht-1為上一時刻神經(jīng)網(wǎng)絡(luò)的狀態(tài);xt為NGSIM 數(shù)據(jù)中換道軌跡規(guī)劃數(shù)據(jù);bf為遺忘門的偏置項;σ為一個sigmoid 函數(shù),用于增強神經(jīng)網(wǎng)絡(luò)的非線性擬合能力,其表達式為:
神經(jīng)元刪除歷史數(shù)據(jù)后還需決定哪些新的信息需要被存儲進細胞狀態(tài):輸入門中包括一個類似于遺忘門的結(jié)構(gòu),用于在訓(xùn)練過程中決定需要更新的數(shù)據(jù),然后一個tanh 函數(shù)會從當(dāng)前時刻的輸入數(shù)據(jù)中確定更新的向量,從而更新到神經(jīng)元狀態(tài)中:
式中:Wi為輸入門中決定遺忘的數(shù)據(jù)權(quán)重;bi為對應(yīng)的偏置項;~Ct為準(zhǔn)備更新的數(shù)據(jù)矩陣;Wc為更新數(shù)據(jù)的權(quán)重矩陣;bc為更新數(shù)據(jù)的偏執(zhí)項。tanh 為雙曲正切函數(shù),同樣用于增強神經(jīng)網(wǎng)絡(luò)的非線性擬合能力,其函數(shù)表達式為:
最后決定將要輸出的部分。輸出通過一個sigmoid 函數(shù)層來決定Ct中哪些部分需要被更新,然后將Ct經(jīng)過一個tanh 函數(shù)處理(歸一化),并將遺忘門里sigmoid 層的輸出相乘,從而決定輸出,如式(8)所示。
式中:Ot為神經(jīng)元的預(yù)測輸出值;Wo為輸出門的輸出權(quán)重;bo為輸出門偏置項。
改進后更安全的原因如下,改進前細胞狀態(tài)為:
這樣,更新的數(shù)據(jù)值很有可能等于遺忘的數(shù)據(jù)值,如初始狀態(tài)[ht-1, 0.5xt]經(jīng)過遺忘門之后細胞狀態(tài)變?yōu)閇ht-1, 0.5xt],而輸入門更新的數(shù)據(jù)又恰是0.5xt,那么經(jīng)過輸入門以后,細胞狀態(tài)變回為[ht-1,0.5xt]。顯然,這對于自動駕駛換道的安全性是無法保證的,所以提出的改進LSTM 神經(jīng)網(wǎng)絡(luò)模型彌補了經(jīng)典LSTM 神經(jīng)網(wǎng)絡(luò)在自動駕駛車輛換道軌跡規(guī)劃安全性方面的不足,使訓(xùn)練過程變得部分可控,改進后的細胞狀態(tài)為:
輸出為:
式中:Pt為車輛在運動學(xué)模型經(jīng)過歸一化處理后的動力學(xué)輸出值。
經(jīng)過多次試驗,該模型將改進的LSTM 神經(jīng)網(wǎng)絡(luò)的層數(shù)設(shè)置為兩層,隱層神經(jīng)元個數(shù)為8 個。輸入變量確定為縱向位置x0,橫向位置y1和速度v0,輸出變量為下一時刻規(guī)劃的速度,采取的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)率是0.01。
由于車輛行駛過程中要求加速度連續(xù)變化,所以自動駕駛換道軌跡所采用的多項式曲線不應(yīng)少于3次,為了避免多項式曲線次數(shù)太高造成的參數(shù)求解過于復(fù)雜,將多項式曲線確定為三次多項式曲線。其表達式為:
式中:a0、a1、a2、a3為需要后期確定的參數(shù);xn為換道車輛縱向位置;yn為換道車輛橫向位置。
確定各項參數(shù)有:
式中:θi為規(guī)劃步長起點的航向角。
Gipps 模型[29]是領(lǐng)域內(nèi)經(jīng)典的車輛安全距離模型,可以較好地擬合兩輛跟馳車輛之間的行駛狀態(tài),但其將車輛視作質(zhì)點,沒有考慮車輛的車身長度,所以在經(jīng)典Gipps 模型的基礎(chǔ)上加入車身長度進行改進,作為三次軌跡曲線的約束條件。
車輛換道過程中受到周圍車輛實時的影響,為了保證換道過程的安全性,需要實時檢測周圍車輛的行駛狀態(tài),并對周圍車輛的行駛狀態(tài)進行預(yù)測。
式中:j為車輛n-1;xj(t0)和vj分別為當(dāng)前狀態(tài)各個車輛的縱向位置坐標(biāo)和速度;xj(t)為t時刻車輛j的縱向位置坐標(biāo)。
Gipps 模型求解的是當(dāng)前車輛緊急停車時,后車在經(jīng)過反應(yīng)時間τ后也采取緊急停車動作,從而不和前車發(fā)生碰撞的速度。在經(jīng)典的Gipps 模型中,車身的長度沒有被考慮到,也沒有考慮到實際跟馳過程中前后兩車的時變速度,針對此情況,對經(jīng)典Gipps 模型進行改進,如圖4 所示。
圖4 安全距離示意圖
后車緊急制動距離如式(17)和式(18)所示:
使用的是美國聯(lián)邦高速公路公布的NGSIM[16]數(shù)據(jù)。作為高精度且高可靠性實車數(shù)據(jù),其被廣泛應(yīng)用于車輛研究[30-32]。NGSIM 數(shù)據(jù)包括車輛位置、速度等,非常符合仿真研究的要求。更多詳細的介紹參見相關(guān)文獻。數(shù)據(jù)采集選用的兩段高速公路路段,如圖5 所示。
圖5 NGSIM 高速公路路段示意圖
對于基于LSTM 神經(jīng)網(wǎng)絡(luò)的換道軌跡規(guī)劃模型訓(xùn)練和測試,同樣基于Python 通過深度學(xué)習(xí)的Tensorflow 框架搭建所需的LSTM 神經(jīng)網(wǎng)絡(luò)。
在迭代過程中,訓(xùn)練誤差隨著迭代次數(shù)的增加而變化的情況如圖6 所示。在迭代次數(shù)小于20 次時,訓(xùn)練誤差下降較快,隨著迭代次數(shù)的增加,訓(xùn)練誤差下降緩慢。迭代次數(shù)達到25 次左右時,訓(xùn)練誤差趨于收斂。因此,將基于LSTM 神經(jīng)網(wǎng)絡(luò)的換道軌跡規(guī)劃模型的迭代次數(shù)設(shè)為30 次。
圖6 迭代次數(shù)設(shè)為30 次
如圖7 所示,藍色曲線是理想的安全性換道軌跡曲線,黃色曲線是本模型預(yù)測的換道軌跡曲線,綠色曲線是真實換道軌跡曲線。由圖可知,經(jīng)過本模型的訓(xùn)練和預(yù)測,輸出的軌跡曲線更靠近安全性換道軌跡曲線,又保留了一些人類原始換道軌跡曲線的特征且比人類更早地完成了換道。
圖7 神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)效果
擬用平均絕對誤差(Mean Absolute Error,MAE)以及平均絕對相對誤差(Root Mean Squared Error,MARE)這兩個統(tǒng)計學(xué)中常用的統(tǒng)計量對模型進行誤差統(tǒng)計:
式中:N為測試數(shù)據(jù)樣本數(shù);dr,i為第i輛車的真實值;ds,i為第i輛車的預(yù)測值。
針對實際情況,定義如下:MAEreal和MAREreal分別表示預(yù)測值與真實值的平均絕對誤差和平均絕對相對誤差,這兩個統(tǒng)計量可以表征實際值和預(yù)測值的誤差。
本節(jié)對改進LSTM 神經(jīng)網(wǎng)絡(luò)的輸出軌跡和真實軌跡進行誤差統(tǒng)計,結(jié)果顯示,兩個統(tǒng)計量數(shù)值都比較小,見表1。
表1 誤差對比表
CarSim 是用于車輛動力學(xué)的專用仿真軟件,該軟件可以對駕駛員、路面條件以及空氣動力等方面進行仿真輸入,對車輛制動性、穩(wěn)定性參數(shù)等進行輸出。CarSim可以方便靈活地定義試驗環(huán)境和試驗過程[33]。
將提出的深度學(xué)習(xí)模型輸出的車輛軌跡數(shù)據(jù)作為CarSim 輸入,擬用該軟件對模型軌跡進行可跟蹤性、平穩(wěn)性等參數(shù)的評估。
圖8 顯示了CarSim 在車輛換道成功場景下的換道軌跡、加速度輸出結(jié)果的對比。CarSim 對真實換道軌跡跟蹤情況如圖8a 所示,其中紅色曲線為CarSim 仿真軟件對于原始數(shù)據(jù)的跟蹤結(jié)果,藍色曲線為原始軌跡曲線,可以看出CarSim 跟蹤的換道軌跡曲線和真實換道軌跡曲線相對存在較大誤差。CarSim 對本模型預(yù)測的換道軌跡曲線的跟蹤情況如圖8b 所示,可以看出CarSim 能較完美地跟蹤本模型輸出的換道軌跡,且軌跡很平滑。CarSim 對真實軌跡的加速度仿真結(jié)果如圖8c 所示,可以看出真實軌跡的加速度變化較為劇烈,乘客舒適性體驗不高。CarSim 對本模型輸出軌跡的加速度仿真結(jié)果如圖8d 所示,可見相對真實軌跡的加速度變化而言,CarSim 對于本模型軌跡曲線加速度仿真結(jié)果更均勻,乘客的舒適性體驗較好。
圖8 CarSim 仿真結(jié)果
以研究自動駕駛的車輛換道技術(shù)為目的,在自動駕駛領(lǐng)域提出一種改進LSTM 神經(jīng)網(wǎng)絡(luò)的換道軌跡規(guī)劃算法。從安全性和效率兩個角度入手建立深度學(xué)習(xí)換道軌跡規(guī)劃模型,改進LSTM 神經(jīng)網(wǎng)絡(luò)模型在一定程度上提高了車輛換道過程的安全性,使車輛一邊學(xué)習(xí)一邊利用基于規(guī)則算法對軌跡進行安全性監(jiān)督和修正。另外還驗證了改進LSTM 神經(jīng)網(wǎng)絡(luò)模型的舒適性和效率比真實軌跡更高,并通過Python 仿真結(jié)果分析了換道車輛和周圍環(huán)境車輛對車輛換道過程的影響。雖然常規(guī)換道軌跡規(guī)劃模型在換道執(zhí)行過程中對目標(biāo)軌跡學(xué)習(xí)精度很高,但是忽略了車輛周圍環(huán)境的變化,換道車輛無法對突發(fā)情況做出反應(yīng),因此在安全性方面還存在不足。得到以下主要結(jié)論:
(1)利用本模型可以規(guī)劃出一條合適的自動駕駛換道軌跡,且能保證換道車輛更安全、更舒適地完成換道。
(2)在規(guī)劃過程中,LSTM-NN 模型可能比人更早完成換道,主要是因為該模型不僅考慮了安全性還考慮了效率。
(3)CarSim 的仿真顯示,提出的模型所規(guī)劃出的換道軌跡和速度能夠很好地被自動駕駛跟蹤,車輛行駛穩(wěn)定性良好。