程 陸,柏海艦
(合肥工業(yè)大學 汽車與交通工程學院,安徽 合肥 230009)
自動駕駛車輛在跟馳前車時,對于前車運行狀態(tài)改變的察覺能力要強于人類駕駛員,因此,自動駕駛車輛具有更高的跟馳安全性。目前的深度學習跟馳模型雖然可以模擬人類的駕駛行為,但這些跟馳模型的訓練集大都基于人類駕駛員的駕駛數據,并沒有考慮到自動駕駛車輛反應時間極短的特點。
從跟馳車隊的制約性可知:前車的運行狀態(tài)發(fā)生改變后,后車也要改變,但前后車運行狀態(tài)的改變并不是同步的,兩者之間的時間延遲被稱為反應時間[1]。考慮到在前車加速和減速時,后車的反應時間存在較大差異,Ozaki[2]使用分段線性函數標定了一個反應時間預測模型,得出當前車減速時后車反應時間更小的結論。Zhang[3]從理論上證明了當前車減速時,后車反應時間更小的觀點。Gazis等[4]則通過搭建的LSTM神經網絡跟馳模型證明了這種異質性的駕駛行為?;谟^察到的車輛數據,Khodayari等[5]將前后車之間的相對速度發(fā)生突變后,后車加減速突變之前的一段時間定義為反應時間,但并未給出計算反應時間的具體模型。Zheng等[6]認為根據通常的駕駛體驗來說,比起感知前后車相對速度的變化,車頭間距的變化更容易被駕駛員察覺,因此,將前后車之間的車頭間距發(fā)生突變后,后車的速度發(fā)生突變前的一段時間定義為反應時間。
深度學習跟馳模型一直是近幾年跟馳模型研究的熱點方向。He等[7]提出了基于K近鄰算法的跟馳模型,得到的是相似交通環(huán)境下最大眾化的駕駛行為。Wei等[8]提出了基于向量機的跟馳模型,將車頭間距、后車速度、相對速度作為模型的輸入,輸出為下一時間步的后車速度,結果顯示預測精度較高。Panwai等[9]構建的BP神經網絡跟馳模型預測精度優(yōu)于Gipps模型,是一種基于生理和心理的跟馳模型。Chen等[10]將IDM模型和Gipps模型集成到構建的長短期駕駛模型中,將預測誤差分別降低了36.7%和35.7%。Wang等[11-12]通過將不同長度的時間序列駕駛數據作為神經網絡的輸入,得出了不同長度歷史數據對跟馳模型預測精度至關重要的結論。此外,采用GRU框架,假設駕駛員的駕駛行為是以時間依賴為前提,將觀察到的最近幾個時間步的駕駛數據作為模型輸入,得到的模型仿真精度大大優(yōu)于現有的跟馳模型。Zhang等[13]基于NGSIM數據集,使用LSTM模型對跟馳和換道同時進行建模,為深度學習跟馳模型的發(fā)展提供了新思路。Zhou等[14]構建的循環(huán)神經網絡跟馳模型在各種交通狀況下的預測精度都幾乎優(yōu)于經典的跟馳模型。高建設等[15]利用KNN模型再現了原始跟馳軌跡,并將多元高斯模型用于跟馳軌跡評價。Ma等[16]開發(fā)的seq2seq跟馳模型可再現跟馳軌跡和異質性駕駛行為,仿真結果優(yōu)于IDM模型與LSTM模型。李林波等[17]設計基于模糊感知時間窗的深度學習跟馳模型,仿真結果能很好擬合實際數據,并模擬了駕駛行為的異質性。吳兵等[18]模擬駕駛人在跟馳過程中采取的動態(tài)駕駛決策過程,并建立了模糊控制規(guī)則,數值分析結果表明,該模型與自然駕駛數據擬合較好。
通過以上分析發(fā)現:目前的深度學習跟馳模型都以提高預測精度為目的,因此,模仿的是人類駕駛員的駕駛特性,如駕車的隨機性和存在反應時間等。考慮到自動駕駛車輛的反應時間極短,且不會出現人駕車的隨機性操作,因此,基于人類駕駛員跟馳數據訓練的深度學習跟馳模型并不完全適用于自動駕駛車?;诖瞬蛔?,首先構建了預測駕駛員反應時間的神經網絡模型,然后利用該模型預測每條人類駕駛員的跟馳軌跡在每個時間步的反應時間,并剔除掉后車在反應時間內的跟馳數據,得到接近于零反應時間、且更符合自動駕駛車輛特性的跟馳數據?;谠摳Y數據,使用LSTM框架重新訓練自動駕駛車輛跟馳模型,并從穩(wěn)定性、交通流特性及安全性方面與傳統(tǒng)的人駕車LSTM跟馳模型進行對比分析。
由于自動駕駛車輛在行駛時僅僅存在機械延遲,因此,自動駕駛車輛對于前車運行狀態(tài)的改變具有極高的靈敏度,能及時根據前車的運行狀態(tài)調整自車速度[19]。要研究自動駕駛車輛和人駕車在跟馳方面的異同點,必須獲得自動駕駛車輛跟馳數據。通過將自動駕駛車輛的反應時間假設為0,以此來簡化加工數據的難度。對經過處理后的數據集進行訓練,構建自動駕駛車輛的深度學習跟馳模型,LSTM-0RT的模型框架如圖1所示。
圖1 LSTM-0RT模型框架流程
考慮到Ozaki模型標定的復雜性和準確性較低等因素,將相鄰車頭間距突變點和后車速度突變點之間的時間作為反應時間,并采用神經網絡反應時間來預測模型,圖2中標注的箭頭內時間即為設定反應時間。對圖2中車頭間距突變點的判斷如式(1)所示,對后車速度突變點的判斷如式(2)所示,式(3)為后車反應時間計算。上述對于車頭間距和后車速度突變點的判斷為第一種情況;第二種判斷車頭間距和后車速度突變點的方法是將式(1)和式(2)判斷大小的符號顛倒過來,式(3)保持不變。
圖2 車頭間距與速度軌跡
(1)
(2)
τ=t1-t0,0≤τ≤2
(3)
式中:t0為時刻突變點;Δx(t0)為t0時刻的車頭間距;t1為突變時刻;v(t1)為t1時刻的后車速度;τ為反應時間,最大取2 s。
文中使用的跟馳軌跡為NGSIM I-80數據集,首先,采用對稱指數滑動平均法對原始跟馳軌跡進行平滑處理,得到相對平滑的跟馳軌跡數據[20],然后使用Python依照上述篩選規(guī)則,篩選出4 896組BP神經網絡訓練樣本。將后車速度、前后車相對速度、后車加速度、車頭間距作為模型輸入,將后車反應時間作為輸出,模型結構如圖3所示。
圖3 反應時間預測模型結構
結合反應時間預測模型對原始跟馳軌跡進行裁剪,得到自動駕駛車輛的跟馳軌跡,選擇其中2條,如圖4所示。由圖4可知,當前車減速時,裁剪后跟馳軌跡相比于原始軌跡會更早地減速,表明其反應更靈敏。
圖4 跟馳軌跡裁剪前后對比
通過比較圖5中不同網絡結構模型產生的誤差大小,決定采用結構4,其訓練誤差如圖6所示。表1中釋義為每個模型結構的具體含義,該模型隱藏層激活函數采用tanh函數,具體如式(4)所示,輸出層激活函數用式(5)表示。
圖5 不同結構模型訓練誤差
圖6 反應時間預測模型訓練誤差
表1 反應時間預測模型不同結構
(4)
(5)
式中:x為神經網絡在每一個隱含層計算出未經過激活的中間變量;λ為樣本中最大反應時間,此處設置為2 s;z為神經網絡輸出層中未經過激活的最終參數,且輸出層只有一個神經元。
LSTM神經網絡在理論上可以考慮超過1 000個時間步長的歷史信息[21],擁有遺忘門和更新門的門控結構不僅可使LSTM模型能從歷史信息中獲取知識,而且隨著時間的推移,會刪除無用信息并保存有用信息;而人類駕駛員在跟馳過程形成的軌跡數據是關于位移、速度、加速度的時序數據,人類駕駛員會基于以往的駕駛行為不斷調整自車駕駛行為,所以,采用LSTM神經網絡對人類駕駛員跟馳行為建模。
由于目前大部分基于深度學習的跟馳模型都將車頭間距、相對速度、后車速度作為模型的輸入[22-23],因此,也將這3個參數作為LSTM跟馳模型的輸入,將后車加速度作為模型輸出。模型的輸入和輸出均為600個時間步長,且錯位一個時間步長,預測的時間間隔為0.1 s。訓練模型的基本參數如表2所示,框架如圖7所示。預測模型的框架如圖8所示,輸入、輸出參數與訓練模型相同,預測的都是后車最后0.1 s的加速度。
表2 LSTM跟馳模型訓練的基本參數和取值
圖7 LSTM跟馳模型訓練框架(T=600)
圖8 LSTM跟馳模型預測框架
文中選取了4段仿真跟馳軌跡,并與原始跟馳軌跡進行直觀比較。從圖9可知LSTM跟馳模型能較好地學習到人類駕駛員的跟馳行為,4張小圖中的數字都表示前后車ID。
為更好地體現跟馳模型在面對不同行駛狀態(tài)前車時的跟馳效果,對于首車行駛狀態(tài)的設定應包含勻速、加速及減速等運行狀態(tài)?;诖?,文中設置的首車行駛過程可分為4個部分:
1)以5 m·s-1的運行速度行駛150 s;
2)以1 m·s-2的加速度行駛15 s;
3)以-1.5 m·s-2的減速度行駛10 s;
4)以5 m·s-1的速度行駛100 s。
所有跟馳車的初始速度設為5 m·s-1,初始車頭間距設定為10 m,仿真時間步長為0.1 s。由于剛開始的仿真速度可能存在一定波動,因此,剔除開始1 000個時間步的仿真結果,取之后1 750個時間步的仿真結果。
3.2.1 LSTM跟馳模型穩(wěn)定性分析
根據3.1中設定的仿真場景,仿真10輛車的速度軌跡和位置軌跡,如圖10所示。圖中實色線條為設置的首車行駛場景,虛線是對LSTM跟馳模型的跟馳行為進行仿真。由圖10(a)可知:隨著首車行駛狀態(tài)的改變,后車能夠及時做出正確反應。在第50 s之前,首車以5 m·s-1的速度勻速行駛,仿真車輛此時的行駛速度也幾乎相同;在第50~75 s之間,首車先加速行駛,接著減速行駛,仿真車輛的行駛狀態(tài)也幾乎與其相同;在第75~175 s期間,首車又回到之前的勻速行駛狀態(tài)。雖然仿真車輛在這段時間內的速度有所波動,但考慮到駕駛員駕車存在某些隨機性,而且仿真車最后也都回到了勻速行駛狀態(tài),因此,認為此種波動合理。當車輛處于圖10(a)中的A點時,車頭間距最大。隨著時間的推移,由于前車車速低于后車,所以車頭間距逐漸縮小,但駕駛員并未及時察覺,繼續(xù)保持加速狀態(tài)直到B點,因此,AB兩點間的時間差即為反應時間。
圖10 LSTM跟馳模型仿真軌跡
表3計算了所有仿真車輛的速度方差,可知其呈下降趨勢,速度振幅逐漸衰弱,滿足跟馳理論的漸進穩(wěn)定性[24]?;谝陨戏治觯琇STM跟馳模型滿足實際跟馳情況。
表3 10輛仿真車的速度方差
3.2.2 LSTM-0RT模型穩(wěn)定性分析
根據上述設定的首車行駛場景,對自動駕駛車輛跟馳行為進行仿真,得到速度軌跡和位移軌跡,如圖11所示。實色線條表示首車行駛軌跡,虛線表示對自動駕駛車輛跟馳行為進行仿真的結果。由圖11(a)可知,自動駕駛車輛可根據前車的行駛狀態(tài)及時調整自車的行駛速度,并且所有后車的速度變化趨勢完全和前車相同。由于自動駕駛車輛的反應時間極短,當前車的運行狀態(tài)發(fā)生改變之后,自動駕駛車輛能夠敏銳地察覺到這種變化,并及時做出相應的動作調整。當車輛位于圖11(a)中的C點時,它與前車的車頭間距達到最大值,在此之后,車頭間距由于后車車速小于前車車速而減小,而自動駕駛車輛幾乎同時察覺到了這種變化,并開始不斷減速。通過以上分析說明自動駕駛車輛對前車運行狀態(tài)改變的察覺是極其敏銳的,它可以使跟馳車隊的速度很快達到穩(wěn)定狀態(tài)。
3.2.3 混駛環(huán)境下的跟馳模型穩(wěn)定性分析
為進一步研究不同比例的自動駕駛車輛對跟馳車隊穩(wěn)定性的影響,在仿真的10輛車中分別插入1~9輛自動駕駛車輛,并以插入3輛和6輛自動駕駛車輛為例,得到其仿真速度軌跡(見圖12)。結合圖10(a)和圖11(a)發(fā)現,跟馳車隊中的自動駕駛車輛數越多,車隊越能在短時間內達到穩(wěn)定狀態(tài)。相比于人類駕駛員,自動駕駛車輛的反應更加靈敏,因此,在跟馳車隊中隨著自動駕駛車輛占比的不斷提高,整個車隊的反應靈敏度也會隨之提高。在此前提下,跟馳車隊中的車輛則能更加快速地識別前車的運行狀態(tài),并及時采取制動措施,整個車隊達到收斂的時間也會較之前提前,達到漸進的穩(wěn)定狀態(tài)。當車隊中的車輛全都為自動駕駛車輛,跟馳車隊的收斂速度最快,這和仿真結果具有一致性。
圖11 LSTM-0RT跟馳模型仿真軌跡
圖12 混駛環(huán)境跟馳速度仿真軌跡
為進一步研究兩種跟馳模型在宏觀交通流上的差異性,文中對LSTM跟馳模型和LSTM-0RT跟馳模型進行交通流仿真。仿真在一個長度為1 000 m的環(huán)形道路上進行,仿真時長為1 000個時間步,每個時間步為0.1 s。所有車輛的初始位置均勻分布在環(huán)形道路上,車輛的初始速度均設定為每秒1/2車頭間距,即車頭時距為2 s,仿真結果如圖13所示。經計算,LSTM跟馳模型仿真最大交通流量為1 485 veh·h-1,LSTM-0RT跟馳模型仿真最大交通流量為1 488 veh·h-1,兩者大致相當。因此,當交通流密度小于94 veh·km-1時,LSTM跟馳模型擁有更大的流量,當密度大于94 veh·km-1時,LSTM-0RT跟馳模型也擁有更大的流量。文中設定LSTM跟馳模型的最大交通流密度為110 veh·km-1,由于當密度大于該值時,仿真會出現速度為負的現象,說明該模型的適用性較差,而LSTM-0RT跟馳模型卻未出現此種情況。
圖13 不同跟馳模型交通流基本情況
為更清晰地反映兩種跟馳模型在不同密度下的跟馳行為,選取交通流密度為50 veh·km-1和100 veh·km-1進行仿真,仿真時間設定為400 s和150 s(見圖14、圖15)。通過分析圖14(a)和圖14(b)發(fā)現:LSTM-0RT跟馳模型的車速早已趨于穩(wěn)定,而LSTM跟馳模型的車速還存在明顯振蕩,說明LSTM-0RT模型的速度收斂明顯快于LSTM模型,與前文分析一致。圖13的交通流基本情況顯示:在低密度下,LSTM跟馳模型擁有更大的流量,這是由于當密度較低時,該模型仿真出的車速存在巨大波動,車隊尚未達到穩(wěn)定狀態(tài),此時計算出的流量會偏大。由圖15可知:LSTM跟馳模型在密度為100 veh·km-1下仿真150 s后,速度不僅沒有達到收斂,還出現了為負值的情況,說明該模型在高密度下的局限性,而LSTM-0RT模型的仿真速度很早就達到了收斂狀態(tài)。通過以上分析,得出LSTM-0RT模型具有以下特點:
圖14 不同跟馳模型交通流仿真(密度=50 veh·km-1)
圖15 不同跟馳模型交通流仿真(密度=100 veh·km-1)
1)LSTM-0RT模型可使交通流在低密度和高密度下都快速達到穩(wěn)定狀態(tài);
2)當交通流密度較大時,LSTM-0RT跟馳模型擁有更大的流量;
3)LSTM-0RT跟馳模型在高密度下的適用性優(yōu)于LSTM跟馳模型;
4)LSTM-0RT模型仿真的最大交通流量與LSTM模型相當。
通過圖10(a)和圖11(a)的對比發(fā)現,自動駕駛車輛相對于人駕車在跟馳速度方面的差異十分顯著。首先,人駕車在第100~125 s之間出現了速度隨機波動性,然而自動駕駛車輛的跟馳速度并未出現這種隨機的速度波動,因此,自動駕駛車輛的跟馳行為更科學。其次,人駕車的跟馳速度在第175 s時才趨近于收斂,但自動駕駛車輛在第125 s之前跟馳速度就已經達到了收斂,所以,跟馳車隊可以在時間上快速地達到穩(wěn)定狀態(tài)。
通過比較圖10(a)和圖11(a)的跟馳車速度,發(fā)現人駕車在跟馳前車時存在速度的隨機波動,因此,跟馳的平均速度大于圖11(a)中的自動駕駛車輛,具體數值如表4所示。
表4 人駕車和自動駕駛車輛的仿真速度 m·s-1
由于人駕車的平均跟馳車速均大于自動駕駛車輛,所以比較圖10(b)和圖11(b)的跟馳距離可以發(fā)現,自動駕駛車輛與前車的車頭間距更大,具體跟馳距離如圖16所示。碰撞時間(TTC)是指當前后車以目前的速度行駛,在發(fā)生碰撞之前的時間間隔,由于其計算簡單,而被廣泛接受[25]。由于在仿真后期,前后車速度幾乎相同,此時TTC接近無窮大,因此,文中計算了前后車的車頭時距,該參數體現了駕駛員的最大反應時間[26],具體結果如圖17所示。由圖17可知,自動駕駛車輛每一輛跟馳車的車頭時距都大于人駕車,因此,具有更高的安全性。
圖16 不同跟馳模型的跟馳距離
圖17 不同跟馳模型的車頭時距
首先構建了基于BP神經網絡的駕駛員反應時間預測模型,并將傳統(tǒng)的LSTM人駕車跟馳模型與反應時間預測模型相結合,構建了LSTM-0RT模型。
利用仿真先分析了LSTM跟馳模型的速度和位移圖,發(fā)現人駕車在跟馳時,雖然10輛車的速度都會出現隨機性波動,但隨著時間的推移,跟馳車都會收斂到相同速度,從而達到穩(wěn)定跟馳狀態(tài)。利用LSTM-0RT模型仿真出來的自動駕駛車輛的跟馳狀態(tài)有別于人駕車,具體表現為自動駕駛車輛在跟馳時,速度一直和前車保持相同的變化趨勢,沒有出現人駕車跟馳時的隨機波動,這也說明了自動駕駛車輛的感知能力強于人駕車。除此之外,自動駕駛車輛在跟馳時速度達到穩(wěn)定狀態(tài)所需的時間比人駕車縮短了50 s。通過分析兩種跟馳模型的交通流特性發(fā)現:LSTM-0RT跟馳模型在不同交通流密度下的適用性明顯優(yōu)于LSTM跟馳模型,既不會出現低密度下長時間的交通振蕩現象,也不會出現高密度下的速度為負現象。在混駛環(huán)境中,自動駕駛車輛的比例越高,跟馳車隊達到漸進穩(wěn)定狀態(tài)所需的時間就會越短,更有利于交通流的穩(wěn)定?;赥TC的計算結果也表明,自動駕駛車輛相較于人駕車擁有更高的安全性。基于以上分析,LSTM-0RT模型具有以下特點:
1)跟馳車隊車輛的速度收斂快于LSTM跟馳模型;
2)對前車運行狀態(tài)變化的感知能力強于LSTM跟馳模型;
3)在不同交通流密度下的適用性優(yōu)于LSTM跟馳模型;
4)跟馳安全性高于LSTM跟馳模型。