蔣司楊 李朝 雷毅 王暢
(長安大學,西安 710064)
主題詞人機共駕 換道決策 極端梯度提升 網格搜索
智能駕駛系統(tǒng)難以快速地實現(xiàn)完全自動化,因此在較長一段時間內智能汽車將處于人機共駕的過渡階段。在人機共駕階段,智能駕駛系統(tǒng)實現(xiàn)駕駛輔助、沖突軌跡糾正以及正確地接管駕駛控制的前提是已具備充分理解駕駛人換道意圖與決策的能力。
對駕駛人換道意圖與決策的識別已成為智能駕駛領域研究的熱點問題,國內外學者對此開展了大量研究。在換道意圖識別研究中,通常將駕駛行為劃分為換道與車道保持,或左換道、右換道與車道保持。因此,換道意圖辨識模型本質上屬于分類識別問題,常見的分類識別算法主要基于機器學習,如支持向量機(Support Vector Machine,SVM)、邏輯回歸(Logistic Regression,LR)、隱馬爾可夫模型(Hidden Markov Model,HMM)、人工神經網絡(Artificial Neural Network,ANN)、決策樹(Decision Tree,DT)及其集成模型、動態(tài)貝葉斯網絡等。模型的輸入參數(shù),即換道行為的表征參數(shù),可分為交通環(huán)境參數(shù)、車輛動態(tài)參數(shù)和駕駛人行為參數(shù)。
近年來,隨著深度學習的迅速發(fā)展,國內外學者將循環(huán)神經網絡應用于駕駛人換道行為識別中并取得了一定的成果。然而,深度學習算法在模型的可解釋性及可靠性方面仍需進一步提升。
目前,針對換道意圖與決策識別的研究大多是判斷駕駛人是否執(zhí)行換道,或者是換道方向的辨識,缺乏對換道意圖和決策的具體劃分。這樣可能導致智能駕駛系統(tǒng)無法準確理解駕駛人意圖,從而引發(fā)人機沖突等矛盾,在帶來安全隱患的同時降低了駕駛人對智能系統(tǒng)的信任度及接受度。換道具體決策的辨識也屬于分類識別問題,而如何對換道決策進行細分并選取合適的特征參數(shù)序列是換道決策識別研究中的關鍵。
為實現(xiàn)智能系統(tǒng)對駕駛人換道決策的充分理解,本文將駕駛人換道決策細分為強制換道、等待換道、放棄換道和車道保持,在駕駛人實車換道數(shù)據基礎上,通過分析換道過程提出以自車距目標車道右側車道線距離、轉向盤轉角、自車與后車的相對距離的換道行為特征參數(shù)組合,并建立基于網格搜索-極端梯度提升(Grid Search-eXtreme Gradient Boosting,GS-XGBoost)模型的駕駛人換道決策識別模型。
換道場景可分為自由換道場景和非自由換道場景。自由換道場景是指自車車道前方無車且目標車道后方無來車;非自由換道場景是指自車車道前方有車且目標車道后方有來車。為了使智能駕駛系統(tǒng)充分理解駕駛人的換道意圖,考慮將換道決策細分。
在自由換道場景下,駕駛人的換道決策比較簡單,通常是換道和車道保持2類。而在非自由換道場景中,尤其是當目標車道后方有快速來車的危險情況時,駕駛人會采取多模式的換道決策。因此選取非自由換道場景下目標車道有快速后車的危險情況來研究駕駛人的換道決策。此種場景下的換道決策可分為強制換道、等待換道和放棄換道3類。
如圖1 所示,強制換道時,自車認為此時換道不會與快速逼近的后車產生交通沖突,遂決定快速駛入目標車道;放棄換道時,自車認為此時換道有引發(fā)交通沖突的可能,于是放棄換道,重新駛回當前車道的中心;等待換道時,自車認為此時換道有引發(fā)交通沖突的可能,決定等待后車駛過,再駛入目標車道。等待換道情況1在真實道路中表現(xiàn)為自車在等待目標車道后車駛過的過程中,與目標車道的車道線保持一定距離,待后車駛過后再進入目標車道;等待換道情況2在真實道路中表現(xiàn)為自車在等待目標車道后車駛過的過程中以低速靠近車道線,待后車駛過,再進入目標車道。等待換道策略多見于擁堵或低速路段,在高速路段并不多見。
圖1 非自由換道場景下的3種換道決策示意
公開招募43名駕駛人開展實車試驗以獲取換道數(shù)據,其中女性駕駛人3名,男性駕駛人40名。試驗招募的駕駛人均身體健康,無影響駕駛安全的疾病。為保證數(shù)據的代表性,以及考慮到自車換道時與后方快速來車博弈的危險性,所招募的被試駕駛人駕齡均在5 年以上,具有豐富的駕駛經驗,基本信息如表1所示。
表1 被試駕駛人基本信息
被試駕駛人的自然駕駛數(shù)據會被試驗車上搭載的多傳感數(shù)據采集平臺采集和儲存,該平臺由4 個部分組成,即自車運動參數(shù)采集系統(tǒng)、周圍交通環(huán)境參數(shù)采集系統(tǒng)、傳感器數(shù)據傳輸系統(tǒng)和駕駛過程記錄系統(tǒng)。采集平臺通過GPS、車載陀螺儀、車載在線診斷接口(On-Board Diagnostics,OBD)和先進預警系統(tǒng)(Advanced Warning System,AWS)定位車輛軌跡并采集試驗車的航向角、經緯度、速度、與左右車道線的距離等自車運動參數(shù)信息;通過ESR型毫米波雷達采集試驗車輛與周圍車輛的相對距離、相對速度、相對角度等自車周圍環(huán)境參數(shù)信息;通過6通道視頻監(jiān)控系統(tǒng)以影像的形式直觀地記錄駕駛過程。平臺通過控制器局域網(Controller Area Network,CAN)總線進行數(shù)據傳輸,將CAN采集卡與電腦連接,從而實現(xiàn)自車和周圍車輛行駛數(shù)據的實時采集和記錄。采集平臺部分設備如圖2所示。
圖2 多傳感器數(shù)據采集平臺
為了盡可能多地包含自動駕駛系統(tǒng)的應用場景,本試驗在多類型路段上進行,路段信息如表2所示。
表2 試驗路段信息
被試駕駛人被隨機分配到各試驗線路上,且各試驗路線上除試驗車外,其他車輛均為正常行駛的車輛。在試驗開始前,被試駕駛人在研究人員指導下熟悉試驗車。試驗過程中,被試駕駛人不佩戴任何儀器,按照自身駕駛習慣自由行駛在指定路線上,并自主換道。由于本文關注后方快速來車對自車換道決策的影響,因此試驗存在一定的危險性。為保證試驗的安全,試驗車上配備一名安全員,安全員僅在出現(xiàn)危險時為被試駕駛人提供協(xié)助,其他情況下不干擾駕駛。另外,為避免因被試駕駛人駕駛負擔過重而導致的安全問題,單次試驗的持續(xù)時間控制在1 h左右。
為了研究目標車道后方快速來車對自車換道行為的影響,所提取的數(shù)據應包含換道行為開始后自車的運動信息和后方快速來車的運動數(shù)據。換道樣本數(shù)據提取與處理過程如下:
a.確定大致?lián)Q道片段:將自車已開始執(zhí)行換道操作,但還未進入目標車道時,目標車道上車速大于自車車速的后車定義為后方快速來車。利用視頻和雷達確定自車換道時是否有后方快速來車,若有,則根據視頻大致確定換道片段并截取這一片段的所有數(shù)據。
b.換道數(shù)據提?。簩④囕v開始持續(xù)產生橫向運動的時刻定義為換道行為的起點,將車輛首次結束持續(xù)橫向運動的時刻定義為換道行為的終點。利用數(shù)據采集平臺上的AWS實時采集試驗車左前輪與車輛所處車道左側車道線的距離、右前輪與車輛所處車道右側車道線的距離。雖然和可以在一定程度上反映車輛的橫向運動情況,但是當試驗車中心越過目標車道右側車道線后,系統(tǒng)的參考車道會從當前車道變?yōu)槟繕塑嚨溃@會使數(shù)據發(fā)生突變。
為了便于觀測車輛的橫向運動情況,將目標車道右側車道線設置為參考車道線,換算得到自車左側車輪與目標車道的距離,如式(1)和圖3所示:
圖3 AWS測距示意
式中,為車道寬度,取375 cm。
根據換算得到的可以觀測自車的橫向運動情況,從而確定準確的換道起止時刻,然后從步驟a中確定的換道片段中提取出相應的換道樣本數(shù)據。通過確定換道起止時刻如圖4所示。
圖4 確定換道行為起止點示意
c.換道決策類型確定:結合視頻確定步驟b 中的換道樣本數(shù)據屬于本文定義的何種換道決策,為提取的換道樣本數(shù)據打上標簽。
d.數(shù)據濾波處理:由于傳感器精度有限,采集的數(shù)據存在階躍性,這種階躍性會弱化數(shù)據內部之間的關聯(lián)性,因此采用卡爾曼濾波處理換道樣本數(shù)據,部分參數(shù)濾波結果如圖5所示。
圖5 相對距離參數(shù)濾波結果
按照以上步驟共篩選出強制換道樣本280組,放棄換道樣本356 組,等待換道樣本44 組,共計680 組換道樣本數(shù)據。由于車輛換道為持續(xù)過程,還篩選了300組車道保持樣本數(shù)據。
換道決策識別時刻是指模型識別出換道決策時識別時間窗口所處的時間點,通過分析該指標可以判別模型的識別能力。為了避免自車在換道時與目標車道后方快速來車產生交通沖突,識別模型應在自車壓線前識別出換道行為,因此在選取識別時刻時應參考換道的壓線時間。對換道樣本的壓線時間進行統(tǒng)計分析,結果如圖6所示。識別時間窗口選取得過長會降低識別模型的實時性和準確性;選取得過短則會導致時間窗包含的運動信息過少,從而降低識別模型的準確性。綜上,選取強制換道的壓線時間均值1.9 s為最長的識別時刻,選取0.4 s為最短的識別時刻,采用滑動時間窗口的方法建立駕駛人換道行為識別模型?;瑒訒r間窗口的步長設置為0.1 s,即前、后窗口中有-0.1 s的數(shù)據是相同的。
圖6 換道壓線時間統(tǒng)計分布
換道過程就是自車通過轉動轉向盤向目標車道做持續(xù)橫向移動的過程,而3種換道決策本質上就是自車與目標車道后方快速來車博弈后的不同結果。因此選取轉向盤轉角、與目標車道右側車道線的距離以及自車與后車的相對距離作為換道決策識別模型的特征輸入參數(shù)。其中,和為車輛動態(tài)參數(shù),為交通環(huán)境參數(shù),2類參數(shù)的組合可以提高識別模型的魯棒性。
將篩選出的980 組樣本在1.9 s 識別時間窗內的特征參數(shù)數(shù)據歸一化到[-1,1]。并對比各特征參數(shù)在不同換道決策上的分布,結果如圖7所示。從圖7a和圖7b中可知,強制換道決策在和的分布范圍最大,車道保持在和的分布范圍最小,符合前述對換道過程的分析。歸一化后的值越接近1,表明后車距自車越遠,越接近-1表明后車距自車越近。而當后車距自車較近時,駕駛人會傾向于認為此時換道會與后車發(fā)生交通沖突,從而決定放棄換道或等待換道。由圖7c可知,等待換道和放棄換道的值較接近-1,尤其是等待換道,且它們的分布范圍也較小,符合2.1節(jié)對不同換道決策的定義。
圖7 不同換道決策的特征參數(shù)對比
進一步對數(shù)據進行單因素方差分析,結果如表3所示。結果表明,、和在4類換道決策單元間有顯著差異,且具有統(tǒng)計學意義。值為樣本數(shù)據的組間方差與組內方差的比值,值越大,表明組間差異越顯著。從表3的值大小可知,在單元樣本間的差異最為顯著,這是因為是駕駛人在進行換道決策時最為直觀的參考因素。
表3 單因素方差分析
模型對4 類換道決策的識別過程本質上是一個多分類過程。因為XGBoost 在處理多分類問題上性能優(yōu)越,所以本文選擇XGBoost算法,利用轉向盤轉角、自車與目標車道右側車道線距離和自車與后車的相對距離組成的換道行為特征參數(shù)組來建立各識別時間窗口下的換道決策識別模型。將篩選的樣本數(shù)據按照4∶1 的比例隨機劃分為訓練集和測試集,如表4所示。
表4 換道行為識別模型所用數(shù)據 組
XGBoost 是一種基于Cart 決策樹的提升集成算法,在訓練前無需對數(shù)據進行預處理也可保證極高的準確率,并且能對算法進行詳細解釋,其強大的并行處理能力也能極大提高運算速度。駕駛人換道行為模式識別模型的訓練集為:
式中,=684 個為樣本數(shù)量,每個樣本具有3 個特征;x={}為第個樣本的特征數(shù)據;y為第個樣本的標簽,即換道決策類型,y=1~4分別代表強制換道(LC-M)、放棄換道(LC-Y)、等待換道(LC-W)和車道保持行為(LK)。
XGBoost 是一種基于提升(Boosting)集成思想的加法模型,訓練時采用貪心算法學習,每次迭代都學習一棵Cart 決策樹來擬合之前(-1)棵樹的預測結果與真實結果的損失,算法中的迭代次數(shù)即為訓練決策樹的棵數(shù)。XGBoost 算法的核心是通過訓練達到目標函數(shù)的最優(yōu)值,目標函數(shù)為:
重新定義一棵樹:
式中,ω為各葉子結點的權重向量;(x)為一棵樹的結構,作用是將輸入x映射到某個葉子結點。
重新定義一顆樹的復雜程度:
式中,為葉子結點的數(shù)量;和為常數(shù)。
將屬于第個葉子結點的所有樣本特征數(shù)據x劃入一個葉子結點樣本集合I,此時目標函數(shù)可表示為:
定義:
將式(8)帶入式(7)得目標函數(shù)的最終表達式為:
XGBoost 通過迭代學習提高其預測準確性,但是迭代次數(shù)過多會導致模型過擬合,降低模型的泛化性。為了避免識別模型過擬合,對訓練集進行5折交叉驗證以得到最佳的迭代次數(shù)。
XGBoost的參數(shù)分為模型參數(shù)和超參數(shù)2類。其中超參數(shù)需要人為設定,并且可通過調整超參數(shù)的值提升算法的學習性能。本文采用網格搜索(Grid Search,GS)算法調整超參數(shù)。GS 是一種窮舉的搜索方法,它將各超參數(shù)的可能值進行排列組合,然后將各超參數(shù)組合用于模型訓練,利用交叉驗證評估不同超參數(shù)組合模型的表現(xiàn)。對于多分類問題,GS 算法中交叉驗證的結果是預測值和真實值的對數(shù)損失值,使得對數(shù)損失值最小的超參數(shù)組合即為最優(yōu)組合。XGBoost 超參數(shù)解釋及GS調參范圍如表5所示。
表5 XGBoost超參數(shù)及GS調參范圍
本文采用某類換道樣本標簽的召回率(該類樣本中標簽被正確預測的數(shù)量占該類樣本總數(shù)的比例)作為模型對某類換道決策識別性能的評價指標;采用準確率(全體樣本中標簽被正確預測的數(shù)量占全體樣本總數(shù)的比例)作為模型的整體識別性能的評價指標。部分時間窗下的換道行為模型識別結果如圖8所示。
圖8 1.4 s識別時間窗換道行為識別模型混淆矩陣
以1.4 s時間窗下的驗證結果為例,強制換道、放棄換道、等待換道和車道保持的召回率依次為0.785 7、0.828 6、0.600 0和0.900 0,整體準確率為0.826 5。比較不同時間窗下?lián)Q道行為識別模型性能,結果如表6和圖9所示。
由表6和圖9可知:基于GS-XGBoost的識別模型對車道保持的識別性能最好,識別召回率保持在85%~90%范圍內;對等待換道的識別率最低,為60%或70%;放棄換道在絕大部分時間窗下的識別召回率在80%~90%范圍內。強制換道的識別召回率隨時間窗的減小而有減小的趨勢,且波動較大。其原因在于:當駕駛人采取車道保持決策時,基本不對車輛執(zhí)行其他操作,因此表征參數(shù)間的識別規(guī)律比較顯著,模型能較為準確地對其進行識別;等待換道因與放棄換道的特征相似,極易被錯誤分類為放棄換道,另外等待換道的樣本也較少,所以模型對等待換道的識別性能較差;強制換道的平均壓線時間為1.9 s,當識別時間窗較短時,強制換道的特征與其他換道行為比較相似,并且此時數(shù)據集包含的特征信息較少,因此容易被錯誤識別。
表6 基于GS-XGBoost的換道行為識別模型識別結果
圖9 基于GS-XGBoost的換道決策識別模型識別結果
為近一步評估本文建立的換道行為識別模型的識別性能,本文選用經GS改進算法優(yōu)化后的LR、SVM、DT和梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)模型以及LSTM網絡分別建立各識別時間窗下的換道決策識別模型,它們的整體識別準確率和時效性對比分別如圖10和表7所示。如圖10所示,SVM和LR在所有的識別時間窗下的識別性能都低于其他算法,說明這2種算法對4類決策單元特征參數(shù)中隱含的信息挖掘能力較差,無法準確地識別真實的駕駛人換道決策。深度學習算法可以使模型對數(shù)據的理解更加深入。LSTM網絡由于其在處理時序問題時展現(xiàn)出的強大的挖掘能力和深度表征能力,越來越多地被應用到換道意圖識別中。但是由于4類換道決策樣本不均衡,而決策樹集成算法在處理樣本不均衡問題上效果比深度學習好,所以LSTM網絡在各時間窗下的識別準確率都低于GBDT和XGBoost。表7對比了6種算法最高識別準確率和對應的時間窗,由表7可知,XG?Boost可以較早且較準確地將換道決策識別出來。
圖10 各識別時間窗下不同算法識別準確率對比
表7 不同算法模型識別時效性對比
綜上,就時效性和準確性而言,本文建立的基于GS-XGBoost算法的駕駛人換道決策識別模型優(yōu)于列出的其他模型。
為實現(xiàn)智能系統(tǒng)對駕駛人換道決策的準確辨識,本文將換道決策細分為強制換道、等待換道、放棄換道和車道保持,通過分析駕駛人實施4類換道決策時自車的行駛狀態(tài)和周邊環(huán)境,提出了包括與目標車道右側車道線距離、轉向盤轉角和自車與后車的相對距離的換道決策輸入特征參數(shù)的組合方案,采用滑動時間窗法確定了換道決策的識別時刻,并利用訓練集數(shù)據建立了各時間窗下基于GS-XGBoost的駕駛人換道決策識別模型。測試集數(shù)據驗證以及與其他機器學習和深度學習算法的對比結果表明,所提出的識別模型可以較早、較準確地辨識出駕駛人的具體換道決策。細分的換道決策識別模型,可為智能駕駛系統(tǒng)有效理解駕駛人意圖與行為提供技術支撐。
本文的識別模型是在實車試驗數(shù)據的基礎上建立的。真實駕駛條件下,等待換道決策出現(xiàn)得不多,因此樣本數(shù)據不平衡,這是導致模型對等待換道決策識別準確率不夠高的重要原因。后續(xù)考慮多積累等待樣本換道樣本以提高模型的識別準確率。