付斌 朱煦晗 涂寧寧
(嵐圖汽車科技有限公司,武漢 430000)
主題詞:智能汽車 換道決策 XGBoost 貝葉斯優(yōu)化
換道決策是智能駕駛車輛換道過程中非常重要的一環(huán),也是智能駕駛領(lǐng)域的重點研究方向。國內(nèi)外很多學(xué)者針對智能駕駛汽車換道決策模型開展了深入研究。目前,可以將換道決策模型分為基于規(guī)則的模型和基于人工智能的模型。
基于規(guī)則的模型即人工建立一系列換道規(guī)則,從而作出換道決策,但其無法適應(yīng)復(fù)雜的交通道路條件。人工智能算法具有強大的學(xué)習(xí)能力和分類能力,基于人工智能算法的換道模型成為主流研究方向。其中,神經(jīng)網(wǎng)絡(luò)經(jīng)過訓(xùn)練后可以很好地模擬人類的決策過程,因此被廣泛應(yīng)用。Hunt 等[1]首次將神經(jīng)網(wǎng)絡(luò)模型引入車輛換道決策過程,并證明了其可行性。Dumbuya 等[2]建立了一個三次網(wǎng)絡(luò)的網(wǎng)絡(luò)數(shù)據(jù)聚合(Networks Data Aggregation,NDA)模型,通過車輛位置、速度及交通車的信息即可輸出換道主車的目標(biāo)速度和方向。Meng 等[3]建立了分類回歸樹(Classification and Regression Tree,CART)模型對駕駛員的換道行為進行預(yù)測。Dou等[4]利用支持向量機(Support Vector Machine,SVM)和神經(jīng)網(wǎng)絡(luò)建立了高速車輛換道決策模型。Schubert 等[5]將貝葉斯網(wǎng)絡(luò)(Bayesian Network,BN)用于換道決策模型中;Motamedidehkordi 等[6]建立了基于隨機森林(Random Forest,RF)的換道決策模型。目前,相比于基于規(guī)則的決策模型,基于人工智能的換道決策模型決策準(zhǔn)確率大幅提升,但其模型單一,缺少參數(shù)尋優(yōu)過程,決策準(zhǔn)確率仍有提升空間。本文基于貝葉斯優(yōu)化算法來優(yōu)化XGBoost模型的超參數(shù),以進一步提高模型的決策準(zhǔn)確率。
美國交通運輸部門的NGSIM(Next Generation Simulation)計劃提供了5組數(shù)據(jù)集,其中I-80和US-101為高速數(shù)據(jù)集,本文選取這2 個數(shù)據(jù)集作為研究對象,提取換道數(shù)據(jù)。圖1所示為I-80數(shù)據(jù)的采集路段[7]。
圖1 I-80數(shù)據(jù)采集路段示意
NGSIM 中的數(shù)據(jù)在采集過程中并未采用高精度定位,所以數(shù)據(jù)中存在一定的錯誤和誤差,故本文采用Thiemann 提出的對稱指數(shù)移動平均濾波(symmetric Exponential Moving Average filter,sEMA)算法[8]對數(shù)據(jù)進行平滑處理。sEMA算法的公式為:
式中,xa(ti)、高高高高(ti),i∈[1,Na]分別為車輛a在ti時刻的測量值、擬合值;Na為車輛a軌跡數(shù)據(jù)點的數(shù)量;D=min{3,i-1,Na-1}為考慮數(shù)據(jù)邊界的平滑窗口寬度;Δ=T/dt為平滑寬度;dt=0.1 s為采樣頻率;T為平滑區(qū)域的采樣時間寬度,其取值隨濾波數(shù)據(jù)類別x的不同而不同,當(dāng)x對應(yīng)位置、速度、加速度數(shù)據(jù)時,T分別取0.5 s、1.0 s、4.0 s;。
本文針對I-80數(shù)據(jù)集中的第1882號車輛數(shù)據(jù)進行濾波處理,距離、速度、加速度如圖2所示。
圖2 1882號車行駛狀態(tài)信息濾波結(jié)果
本文研究智能駕駛汽車的換道行為,因此需從US-101 和I-80 數(shù)據(jù)集中提取有效的換道片段供訓(xùn)練模型使用。Wang 等[9]研究發(fā)現(xiàn),車輛的換道時間通常小于20 s,因此可認為一個完整的換道過程時間為20 s,以車輛所在車道發(fā)生變化的時刻為中心時刻,向前、向后各取10 s,作為換道軌跡片段。此外,并非所有換道過程數(shù)據(jù)均可使用,在US-101和I-80中有些換道點靠前或靠后,導(dǎo)致前10 s 或后10 s 并沒有完整的10 s 數(shù)據(jù),故將滿足條件T0-10>Tstart且T0+10<Tend的換道軌跡視為有效換道軌跡,其中T0為車道編號變化的時刻,Tstart為換道起始時刻,Tend為換道終止時刻。圖3 展示了數(shù)據(jù)中有些車輛雖然發(fā)生了換道,但換道軌跡不完整的情況。
圖3 不完整的換道軌跡
此外,仍存在某些換道不成功的軌跡,本文采用KMeans聚類算法進行換道軌跡的聚類,進而從中分離出可用的換道軌跡。令第i段軌跡的橫向位移為一維列向量Xi=(xi(1),xi(2),…,xi(N)),其中xi(k)為第i段軌跡在第k個時間點的車輛橫向位移坐標(biāo),考慮到NGSIM 數(shù)據(jù)集的采樣周期是0.1 s,所以N=200。
聚類前對軌跡進行標(biāo)準(zhǔn)化處理,并計算其間的歐氏距離:
2個軌跡之間的歐式距離可以表征其相似度,歐式距離小于相應(yīng)閾值,表明2個軌跡屬于同一類軌跡,KMeans計算聚類差異值的公式為:
式中,X為當(dāng)前計算的某一條換道軌跡;μ為聚類的中心集;μk為第k類的聚類中心;n為聚類的軌跡數(shù)量。
通過K-Means的聚類,可以分離出換道成功的軌跡和換道失敗的軌跡,如圖4 所示,該聚類結(jié)果是I-80 數(shù)據(jù)中17:00~17:15之間換道的數(shù)據(jù)。
圖4 換道軌跡聚類結(jié)果
提取到可用換道軌跡后,還需提取換道的起始點,本文結(jié)合車輛換道時的橫向位移變化和橫向速度閾值來確定車輛換道的起始點。在判斷換道起點時,以NGSIM數(shù)據(jù)集中車輛車道信息變化的時刻點為基礎(chǔ),向前回溯至車輛的橫向加速度極值點,再以此點作為第2基礎(chǔ)點向后追溯,直到車輛的橫向加速度大于0.2 m/s2,本文以此點作為換道起始點,如圖5所示。
圖5 換道起點判斷示意
車輛的換道行為受到多方因素的影響,不僅包括自車的速度、加速度等,還包括交通車的運動狀態(tài)等。車輛換道過程如圖6所示。
圖6 車輛自由換道行為示意
現(xiàn)有的換道決策算法中,對于換道決策變量的選取不同,本文結(jié)合其他文獻,選取共17 個換道決策變量,可以包含自車和交通車的行駛狀態(tài):換道主車速度vs、換道主車加速度as、當(dāng)前車道前車與主車的縱向距離df=yf-ys、主車與當(dāng)前車道前車的速度差Δvf=vs-vf、主車與當(dāng)前車道前車的加速度差Δaf=as-af、主車與當(dāng)前車道前車的碰撞時間tf=(yf-ys)/(vs-vf)、當(dāng)前車道后車與主車的縱向距離dr=yr-ys、主車與當(dāng)前車道后車的速度差Δvr=vsvr、主車與當(dāng)前車道后車的加速度差Δar=as-ar、目標(biāo)車道前車與主車的縱向距離dtf=ytf-ys、主車與目標(biāo)車道前車的速度差Δvtf=vs-vtf、主車與目標(biāo)車道前車的加速度差Δatf=as-atf、主車與目標(biāo)車道前車的碰撞時間ttf=(ytf-ys)/(vs-vtf)、目標(biāo)車道后車與主車的縱向距離dtr=ytr-ys、主車與目標(biāo)車道后車的速度差Δvtr=vs-vtr、主車與目標(biāo)車道后車的加速度差Δatr=as-atr、主車與目標(biāo)車道后車的碰撞時間ttr=(ytr-ys)/(vs-vtr)。其中,yf、vf、af分別為當(dāng)前車道前車縱向坐標(biāo)、速度、加速度,ys為主車縱向坐標(biāo),yr、vr、ar分別為當(dāng)前車道后車縱向坐標(biāo)、速度、加速度,ytf、vtf、atf分別為目標(biāo)車道前車縱向坐標(biāo)、速度、加速度,ytr、vtr、atr分別為目標(biāo)車道后車縱向坐標(biāo)、速度、加速度。
本文選取Chen[10]提出的重要性評價指標(biāo)F-score對不同的決策變量進行重要性分析排序,其具體計算公式為:
F-score 越大,說明該特征作為決策變量的辨別能力越強,其對決策行為貢獻程度越大。通過計算Fscore得到這17個變量的重要性如圖7所示。
圖7 特征變量的F-score分?jǐn)?shù)
貝葉斯優(yōu)化算法可以縮短優(yōu)化時間,適合解決非凸問題,其計算過程為:
1:fort=1,2,…do
2:最大化采集函數(shù),得到下一個采樣點:xt=argmaxμ(x|D1:t-1)
3:求得采樣點處的函數(shù)值yt=f(xt)
4:更新樣本集合D1:t={D1:t-1,(xt,yt)},并更新函數(shù)f的后驗分布
5:end
在XGBoost決策模型中,有許多超參數(shù)可以自行設(shè)定,本文采用貝葉斯優(yōu)化算法對XGBoost的部分超參數(shù)進行尋優(yōu),需尋優(yōu)的超參數(shù)如表1所示。
表1 XGboost需要尋優(yōu)的超參數(shù)
貝葉斯尋優(yōu)算法的迭代次數(shù)設(shè)定為50次,XGBoost超參數(shù)優(yōu)化過程如圖8 所示,隨著迭代次數(shù)的增多,接受者操作特性(Receiver Operating Characteristic,ROC)曲線的曲線下面積(Area Under Curve,AUC)逐漸升高且趨于穩(wěn)定。
圖8 基于貝葉斯優(yōu)化的XGBoost超參數(shù)優(yōu)化過程
經(jīng)過貝葉斯優(yōu)化算法優(yōu)化后,XGBoost 的超參數(shù)的最優(yōu)值如表2所示。
表2 最優(yōu)超參數(shù)
將超參數(shù)帶入XGBoost模型進行驗證,可以得到其交叉驗證的曲線如圖9所示。
在圖9 中,優(yōu)化后測試集的AUC 顯著提升,且其與優(yōu)化后的訓(xùn)練集之差也明顯小于未經(jīng)優(yōu)化的訓(xùn)練集和測試集之差。其結(jié)果表明,優(yōu)化后,XGBoost 模型的過擬合現(xiàn)象降低,可以有效預(yù)測未知數(shù)據(jù),泛化能力提升。
圖9 XGBoost交叉驗證曲線
本文選取經(jīng)貝葉斯優(yōu)化的XGBoost 決策模型進行測試,同時與未經(jīng)優(yōu)化的XGBoost 模型、支持向量機模型、隨機森林模型和決策樹模型進行比較分析。帶入相同的換道訓(xùn)練樣本集,可以得到不同決策模型在測試集中的ROC 曲線,如圖10 所示,其中假正類率表示模型預(yù)測為正類但實際為負類的樣本占所有實際為負類的樣本的比例,真正類率表示模型預(yù)測為正類且實際也為正類的樣本占所有實際為正類的樣本的比例。ROC 曲線下包絡(luò)的面積即AUC,AUC 越高,其預(yù)測效果越好。本文設(shè)計的貝葉斯優(yōu)化的XGBoost 決策模型的AUC值為0.925。
圖10 不同方法的預(yù)測ROC曲線
其不同換道決策模型的性能測試參數(shù)如表3所示。
表3 不同換道決策模型性能參數(shù)
對以上的換道決策模型進行比較,可以明顯看出,經(jīng)過貝葉斯優(yōu)化的XGBoost 換道決策模型在各項指標(biāo)上均由于其他換道決策模型,提升約4%。
本文基于NGSIM數(shù)據(jù)集進行換道訓(xùn)練測試數(shù)據(jù)的提取,選取XGBoost 決策模型設(shè)計換道決策算法,以貝葉斯優(yōu)化算法來優(yōu)化XGBoost決策模型的超參數(shù),在模型的訓(xùn)練過程中,充分考慮了換道的實際情況,選取了自車和其他交通車等多項運動參數(shù)作為決策變量,最終訓(xùn)練出的模型在US-101 和I-80 數(shù)據(jù)集中決策精確率和準(zhǔn)確率均在90%以上,本文設(shè)計的換道決策模型可為智能駕駛汽車自主換道設(shè)計提供參考。