付智俊, 郭啟翔, 何 薇, 謝 斌
(東風汽車股份有限公司商品研發(fā)院, 湖北 武漢 430000)
自動駕駛作為一種能夠替代駕駛員并通過完備的控制算法來優(yōu)化車流行駛軌跡、避免交通事故的先進技術,已經發(fā)展成為車輛領域的研究重點。根據周邊環(huán)境,主要分為結構化道路與非結構化道路的自動駕駛[1]。結構化道路主要指車輛視野良好、周車行駛軌跡比較規(guī)律、具有明顯交通標示及車道線的道路,例如高速公路、大型工廠及景區(qū)內部道路,是目前研究的主要對象。
換道是超車、并線、會車、避撞等自動駕駛的基本工況,Ammoun等[2]提出自動換道是自動駕駛重要的組成部分,車道變換不僅是4%-10%事故的原因,而且10%的道路延誤也是由不正常換道引起的。換道問題研究對促進自動駕駛車輛的高效運行有十分重要的意義。目前的換道研究多集中于單車換道情形[3]與V2X (Vehicleto Everything) 換道[4]。單車情形中有駕駛模型[5]、換道意圖判別[6]、風險判斷[7]、軌跡規(guī)劃與跟蹤、新型控制架構等研究方向。
對于自動駕駛車輛換道軌跡規(guī)劃,最常用的是曲線插值方法。2000年,Piazzi和Bianco[8]兩位學者發(fā)現五次多項式曲線可以增加車道變換軌跡的魯棒性。Papadimitriou和Tomizuk[9]在2003年也使用五次多項式曲線來表示車道變換軌跡,并針對避免固定障礙物的情況提出了換道軌跡規(guī)劃模型。之后很多學者針對此進行了拓展性研究。2016年,Thomas[10]針對五次多項式提出了一種優(yōu)化解法,通過將一個確定性約束改為軟約束,使軌跡可以滿足更多約束條件。
在換道軌跡確定之后,需要設計軌跡跟蹤策略以確保車輛沿既定軌跡行駛。目前常用的軌跡跟蹤策略有PID控制、MPC控制等。D. de Bruin et al.[11]在2004年使用比例為-微分(PD) 控制器實現車輛換道控制。文獻[12-13]提出了具有不同控制特性的控制器,這些控制器屬于傳統(tǒng)PID控制的變體。C. Kreuzen使用MPC控制方法控制換道過程,并發(fā)現模型預測控制(MPC) 的控制方法比PID控制更有前景,因為它能夠預測未來的情況并直接將控制算法實施到實時算法中。
為解釋換道過程中本車與周圍車輛和耦合運動,Nilsson[14]提出了一種有效的車道變換操縱方法,用于具有時變速度的自動車輛。羅禹貢[4]提出了一種實時調整的動態(tài)軌跡規(guī)劃算法,在使用優(yōu)化方法生成五次多項式曲線的時候把車輛視為一個剛體,考慮車輛橫向加速度的約束。香港大學Xu[15]提出一種動態(tài)換道設計方法,通過人機界面進行換道時機和換道狀態(tài)的提醒,該方法仍然需要駕駛員進行最終換道決策。北京理工大學劉凱[16]提出了動態(tài)換道模型,并且使用了可變步長離散化方法用于得到預測時域的動力學計算模型,將換道過程分為側重縱向控制和側重橫向控制的兩個連續(xù)階段,通過實車實驗取得了良好的效果。
然而,目前常見的策略為單次規(guī)劃-實時控制,對實時規(guī)劃控制的研究相對較少。實時規(guī)劃控制在每個時點都可以基于前車換道意圖、當前車輛狀態(tài)以及剩余換道時間重新規(guī)劃換道軌跡,并且根據跟蹤模型計算控制量。由于軌跡實時更新,自車可以在軌跡規(guī)劃層面上對跟蹤誤差進行彌補,并且基于當前狀態(tài)規(guī)劃的換道軌跡將更加適合自車后續(xù)換道行為。本文參照這一思路,提出基于前車意圖識別的自動駕駛車輛實時避障換道策略,設計實時避障換道控制架構并對其中關鍵技術要點進行研究,最后進行仿真驗證。
在一般換道算法中,軌跡規(guī)劃僅在換道開始時進行調用,計算結果會作為軌跡跟蹤模塊的參考軌跡并保持至換道結束。本文提出的實時規(guī)劃-跟蹤算法將軌跡規(guī)劃算法在每個控制周期進行調用,作為當前周期下的最佳參考軌跡,直至換道結束,其原理如圖1所示。
該算法的基本思想:在每個控制時點均存在最佳換道軌跡,最佳換道軌跡的評價方法體現在換道軌跡生成模塊中,并且隨著換道軌跡生成方法的不同而不同。一般換道算法中,車輛控制誤差會導致除換道剛開始外的其他時間控制點均無法同時滿足位移、速度和加速度條件,從而無法獲得最佳換道軌跡,進而影響換道的穩(wěn)定性。實時規(guī)劃-跟蹤算法的控制誤差同樣存在,但其在每個控制時點重新考慮位移、速度和加速度條件,將滿足這些條件的軌跡作為新的參考軌跡,從而保證了在每個控制點該算法均能采用最佳換道軌跡。由圖1可知,該控制架構主要包含環(huán)境感知 (即前車駕駛員的駕駛意圖)、軌跡規(guī)劃與跟蹤以及最后的車輛動力學控制。
圖1 實時規(guī)劃跟蹤算法原理
前車在換道時有明顯不同于非換道情形的運動學特征,本文針對原車道前車換道駕駛意圖,采用基于NGSIM數據集的隨機森林模型識別該非線性關系。NGSIM是美國聯邦公路局針對4種道路I-80、US-101、Lank、Peach進行的數據采集,旨在通過向公眾提供權威數據的方式提高對道路效率、智能駕駛、輔助駕駛、交通系統(tǒng)分析等研發(fā)項目的支持。本文選取了US-101車道上的車輛信息,通過分析車輛換道前的行為,構建合理的前車換道意圖識別模型。
隨機森林是在決策樹模型的基礎上采用bootstrap采樣方式而獲得的分類方法。決策樹的每個節(jié)點通過隨機特征子空間的方式選擇分裂點進行分裂,最終這些決策樹將按照投票原則輸出隨機森林模型的最終分類結果,整體的決策流程如圖2所示,其中不同決策樹的參數獨立訓練。
圖2 隨機森林決策流程
決策樹模型是一種廣泛應用的樹狀分類器。通過特征工程獲得的特征需要具有非線性關系,并且每個特征在樹狀結構中占據一個節(jié)點。每個節(jié)點從根節(jié)點出發(fā),建立子節(jié)點的同時主要做兩項工作,一是根據評價指標選擇最佳分裂特征,二是選擇分裂屬性的分裂值。決策過程沿著樹狀結構不斷進行,直到滿足建樹停止條件。
根據分裂時選擇的評價指標不同,決策樹算法分為ID3、C4.5和CART共3種。本文隨機森林采用CART方法。它選用的評價標準是基尼系數,并且采用二分裂的方式遞歸創(chuàng)建決策樹?;嵯禂档挠嬎惴椒ㄈ绻?(1) 所示。在建樹選擇節(jié)點時,CART算法選擇基尼系數下降最多的特征屬性作為分裂節(jié)點。該特征將該節(jié)點分為左右2個子節(jié)點,以此類推直至滿足建樹的停止條件。
3.1.1 隨機森林的內容
隨機森林是bagging集成方法在決策樹模型中的應用,主要包括以下三個部分。
1) Bootstrap采樣:根據決策樹的數量,隨機又放回地抽取等量樣本,將每次抽取的樣本輸至對應的決策樹模型。需要說明的是,這里每次抽取由于都是有放回的,所以屬于等權重采樣。
2) 分裂特征選擇:針對每個決策樹模型,使用CART方法選擇。
3) 多數投票:每個決策樹首先進行獨立類別判斷,然后隨機森林模型通過投票方式最終決定判別結果。
3.1.2 隨機森林的評價指標
隨機森林模型屬于二分類模型,采用以下評價指標。
1) 準確率:所有預測正確的樣本/總的樣本,對于正誤判斷在兩種類別中沒有偏向情形側重選擇該評價指標。
2) 精確率:將正類預測為正類/所有預測為正類。
3) ROC曲線:ROC曲線上每個點反映分類問題在一定閾值條件下的判斷結果,橫縱坐標點分別表示具有典型含義的比例值。其中,真正類率(True Positive Rate,TPR),即正確地判斷為換道的樣本在所有換道樣本中所占比例;假正類率 (False Positive Rate,FPR),即錯誤地判斷為換道的樣本在所有不換道樣本中所占比例。一般隨著閾值的變化,真正類率與假正類率反向變動。ROC曲線刻畫的是二者之間的變化關系。如果隨機分類,那么ROC曲線將趨近斜率為1的直線。
4) AUC ( Area Under Curve):圖3中實線下方的面積。該參數考慮了連續(xù)分類閾值下的模型綜合識別效果。隨機分類的AUC接近于0.5,理想分類器的AUC結果為1,優(yōu)秀的分類器AUC 結果往往位于0.85~0.95之間。
圖3 ROC和AUC
特征構造是機器學習模型中最為重要的一個環(huán)節(jié),它從本質上決定了在該特征組合下樣本是否可分。本節(jié)首先從數據集中拆分單個車輛的行駛軌跡,劃分之后如圖4a所示,然后計算車輛換道次數,定義從小號車道換至大號車道為右換道,從大號車道換道至小號車道為左換道,車道號未發(fā)生變化的為不換道,統(tǒng)計結果如圖4b所示。數據集中的車輛總數為1916輛,其中80%以上的車輛在整個過程中均沒有發(fā)生換道現象;271輛車發(fā)生左換道,共計349車次;140輛車發(fā)生右換道,共計161車次。為了增加換道樣本數據,將識別到的右換道數據通過對稱方式轉化為左換道數據,轉化前后如圖5所示,轉化之后有效換道共計510車次。沒有換道行為的數據提取結果如圖6所示,有效非換道共計8632車次。需要說明的是,數據集的局部X坐標為垂直于車道中心線的方向,局部Y坐標表示垂直車道中心線方向,為便于展示和理解,本文圖表中除附有“局部”字樣外,X方向均表示平行車道線方向,Y方向表示垂直于車道線方向。
圖4 數據集軌跡圖和換道次數占比
圖5 換道樣本提取
圖6 不換道樣本提取
通過分析樣本特征并結合實際工程中的經驗,本課題最終選擇了5個樣本特征作為隨機森林模型的訓練特征。特征集合為以下5個。
1) 縱向速度均值:車輛的換道決策與自車縱向車速并不直接相關,車速主要影響換道其他特性參數。例如當車速較大時,換道過程中駕駛員控制橫向速度在較小的范圍,從而防止出現失穩(wěn)的情形,車速較小時,橫向速度可以較大??v向車速與其他參數存在非線性關系從而需要納入到特征選擇當中。
2) 縱向加速度:縱向加速度與換道密切相關,通常目標車道的車速要大于原車道,所以換道行為發(fā)生前一定時間窗口內,車輛縱向加速度一般為正值,并且持續(xù)一段時間。該特征采用均值的方式處理。
3) 橫向速度:換道為發(fā)生前的一段時間窗口內,車輛必定存在橫向速度以及加速度。而對于非換道行為,車輛可能存在波動的橫向速度和橫向加速度,但是該特征通過均值化后一般接近于0,從而與換道行為的特征存在差別,因此該特征選入模型訓練的特征,且針對該特征采用均值化的方式處理。
4) 橫向加速度:車輛在換道行為發(fā)生前一般會產生較為明顯的橫向加速度,該特征采用均值化的方式進行處理。
5) 偏離車道中心的距離:在車輛正常駕駛時,車輛往往位于車道中心線附近,一旦車輛偏離車道中心線并且持續(xù)一定時間,那么有較大把握可以認為前車具有很強的換道意圖。
基于相關文獻查閱及調試經驗,本文對比了主要的3個參數:學習率、決策樹個數、決策樹最大深度。綜合考慮訓練時間和誤差收斂情況,決策樹數目,即基學習器的數目設定為250,其他參數及設置見表1。
表1 模型調試結果
圖7 精確率與召回率訓練結果
圖8 準確率與AUC訓練結果
當學習率取0.05,0.10,0.15,決策樹最大深度取3,4,5,6時,訓練集合測試集的結果如圖7和圖8所示。精確率評價指標在參數空間內均保持在90%以上,在最佳參數組合下可以達到93.73%。精確率意味著模型判斷出原車道前車出現換道意圖時其確實發(fā)生換道行為的概率。精確值較高表示出現誤報的概率小,換道策略在接收到換道意圖識別結果時做出的安全條件判斷修正更加合理。召回率只有5%左右,這意味著為了保持較低的誤判率,換道意圖識別模型會避免對大多數的換道行為的認定。準確率和AUC在全參數組合下均非常接近于1,這一方面是因為模型中不換道模型數據量較大,對其判斷正確的樣本較多,另外一方面也體現了模型判斷的正確性。
多項式曲線是較為常見的軌跡生成模型,相較于其他模型如樣條曲線模型,該模型的參數具有更明確的物理含義而且模型方便求解,降低給實時系統(tǒng)帶來的計算負擔。本文采用五次多項式曲線,在給定換道始末橫縱向位置及車輛橫縱向狀態(tài)時,可以通過線性運算得到在車道方向和車道垂向的五次樣條軌跡。五次多項式軌跡模型表達式如公式 (2) 所示,邊界約束條件如公式(3) 所示,參數含義如圖9所示。
圖9 五次多項式軌跡參數含義
在橫縱向上分別通過求解可得系數如公式 (4)、 (5)所示。
在換道結束時車輛進入目標車道,并且處于穩(wěn)定狀態(tài),所以換道終點縱向加速度.. ,橫向速度.,橫向加速度..一般設為0。
針對本車道前車換道和目標車道前車減速兩種工況,本節(jié)設計了統(tǒng)一的安全條件判斷模型,如圖10所示。
圖10 安全條件判斷與控制模式
圖11 距離條件
自車在接收到周車信息之后,依次進行意圖判斷、距離條件判斷、加速度條件判斷。經過條件判斷后,算法進入3種控制模式其中之一。每種控制模式有其對應的軌跡規(guī)劃和橫縱向的軌跡跟蹤方法??刂颇J?的橫向控制具有最高的優(yōu)先級,自車一旦進入模式3進而做出返回原車道的決策后,剩余換道時間內,自車的軌跡規(guī)劃和橫向控制不再發(fā)生改變??v向控制仍可以根據距離和加速度條件判斷的結果在不同模式下切換。
原車道前車換道行為判斷依據是橫向距離超過車道寬度的1/2,目標車道前車的減速行為判斷依據是:減速度大于2m/s2持續(xù)1s以上。當算法未檢測到影響自車換道的周車駕駛行為/意圖時,選擇模式1,反之算法進入距離條件判斷。
距離條件主要是自車基于當前的相對車速,相對距離和減速度判斷是否需要調整縱向跟蹤策略,如圖11所示。CFC避障工況下,原車道前車一般加速換道,影響自車換道安全的主要是自車與前車的相對速度和相對距離;在TFD避障工況下,目標車道前車減速行為是影響換道安全的主要因素。如果換道結束時相對距離大于安全距離閾值,則當前控制模式進入模式1,反之進入加速度條件判斷模塊。需要說明的是,車輛相對距離計算時采用了車輛質心作為參考點,在安全判斷時算法不對車輛外形尺寸進行單獨討論,外形因素包含在中。在聯合仿真時實車測試中剔除了外形因素之后的安全距離,取值為5m。
加速度條件主要是自車當檢測到距離條件不滿足時,對于所需的目標制動減速度的判斷。進行加速度條件判斷的前提是:安全距離條件不滿足。加速度條件判斷之后將決定車輛進入模式2或模式3控制狀態(tài)。如果所需的目標制動減速度未超過設定的閾值,則控制模式選用模式2,反之控制模式選用模式3。
目標制動減速度的計算如圖12所示。
圖12 加速度條件
需要說明的是,閾值在實車設定時可以通過駕駛風格選項來體現,激進的駕駛風格可以選用較大的閾值,使得換道避障算法在決策時可以自主選用較大制動減速度。閾值具體大小與駕駛風格的對應關系可以通過標定實現。本課題對此不進行探討,在聯合仿真和實車測試時,該閾值設定為5m/s2。
通過對原車道前車和目標車道前車的條件判斷,決定自車當前的控制模式分為3種:①模式1針對兩種情形:沒有檢測到周車影響自車駕駛行為 (意圖);雖然自車檢測到意圖但是基于當前的速度分析和加速度分析,在自車完成換道時間內,與周車的縱向距離仍處于安全閾值之內。該兩種情形下自車不需要調整軌跡規(guī)劃和跟蹤策略。②模式2針對距離條件不滿足但加速度條件滿足時的情形,該情形下自車需要將縱向控制切換為目標減速度跟蹤控制。③模式3對應最為危險的避障情形,當前車輛允許的最大制動加速度已經無法滿足換道需求,此時需要返回原車道??刂颇J脚c相關模塊的對應關系如圖13所示。
圖13 不同控制模式下的軌跡規(guī)劃與跟蹤方法
在具體的軌跡規(guī)劃和軌跡跟蹤方法上,在模式1中,采用常規(guī)五次多項式形式進行軌跡跟蹤,基于當前自車狀態(tài)和目標車道(此時為左車道) 位置和速度信息實時設計換道軌跡。軌跡跟蹤采用MPC同時輸出目標前輪轉角和目標車速。前輪轉角通過轉向傳動比輸出轉向盤轉角控制量,目標車速通過車速分段PID控制輸出油門或制動減速度控制量。
在模式2中,軌跡規(guī)劃方法與控制模式1的方法相同。軌跡跟蹤在縱向上采用PID閉環(huán)控制輸出目標制動減速度。目標減速度的計算方法已在圖11中得到討論。軌跡跟蹤在橫向上采用預瞄模型輸出前輪轉角,然后通過轉向傳動比輸出轉向盤轉角。
在模式3中,自車需要返回原車道。軌跡規(guī)劃同樣采用五次多項式形式,不同模式1、2之處在于目標車道設定為原車道??v向控制采用最大制動減速度控制,橫向控制方法和參數同模式2。需要說明的是,縱向控制采用最大制動加速度控制,該制動加速度與路面附著識別、車身狀態(tài)估計以及橫擺力偶矩控制有關,計算邏輯與ESC功能類似,并非本論文討論的重點,在聯合仿真和實車測試時,該值設定為7m/s2。
軌跡跟蹤控制器采用MPC+PID聯合控制策略。MPC模型由2個模塊組成。第1個模塊基于車輛三自由度運動學模型。該模型以車輛前輪轉角和車速為模型控制量,通過最小化預測模型的成本函數得出最佳控制量。第2個模塊通過轉向傳動比計算出轉向盤轉角,通過比例模型計算出車輛縱向控制量,即油門和制動強度,系統(tǒng)框架圖如圖14所示。
圖14 MPC控制系統(tǒng)
搭建了仿真平臺和實車平臺上對換道避障算法進行驗證。仿真平臺采用CARSIM和MATLAB進行聯合仿真。如圖15所示。CARSIM提供自車、周車模型以及道路環(huán)境,MATLAB進行條件判斷、決策矩陣選擇、軌跡規(guī)劃以及軌跡跟蹤模塊的計算。
采用本課題提出的實時換道避障策略,圖16顯示了工況1.1的實時仿真軌跡??傮w來看,算法通過基于當前自車運動狀態(tài)設計的五次多項式軌跡可以在每個時間點順利生成,且較平滑,可以作為換道的跟蹤軌跡。
圖15 MATLAB與CARSIM聯合仿真示意圖
自車在縱向15m的位置,規(guī)劃的軌跡發(fā)生了不連貫變化,這主要是因為軌跡參數優(yōu)化模塊在1.55s優(yōu)化換道長度參數,參數變化如圖17a所示。1.55s之前,五次多項式軌跡的距離參數由當前車速與剩余換道時間決定,變化連續(xù);1.55s之后,為了保證換道軌跡的單調性,軌跡參數優(yōu)化結果單調遞增,因此出現了換道軌跡不連貫的情況。換道過程中,橫向速度最大值為0.16m/s,均方根值為0.07m/s;橫向加速度絕對值最大值為1.32m/s2,均方根值為0.51m/s2;橫擺角速度絕對值最大值為7.50°/s,均方根值為3.55°/s。該算法控制車輛完成橫向換道距離25%,50%,75%,95%分別用時1.65s,2.25s,2.90s,3.75s。
圖16 實時仿真軌跡
圖17 換道過程中的車輛動力學狀態(tài)
本文研究了前車換道意圖識別方面的問題,利用前車一段時間窗口內的駕駛行為,如加速度統(tǒng)計值、車道線偏移量等判斷前車未來時間窗口內進行換道操作的可能性,從而為換道提供更多決策信息。采用隨機森林構建判斷模型,通過8632車次的非換道樣本以及510車次的換道樣本構成的樣本空間,模型獲得了93.73%的識別精確度。對前車換道意圖的識別有利于車輛在換道過程中及時避障,提高行駛安全性。研究了換道過程中軌跡規(guī)劃與軌跡跟蹤的算法。分析了軌跡規(guī)劃參數的優(yōu)化方法,為實際決策中避免極端軌跡提供了基礎。提出了實時規(guī)劃跟蹤的MPC+PID換道避障算法,構建了安全判斷條件和決策矩陣,分析并驗證了該算法在正常換道和避障換道工況下的控制效果。