陳雪梅,歐洋佳欣,王子嘉,李夢溪
(北京理工大學(xué) 機械與車輛學(xué)院,北京 100081)
智能駕駛對于保證道路通行效率和通行安全具有重要的作用。復(fù)雜動態(tài)城市環(huán)境下,尤其是城市交叉口,智能車輛的行為決策研究是制約其真實道路行駛的關(guān)鍵因素之一,因此,加強城市交叉口通行決策研究具有重要的現(xiàn)實意義和學(xué)術(shù)價值。
復(fù)雜動態(tài)時變交通環(huán)境下,智能駕駛車輛的決策與交通參與者的運動狀態(tài)密切相關(guān)。很多學(xué)者基于預(yù)測-決策框架開展了智能行為決策研究。LI Junxiang 等[1]結(jié)合車輛狀態(tài)、道路結(jié)構(gòu)及車間交互等特征屬性,提出了基于動態(tài)貝葉斯網(wǎng)絡(luò)(DBN)的換道行為預(yù)測模型,并在公開數(shù)據(jù)集上進行了驗證。M?NTT?RI 等[2]提出了一種基于深度學(xué)習(xí)的換道行為預(yù)測方法。該方法將車輛在高速公路上的換道場景數(shù)據(jù)轉(zhuǎn)化Recurrent Convolutional Neural Netw 為特定格式的俯視視角圖片,輸入到循環(huán)神經(jīng)網(wǎng)絡(luò)(RCNN,ork)中進行訓(xùn)練,在不需要顯性地建立車輛交互關(guān)系的情況下獲得了較為精準(zhǔn)的預(yù)測模型。LEFèVRE 等[3]通過分析與本車存在潛在沖突的車輛的駕駛意圖(Intention)和它們被期望的(Expectation)駕駛動作間的差異,結(jié)合交叉口結(jié)構(gòu)形式設(shè)置不同級別的風(fēng)險預(yù)警,為無人駕駛車輛的策略選擇提供參考。CHEN Xuemei 等[4]利用間隙可接受理論和換道決策規(guī)則構(gòu)建了自由換道決策模型。CHEN Xuemei 等[5]采用RSAN(Rought-Set Artificial Neural Network)對跟車場景下的決策進行研究。但是以上研究沒有針對復(fù)雜動態(tài)的城市交叉口中的車輛運動不確定性對智能車輛行為決策影響機理以及穿越行為過程進行分析。
本文利用車載傳感器和攝像法對典型城市交叉口交通進行數(shù)據(jù)采集,并對車輛運動模式進行識別。然后基于高斯過程回歸模型對車輛進行建模和長時預(yù)測。最終建立了基于沖突消解理論的左轉(zhuǎn)決策模型并驗證了該模型的有效性。
本文將智能車輛城市交叉口穿越通行全過程劃分為3 個階段,分別為穿越直行機動車車流、穿越非機動車流以及穿越橫穿馬路的行人。將左轉(zhuǎn)車與其他移動目標(biāo)在路徑上的重合區(qū)域設(shè)為沖突區(qū)域,如圖1a 中橙色區(qū)域所示。
為了保證通行安全,避免車輛碰撞,左轉(zhuǎn)車輛與對向的直行車應(yīng)該交錯通過沖突區(qū)域。決策系統(tǒng)框架如圖1b 所示。由于篇幅所限,本文重點闡述左轉(zhuǎn)車如何穿越對向直行車,其他情況在他文另做闡述。
圖1 交叉口行為及決策系統(tǒng)
本文采用車載傳感器和攝像法獲取智能車輛左轉(zhuǎn)通行城市交叉口(北京市海淀區(qū)魏公村路口)的行為數(shù)據(jù)以及周邊車輛和環(huán)境信息,并且使用對稱指數(shù)移動平均法(sEMA)來進行數(shù)據(jù)預(yù)處理。預(yù)處理數(shù)據(jù)如圖2 所示,部分原始標(biāo)定數(shù)據(jù)見表1 和表2。
圖2 數(shù)據(jù)預(yù)處理
高斯過程回歸(Gaussian Process Regression,GPR)[7]是近年發(fā)展起來的一種機器學(xué)習(xí)回歸方法,在處理高維數(shù)、小樣本、非線性等復(fù)雜的問題上具有很好的適應(yīng)性,且泛化能力強。本文利用高斯過程模型重點對對向直行車的運動軌跡進行長時精準(zhǔn)預(yù)測分析。
一般帶噪聲的預(yù)測模型可以定義為:y=f(x)+ε,其中,x為輸入向量;y為觀測值;ε是均值為0,方差為的高斯白噪聲;f為未知的函數(shù)關(guān)系。協(xié)方差函數(shù)為:
可以把觀測值y以及預(yù)測值看成一個從聯(lián)合高斯分布采樣來的一個點,則觀測值和預(yù)測值的聯(lián)合先驗分布為:
表1 交叉口部分左轉(zhuǎn)車輛數(shù)據(jù)
表2 交叉口部分直行車輛數(shù)據(jù)
式中:X為訓(xùn)練集;X*為測試集;K為數(shù)據(jù)集之間的協(xié)方差;In為單位矩陣。
由此計算預(yù)測值f*在觀測值下的條件分布,即f*的后驗分布:
建模過程如下:首先將軌跡數(shù)據(jù)劃分為測試集和訓(xùn)練集;其次選取合適的核函數(shù)并設(shè)置超參數(shù)的初始值,從而確定GPR 的先驗?zāi)P?;然后通過訓(xùn)練集訓(xùn)練模型,優(yōu)化超參數(shù);最后將測試集的車輛運動狀態(tài)參數(shù)輸入訓(xùn)練好的GPR 模型中,得到預(yù)測值及其預(yù)測分布估計,如圖3 所示。本文利用路基平臺采集的軌跡數(shù)據(jù)訓(xùn)練高斯過程回歸模型并優(yōu)化其超參數(shù),將x和y方向的加速度預(yù)測解耦,減少了模型計算的復(fù)雜度。在x方向上,使用目標(biāo)的位置和速度[x(t),y(t),vx(t),vy(t)]作為預(yù)測模型的輸入,模型的預(yù)測值是目標(biāo)x方向上的加速度ax(t);在y方向上使用[x(t),y(t),vx(t),vy(t)]作為車預(yù)測模型的輸入,模型的預(yù)測值是目標(biāo)y方向上的加速度ay(t)。通過GPR 算法建立加速度與車輛當(dāng)前位置和速度的映射關(guān)系,訓(xùn)練得到的GPR 加速度預(yù)測模型如圖4 所示。
圖3 高斯過程回歸模型訓(xùn)練過程
圖4 GPR 加速度預(yù)測模型
通過視頻數(shù)據(jù)分析可以得出,智能車輛左轉(zhuǎn)通過城市交叉口沖突區(qū)域可能遇到的情況包括:
(1)當(dāng)t20≤t10≤t21時,直行車先進入沖突區(qū)域,在其離開沖突區(qū)域前左轉(zhuǎn)車進入,會發(fā)生碰撞。
(2)當(dāng)t10≤t20≤t11時,左轉(zhuǎn)車先進入沖突區(qū)域,在其離開沖突區(qū)域前直行車進入,會發(fā)生碰撞。
(3)當(dāng)t21≤t10時,直行車先通過沖突區(qū)域,在其離開沖突區(qū)域后左轉(zhuǎn)車進入。
(4)當(dāng)t11≤t20≤t21時,左轉(zhuǎn)車先通過沖突區(qū)域,在其離開沖突區(qū)域后直行車進入。
上面列舉的安全通行方式可按圖5b 中的時間軸方式表示,其中橙色矩形表示車輛占用沖突區(qū)域的時間段。
圖5 單車場景下左轉(zhuǎn)通行模型
智能駕駛車輛在進入路口時,對直行車輛的軌跡進行了預(yù)測,得到了其通過沖突區(qū)域的時間區(qū)間。若二者可能會在沖突區(qū)域相遇,左轉(zhuǎn)車則需要選擇合適的速度,控制車輛在時間上避開直行車輛。
本文將智能駕駛車輛的動作空間離散化,設(shè)置多個待選動作值,決策算法輸出的是車輛的速度期望值。在考慮了決策合理性和算法效率后,設(shè)置了如下動作空間,其中包含了多組加速動作和減速動作:
在實際仿真應(yīng)用過程中,車輛速度由PID 模塊控制,根據(jù)當(dāng)前車速和輸入的期望車速生成加速和減速的動作量。
綜合考慮動作選取及高效性、舒適性等因素,得到單車場景下的決策流程,如圖6 所示。
圖6 單車場景下的動作選擇流程
在實際道路環(huán)境中,駕駛動作的選擇需要考慮駕駛安全性、通行高效性等因素,以提高決策過程的合理性。
2.2.1 安全性
通過檢測車輛之間是否發(fā)生碰撞而定義。以直行車和左轉(zhuǎn)車通過沖突區(qū)域的時間差值為參考指標(biāo),當(dāng)時間差值大于0 時,車輛安全通行如式(7)所示。
2.2.2 高效性
表征車輛通過城市交叉口的效率,以左轉(zhuǎn)車從進入交叉口到離開沖突區(qū)域的駕駛總用時為參考指標(biāo),如式(8)所示。
式中:twait為減速讓行的總用時(包括停車等待時間);tpass為直行車通過后,左轉(zhuǎn)車通過沖突區(qū)域的時間。在保證安全性條件的基礎(chǔ)上,需要選擇總用時盡可能短的動作,才能保證通行過程的高效性,即:
式中:Taction為T1、T2中用時更少的值,以表明選擇此用時代表的是更為高效的動作來執(zhí)行。
本文基于Prescan & Matlab/Simulink 進行了聯(lián)合仿真試驗設(shè)計。仿真參數(shù)設(shè)置如下:左轉(zhuǎn)車輛與直行車輛的長度分別為4.79 m 和5.2 m;仿真步長為0.05 s。下面將對仿真場景和真實場景的驗證結(jié)果進行分析。
場景一:左轉(zhuǎn)車采取讓行策略。
當(dāng)左轉(zhuǎn)車不由算法控制時兩車發(fā)生碰撞。由圖7可知,當(dāng)仿真時間t=5.8 s 時,系統(tǒng)檢測到碰撞信號。
圖7 碰撞檢測信號
當(dāng)左轉(zhuǎn)車由算法控制時,其整個通行過程如下:左轉(zhuǎn)車駛?cè)肼房诤?,先基于直行車?dāng)前的運動狀態(tài)對其未來軌跡做出預(yù)測,如圖8a 所示;再將預(yù)測的軌跡傳入決策算法,動作選擇算法根據(jù)多因素影響下的目標(biāo)函數(shù)選擇最優(yōu)動作,輸出期望速度,從而決定本車優(yōu)先通過或讓行。在本場景中,當(dāng)左轉(zhuǎn)車進入路口時,直行車已十分接近沖突區(qū)域,在此情況下,算法得出讓行結(jié)論,左轉(zhuǎn)車減速讓行,直行車優(yōu)先通過。算法給出的期望速度信號及實際車速變化如圖8b 所示。仿真開始時,左轉(zhuǎn)車以5 m/s 的期望速度行駛,在駛?cè)肼房诘贸鲎屝袥Q策后,將速度調(diào)整為1 m/s,減速讓行,并在直行車離開沖突區(qū)域后恢復(fù)原始期望速度5 m/s。
圖8 仿真結(jié)果分析
場景二:左轉(zhuǎn)車采取加速通過沖突區(qū)域的策略。
當(dāng)左轉(zhuǎn)車到達(dá)判斷區(qū)域時,直行車剛剛進入交叉口,距離沖突區(qū)域相對較遠(yuǎn)。在此情況下,決策算法傾向于讓左轉(zhuǎn)車加速優(yōu)先通過沖突區(qū)域。左轉(zhuǎn)車在駛?cè)肼房诤?,將期望速度調(diào)整為7 m/s;當(dāng)其完全通過沖突區(qū)域后,期望速度又恢復(fù)到5 m/s,如圖9b 所示。
盡管在加入決策算法前,左轉(zhuǎn)車、直行車先后通過交叉口,沒有發(fā)生碰撞。但在加入決策算法后,智能駕駛車輛選擇加速通過沖突區(qū)域,增大了兩車距離,如圖9c 和9d 所示。這樣的通行方法在實際道路上不但可以提高左轉(zhuǎn)車的通行效率,同時減小了對直行車流的影響,如圖9c 和9d 所示。
圖9 仿真結(jié)果分析
本文共設(shè)計了30 次仿真試驗來對提出的決策模型的合理性和適應(yīng)能力進行驗證,其中成功穿行28 次,成功率93%。
圖10 真實場景
在左轉(zhuǎn)車優(yōu)先通過的場景下,其車速變化主要分為以下3 個階段,進入路口的穩(wěn)定行駛階段,動作選擇后的加速通過階段,以及通過沖突區(qū)域后的速度恢復(fù)階段,如圖11 所示。圖中實際車速曲線在9 s 后逐漸上升,主要是因為駕駛員在判斷路口處沒有行人及非機動車影響后,提前加速到了車道內(nèi)行駛的期望速度。
圖11 車速對比
圖12 反映了車輛在不同時刻的位置與速度信息。由圖可知,算法得出的數(shù)據(jù)與真實數(shù)據(jù)在整體變化趨勢上非常接近。
圖12 時空軌跡對比
本文針對單車場景下智能駕駛車輛在城市交叉口的左轉(zhuǎn)行為決策問題,利用高斯過程模型對對向直行車進行軌跡預(yù)測,并基于沖突消解理論建立左轉(zhuǎn)決策模型,得出以下結(jié)論:
(1)根據(jù)城市交叉口通行車輛的5 種運動模式分類,利用高斯過程模型對對向直行車進行長時軌跡預(yù)測,最終獲得了具有較高精度的長時預(yù)測軌跡,與實際情況十分接近。
(2)將左轉(zhuǎn)車穿越交叉口的行為分為3 個階段,分別是穿越機動車、非機動車及行人。主要針對單輛對向直行車的情況考慮了沖突消解,進行了速度控制策略的研究,設(shè)計了左轉(zhuǎn)決策流程和基于安全性、高效性等因素的動作選擇標(biāo)準(zhǔn)。
(3)利用仿真驗證平臺對提出的算法的可靠性和有效性進行驗證。結(jié)果表明,30 次仿真試驗中左轉(zhuǎn)車成功穿越交叉口28 次,成功率93%,即該決策算法能夠引導(dǎo)智能駕駛車輛順利完成駕駛?cè)蝿?wù),能夠在一定程度上提高駕駛安全性和通行效率。
由于本文篇幅限制,不同時段的交通流密度對駕駛行為的影響、本車對對向車輛行為決策的影響,行人及非機動車等交通參與者對本車行為決策的影響分析和建模將在另外的文章中進行闡述。