冀杰 黃巖軍 李云伍 吳飛
(1.西南大學(xué),重慶 400715;2.滑鐵盧大學(xué),加拿大 安大略省 N2L3G1)
主題詞:智能車輛 自動駕駛 有限狀態(tài)機(jī) 危險勢能場 行為決策
駕駛行為決策是智能車輛研究領(lǐng)域的關(guān)鍵問題之一,也是自動駕駛系統(tǒng)智能化水平的重要體現(xiàn)。在實際道路交通環(huán)境中,智能車輛所面臨的駕駛環(huán)境和交通狀況存在多樣性、隨機(jī)性和不準(zhǔn)確性等特征,而人們對車輛自動駕駛的安全性和實時性要求不斷提高,這對駕駛行為決策系統(tǒng)提出了巨大挑戰(zhàn)[1-2]。因此,設(shè)計能夠滿足復(fù)雜道路工況要求的自動駕駛行為決策系統(tǒng)對智能車輛研究具有重要的理論意義和應(yīng)用價值。
自上世紀(jì)80年代以來,隨著環(huán)境感知及智能控制技術(shù)的不斷發(fā)展,移動機(jī)器人相關(guān)研究取得了飛躍式進(jìn)展并涌現(xiàn)出了許多行為決策方法,包括神經(jīng)網(wǎng)絡(luò)決策方法、馬爾科夫決策方法、貝葉斯網(wǎng)絡(luò)決策方法以及模糊決策方法等[3-5]。然而,上述決策方法大多對控制單元的計算能力要求較高且與駕駛員的實際駕駛行為決策方式存在較大的差異。因此,上述方法難以直接應(yīng)用于智能車輛的駕駛行為決策系統(tǒng)中[6]。
近年來,有限狀態(tài)機(jī)(Finite State Machine,F(xiàn)SM)技術(shù)的興起和應(yīng)用為智能車輛自動駕駛行為決策提供了新的思路[7]。例如,熊光明等人提出了一種智能車輛交叉口行為預(yù)測與控制方法,并建立了相應(yīng)的有限狀態(tài)機(jī)模型,從而對交叉口其他車輛的行為進(jìn)行了準(zhǔn)確預(yù)測[8];熊璐等人基于分層決策思想和有限狀態(tài)機(jī)理論設(shè)計了差動轉(zhuǎn)向無人車的整車控制策略,從而有效地實現(xiàn)了無人車各運動模式間的切換[9];馮關(guān)明等人基于有限狀態(tài)機(jī)理論和模糊邏輯控制理論設(shè)計了具有主動安全性的汽車自適應(yīng)巡航控制(Adaptive Cruise Control,ACC)系統(tǒng),使車輛在加速行駛、車輛跟蹤和制動減速等行駛工況下保持跟蹤性和適應(yīng)性[10]。從上述文獻(xiàn)可以看出,有限狀態(tài)機(jī)理論可用于實現(xiàn)交叉路口行為預(yù)測、差別轉(zhuǎn)向以及自適應(yīng)巡航等部分自動駕駛功能。但是,如果利用有限狀態(tài)機(jī)方法實現(xiàn)復(fù)雜道路工況下的自動駕駛行為決策,則需考慮車輛運動學(xué)以及動力學(xué)特性對駕駛行為決策的影響,同時,需基于實際道路交通狀況,對各狀態(tài)之間的切換依據(jù)進(jìn)行定量分析。
因此,本研究將對智能車輛的典型自動駕駛行為進(jìn)行分析和分解,并基于有限狀態(tài)機(jī)理論設(shè)計面向結(jié)構(gòu)化道路環(huán)境的智能車輛自動駕駛行為決策系統(tǒng)。同時,構(gòu)建能夠反映實際道路交通狀況的虛擬危險勢能場,并依據(jù)勢能場對自動駕駛行為決策依據(jù)進(jìn)行定量分析。最終,通過MATLAB/CarSim聯(lián)合仿真及比例道路模型試驗對上述理論進(jìn)行驗證。
對于智能車輛的自動駕駛行為決策而言,需要根據(jù)當(dāng)前的道路環(huán)境感知信息以及自身運動狀態(tài),對車輛周圍的道路交通危險態(tài)勢進(jìn)行準(zhǔn)確判斷,同時,要依據(jù)自動駕駛?cè)蝿?wù)目標(biāo)以及安全行駛行為準(zhǔn)則,在不同的駕駛行為模式之間作出及時準(zhǔn)確的決策[11]。因此,對智能車輛的主要自動駕駛行為進(jìn)行分析是進(jìn)行決策的重要前提。
智能車輛自動駕駛運動過程如圖1所示,由圖1可以看出,當(dāng)智能車輛在結(jié)構(gòu)化道路環(huán)境下行駛時,根據(jù)車輛在行駛過程中的不同運動狀態(tài),可將自動駕駛過程分解為4種基本的駕駛行為模式。主要包括:
a.車道保持行為(A)。自動駕駛系統(tǒng)采取的一種缺省模式,指智能車輛始終沿所在車道行駛的行為。
b.車輛跟隨行為(B)。根據(jù)所在車道前方車輛的行駛狀態(tài)信息,通過控制油門或制動踏板,自適應(yīng)調(diào)整智能車輛的行駛速度,使之以安全間距跟蹤前方車輛行駛。
c.車道變換行為(C)。當(dāng)智能車輛所在車道不具備通行條件時,從所在車道切換到相鄰車道行駛的過程。根據(jù)目標(biāo)車道的不同可以分為主車道切換至超車道和超車道切換至主車道兩種情況。
d.制動避撞行為(D)。當(dāng)智能車輛前方出現(xiàn)緊急或者意外危險情況且不具備車道變換條件時,智能車輛要采取緊急制動行為,避免與前方障礙物或車輛發(fā)生碰撞。
圖1 智能車輛的自動駕駛行為
從以上分析可以看出,智能車輛的各駕駛行為模式之間是相互關(guān)聯(lián)的,通過其相互間的實時切換,可在結(jié)構(gòu)化道路上實現(xiàn)主要的自動駕駛功能。根據(jù)智能車輛所在車道以及相鄰車道上的車輛運動狀態(tài)信息和障礙物信息,可以確定自動駕駛行為決策的基本觸發(fā)條件,如表1所示。
表1 基本觸發(fā)條件信息
對智能車輛在不同車道上的自動駕駛行為模式(A、B、C、D)進(jìn)行細(xì)分,并與表1所示的自動駕駛行為決策觸發(fā)條件進(jìn)行組合,得到如圖2所示的決策及模式切換示意圖。從圖2可以看出,當(dāng)智能車輛在結(jié)構(gòu)化道路上進(jìn)行自動駕駛時,各種駕駛行為模式之間存在多種切換動作,每一種切換動作的執(zhí)行條件由不同的觸發(fā)信息組合而成。
自動駕駛行為決策過程是一種非連續(xù)的狀態(tài)表達(dá)形式,采用傳統(tǒng)數(shù)學(xué)模型難以有效解決此類問題,而有限狀態(tài)機(jī)是用來研究有限個狀態(tài)的計算及這些狀態(tài)之間的轉(zhuǎn)移和動作等行為的離散數(shù)學(xué)模型[12]。因此,構(gòu)建自動駕駛系統(tǒng)的行為決策有限狀態(tài)機(jī)表達(dá)式為:式中,T為狀態(tài)機(jī)中所有自動駕駛行為模式的集合;E為各狀態(tài)所能接收的所有輸入的集合,即引起駕駛行為模式狀態(tài)轉(zhuǎn)換的觸發(fā)條件集合;δ為狀態(tài)轉(zhuǎn)移函數(shù),δ:T×E→T;t0∈T為自動駕駛行為初始狀態(tài);F?T為自動駕駛行為終止?fàn)顟B(tài)集合。
圖2 自動駕駛行為模式切換過程
對于智能車輛而言,基本駕駛行為模式(T)之間的切換主要由自動駕駛?cè)蝿?wù)決定,它屬于外部事件(E)觸發(fā)的系統(tǒng)對象。自動駕駛系統(tǒng)的初始狀態(tài)t0=A(主)是在主車道上執(zhí)行定速車道保持模式(即缺省模式),而終止?fàn)顟B(tài)F則表示脫離自動駕駛并轉(zhuǎn)為人工駕駛模式。根據(jù)不同車道上的實際道路工況,有限狀態(tài)集合T可細(xì)分為6種有限駕駛行為狀態(tài),即T={A(主),A(超),B,C(主),C(超),D},如圖2所示;駕駛行為模式之間的觸發(fā)事件主要取決于主車道和超車道上的車輛運動狀態(tài),即E={a1,a2,a3,b1,b2,c1,c2,d1,d2},如表1所示;狀態(tài)轉(zhuǎn)移函數(shù)表示智能車輛在接收到不同的狀態(tài)觸發(fā)信息時,從一個駕駛行為模式轉(zhuǎn)移到另一個駕駛行為模式的規(guī)則,可以看作狀態(tài)轉(zhuǎn)移規(guī)則集合。
根據(jù)自動駕駛系統(tǒng)的行為決策模式分析以及人工勢能場基本理論,利用MATLAB軟件的Stateflow設(shè)計開發(fā)工具箱,構(gòu)建如圖3所示的有限狀態(tài)機(jī)仿真模型,從而對智能車輛自動駕駛行為模式的決策過程進(jìn)行圖形化描述。
通過對有限狀態(tài)機(jī)模型的五元組進(jìn)行定性分析可知,輸入集合及狀態(tài)轉(zhuǎn)移函數(shù)是實現(xiàn)自動駕駛行為決策的關(guān)鍵。因此,基于危險勢能場理論對有限狀態(tài)機(jī)的觸發(fā)條件和狀態(tài)轉(zhuǎn)移函數(shù)進(jìn)行定量分析[13-14]。
圖3 自動駕駛行為決策有限狀態(tài)機(jī)模型
對智能車輛所在的道路環(huán)境進(jìn)行參數(shù)化建模和區(qū)域劃分,如圖4所示。圖4中,分別以道路寬度和長度方向為X軸和Y軸建立道路坐標(biāo)系,Lw和Lc分別為車輛危險勢能場的寬度和長度,(Xo,Yo)為其他車輛的幾何中心在道路坐標(biāo)系下的位置,PF、PL分別為智能車輛位置和相鄰車道上對應(yīng)位置的勢能場。設(shè)定智能車輛所在車道前方Lc/2范圍內(nèi)的區(qū)域為制動避撞區(qū)域,保證車輛有足夠的空間和時間用于主動制動并避免發(fā)生碰撞;智能車輛所在車道前方Lc/2~Lc范圍內(nèi)為車輛跟隨區(qū)域,用于實現(xiàn)自適應(yīng)跟蹤功能;而智能車輛相鄰車道的前、后Lc范圍為車道變換區(qū)域,該區(qū)域的中心位置可用于判斷是否具備車道變換條件。當(dāng)智能車輛位于超車道時,相應(yīng)的區(qū)域劃分沿兩車道間的中心線左右互換。
圖4 危險勢能場區(qū)域劃分
根據(jù)上述道路區(qū)域劃分以及其他車輛的行駛工況信息,利用三角函數(shù)及指數(shù)函數(shù)構(gòu)建三維虛擬危險勢能場,并基于該勢能場對狀態(tài)轉(zhuǎn)換觸發(fā)條件進(jìn)行定量分析。該勢能場P(X,Y)主要由道路危險勢能Pr(X,Y)和車輛危險勢能Po(X,Y)共同構(gòu)成:
當(dāng)劃分的各區(qū)域內(nèi)無其他車輛行駛時,構(gòu)建的道路危險勢能場應(yīng)保證車輛能夠在當(dāng)前車道上行駛(即自動駕駛行為缺省模式)。
為實現(xiàn)該目標(biāo),設(shè)定道路兩側(cè)的危險勢能為1,主車道和超車道中心線的危險勢能均為0,兩車道中間的危險勢能為Pm,取值范圍為0<Pm<1,道路中心及兩側(cè)的勢能場保證了車輛在車道中心行駛時的危險勢能最小,進(jìn)而實現(xiàn)車道保持的功能。
利用三角函數(shù)構(gòu)建道路危險勢能場為:
式中,A(X)為道路危險勢能幅值隨道路寬度的變化參數(shù):
式中,Xz和Xc分別為主車道和超車道中心線的橫向坐標(biāo)。
將道路的結(jié)構(gòu)參數(shù)Lw、Xz、Xc以及道路中心危險勢能Pm代入式(3),可得到道路上不同橫向位置的三維虛擬危險勢能值,如圖5所示。
圖5 道路危險勢能場(Pm=0.5)
以其他車輛的幾何中心坐標(biāo)(Xo,Yo)為原點,利用人工勢場理論中的斥力場指數(shù)函數(shù)構(gòu)建三維虛擬危險勢能場為:
式中,c1和c2分別為危險勢能在道路寬度和長度方向上的變化系數(shù),兩個系數(shù)直接影響障礙物危險勢能場的三維結(jié)構(gòu)。
c1應(yīng)盡量不影響相鄰車道中心線上的道路危險勢能場,從而保證車輛在相鄰車道上能夠執(zhí)行車道保持功能:
c2是智能車輛主動制動避撞以及車輛跟隨駕駛行為決策的觸發(fā)條件依據(jù),可根據(jù)智能車輛的最大制動減速度及車輛跟隨距離的需要確定:
式中,P1為車輛跟蹤勢能閾值;P3為車道變換勢能閾值。
c1和c2確定后帶入式(5)即可獲得如圖6所示的其他車輛三維虛擬危險勢能場。
圖6 其他車輛三維虛擬危險勢能場
根據(jù)式(5)和圖6可知,車輛幾何中心處的斥力場值最大,即P0(X0,Y0)=1。隨著與(Xo,Yo)間的距離不斷增加,危險勢能場的值也不斷變小。
將構(gòu)建的道路和車輛危險勢能場進(jìn)行疊加并以此確定車輛自動駕駛行為的狀態(tài)轉(zhuǎn)移規(guī)則。如圖4所示,選擇智能車輛位置的勢能場PF作為車輛跟隨及主動避撞行為的決策變量,相鄰車道上對應(yīng)位置的勢能場PL作為車道變換行為的決策變量。
根據(jù)上述道路區(qū)域劃分以及決策閾值的確定,得到智能車輛不同自動駕駛行為模式的執(zhí)行依據(jù)如表2所示。表2中,P1、P2和P3分別為自動駕駛的車輛跟蹤、制動避撞及車道變換的勢能閾值;VL和V1分別為前方車輛速度及跟蹤速度閾值;TV和T1分別為車道變換過程持續(xù)的時間及時間閾值。
表2 行為決策執(zhí)行依據(jù)
基于實際道路的結(jié)構(gòu)參數(shù)以及車輛的典型運動特性,利用MATLAB/CarSim軟件構(gòu)建自動駕駛行為決策過程的聯(lián)合仿真模型,如圖7所示。
表3列出了三維虛擬危險勢能場的主要參數(shù)和數(shù)值,并設(shè)定了智能車輛以及其他車輛在道路坐標(biāo)系下的初始位置和初始速度。另外,假設(shè)其他車輛的速度隨時間變化的趨勢如圖8所示。
圖7 聯(lián)合仿真系統(tǒng)模型
表3 聯(lián)合仿真系統(tǒng)主要參數(shù)
圖8 其他車輛的速度曲線
將上述道路交通狀況帶入聯(lián)合仿真模型,得到PF和PL的變化曲線如圖9所示。根據(jù)道路坐標(biāo)系下的危險勢能場三維模型,制定有限狀態(tài)機(jī)的狀態(tài)觸發(fā)條件,從而獲得智能車輛的自動駕駛行為模式實時決策情況以及車輛速度變化曲線,如圖10和圖11所示。
圖9 PF和PL位置的勢能場
圖10 自動駕駛系統(tǒng)行為模式
圖11 智能車輛速度變化曲線
從仿真結(jié)果可以看出,在0~5.0 s仿真范圍內(nèi),智能車輛所在車道上的危險勢能PF始終小于車輛跟隨模式的觸發(fā)閾值(如圖12a所示)。根據(jù)表2所示的決策執(zhí)行依據(jù),該工況下不論P(yáng)L如何變化,智能車輛始終執(zhí)行車道保持行為模式(即缺省模式)。
圖12 車道保持及車輛跟隨模式下的危險勢能場
在第5.0~11.0 s仿真范圍內(nèi),隨著智能車輛與前方車輛不斷接近(如圖13中寬線所示),PF大于車輛跟隨決策閾值且小于制動避撞決策閾值,同時,PL大于車道變換決策閾值(見圖12b),車輛進(jìn)入跟隨駕駛行為模式。
在第11.0~16.0 s仿真范圍內(nèi),隨著相鄰車道上其他車輛與智能車輛的距離不斷增大,PL逐漸小于車道變換決策閾值,智能車輛進(jìn)入車道變換駕駛行為模式并持續(xù)5 s。在此過程中,車輛與所在車道前方車輛的最小間距為49.8 m,能夠有效保證車輛的主動安全性,如圖13所示。車道變換完成后,所在車道與相鄰車道的區(qū)域劃分互換。
圖13 智能車輛與其他車輛的間距
當(dāng)智能車輛在超車道上行駛時(即第16.0~26.5 s仿真范圍),根據(jù)所在車道及相鄰車道上的危險勢能場變化情況,智能車輛分別完成了車道保持模式、車輛跟蹤模式。當(dāng)被控車輛與前方車輛的間距為33.5 m時(見圖13),PL小于決策閾值時(見圖14a),觸發(fā)車道變換模式并于第31.5 s時刻切換到主車道行駛(見圖10)。
圖14 車道變換及制動避撞模式下的危險勢能場
智能車輛從超車道變換到主車道后,道路前方的車輛速度逐漸降低并于第34 s時刻靜止;另外,由于PL始終大于車道變換決策閾值,不具備車道變換條件(如圖14b所示)。因此,智能車輛于第34.71 s時刻進(jìn)入主動制動避撞駕駛行為模式,并在距離前方車輛18.1 m的處制動停車(如圖13中第40 s處寬線所示),從而保證了智能車輛的主動避撞安全性。
在微縮比例為1∶20的道路交通環(huán)境下,基于機(jī)器視覺算法及無線通信技術(shù),建立具有靜態(tài)障礙物道路工況下的危險勢能場,并對自動駕駛行為決策過程進(jìn)行試驗驗證,如圖15所示。
圖15 比例道路試驗?zāi)P?/p>
在比例道路模型試驗場景下,利用固定在上方的攝像頭獲得道路環(huán)境及車輛模型運動的實時圖像信息并進(jìn)行信號分析,如圖16所示。首先,通過Hough變換算法獲得道路場景圖像中的邊緣直線坐標(biāo)信息;接著,利用SURF算法對道路環(huán)境中的障礙物特征信息進(jìn)行提取并匹配,獲得障礙物的坐標(biāo)信息;最后,根據(jù)道路邊緣及障礙物的坐標(biāo)信息,利用本文提出的方法構(gòu)建實時的虛擬危險勢能場三維圖像,并將危險勢能場的等高線圖像疊加到原始的比例道路交通場景中,從而為自動駕駛行為決策提供道路交通場景的定量信息,并為自動駕駛行為狀態(tài)轉(zhuǎn)移提供判斷依據(jù)。
圖16 障礙物及道路邊界信息感知
另外,自動駕駛行為決策功能的實現(xiàn),還需要實時獲取車輛模型在三維虛擬危險勢能場中的位置信息。在本試驗場景中,由于比例道路模型上的障礙物為靜態(tài),車輛模型是圖像中唯一運動的物體。采用機(jī)器視覺領(lǐng)域中較為成熟的高斯混合模型(Gaussian Mixture Model)法對道路工況視頻圖像進(jìn)行運動目標(biāo)檢測,能夠準(zhǔn)確獲得智能小車在道路模型中的坐標(biāo)信息,如圖17所示。
圖17 基于高斯混合模型法的車輛模型檢測
利用MATLAB軟件中的Computer Vision System工具箱計算出車輛模型在道路坐標(biāo)系下的坐標(biāo)信息,將其與危險勢能場信息一起導(dǎo)入自動駕駛行為決策系統(tǒng)。利用前文設(shè)計的有限狀態(tài)機(jī)方法,實時確定車輛模型的自動駕駛行為狀態(tài)。另外,計算機(jī)與車輛模型之間通過無線傳輸模塊APC220進(jìn)行實時通信。利用MATLAB軟件的Instrument Control Toolbox以及Simulink Support Package for Arduino Hardware相關(guān)命令,將計算得到的前輪轉(zhuǎn)向角度信息傳遞到車輛模型的APC220接收器中。車輛模型上的Arduino控制器根據(jù)APC220的無線信號控制前輪舵機(jī)的轉(zhuǎn)向角和直流電機(jī)的速度,并形成閉環(huán)控制回路,如圖18所示。最終,控制車輛模型實現(xiàn)主動避撞的自動駕駛行為決策。
圖18 無線通信及控制系統(tǒng)
Simulink仿真模型采用Arduino模塊作為外部時鐘,保證試驗過程的實時性。分別完成6次自動駕駛行為決策試驗,對車輛模型的運動軌跡進(jìn)行記錄,并求取軌跡平均值,如圖19所示,6次試驗均能有效避開障礙物并回到原車道,證明了駕駛行為決策系統(tǒng)的有效性。
圖19 車輛模型運動軌跡試驗結(jié)果
基于有限狀態(tài)機(jī)理論構(gòu)建的智能車輛自動駕駛行為決策系統(tǒng),可將復(fù)雜的自動駕駛過程分解為有限個駕駛行為模式,并根據(jù)實時虛擬危險勢能場進(jìn)行駕駛行為模式?jīng)Q策,從而實現(xiàn)多車輛道路環(huán)境下的自動駕駛功能。
本文構(gòu)建的三維虛擬危險勢能場能夠?qū)Φ缆飞系膶崟r交通狀況進(jìn)行綜合描述和定量評估,通過分析關(guān)鍵位置的危險勢能場觸發(fā)閾值,可為自動駕駛系統(tǒng)的有限駕駛行為狀態(tài)提供轉(zhuǎn)換執(zhí)行依據(jù)。
本文主要為了驗證智能車輛自動駕駛行為決策系統(tǒng)的有效性和安全性,未充分考慮整個道路交通環(huán)境下的通行效率和駕乘舒適性,另外,本研究采用的無線通信模式也需要通過實車試驗進(jìn)一步驗證。今后的工作將利用車-車、車-路互聯(lián)技術(shù)提高自動駕駛行為決策系統(tǒng)的信息維度以及整個道路的通行能力。