張榮珅 王玉田 胡榮權(quán) 楊靈芳 黃 智
1.湖南大學(xué)機械與運載工程學(xué)院,長沙,410009 2.湖南大學(xué)土木工程學(xué)院,長沙,410009
智能車輛的使用提高了道路交通安全性。由于技術(shù)制約和不可控因素,絕對安全的智能駕駛難以實現(xiàn)。當(dāng)智能車輛(本文特指具有自主避障能力的智能車輛)無法保障全部交通參與者的安全時,將不可避免地陷入兩難困境。由于各種原因(如行人的突然出現(xiàn)或車輛制動故障等),車輛無法同時避免對本車道及對向車道交通參與者的沖突,由此陷入兩難選擇:減速避障與本車道交通參與者發(fā)生碰撞,或為減小傷亡而轉(zhuǎn)向減速與對向車道交通參與者發(fā)生碰撞。
對于沖突不可避免的困境,有研究對避險規(guī)劃中所涉及的因素人為設(shè)定優(yōu)先級,以獲得最優(yōu)的避險規(guī)劃。RASEKHIPOUR等[1]、WANG等[2]依據(jù)障礙物的可穿越性和碰撞傷害程度對障礙物進行分級排序,其中人類被賦予最高優(yōu)先級。LUETGE[3]也提出人類在所有障礙物中必須具有最高優(yōu)先級。CASTRO等[4]、TUMOVA等[5]對駛?cè)肴诵械?、對向車道等違反交通規(guī)則的駕駛行為進行優(yōu)先級排序。裴曉飛等[6]對轉(zhuǎn)向、直行制動等操作劃分優(yōu)先級,避險時選擇優(yōu)先級最高的操作。然而,基于優(yōu)先級的方法對于受傷害的各方均涉及人的困境難以給出合理避險規(guī)劃。
兩難困境下的避險決策涉及社會倫理問題,倫理原則為解決困境下的避險決策提供依據(jù)。多數(shù)研究者認為智能車輛避險決策應(yīng)遵守道義論和后果論[7-9]。THORNTON等[7]認為后果論和道義論是最有效、最切實際的兩難困境避險決策理論,并將后果論和道義論映射為兩難工況下避險決策的代價和約束條件,力求符合道義論前提且最小后果的避險決策。LIM等[10]強調(diào)智能車輛的避險決策應(yīng)該與社會倫理價值觀、法規(guī)相結(jié)合。后果論追求最小沖突代價,道義論強調(diào)對規(guī)則的遵守,倫理原則本身具有一定的復(fù)雜性并且難以用意義明確的數(shù)學(xué)模型描述。另外,對規(guī)則的絕對服從是不現(xiàn)實的,而違背規(guī)則的代價也難以量化,因此給兩難困境下應(yīng)用倫理原則解決避險決策問題帶來困難。
相對于道義論,后果論便于量化,研究者更傾向于通過獲得沖突中的代價損失,選擇最小代價的避險決策[11-15]。RASEKHIPOUR等[12]提出根據(jù)碰撞相對速度、相對角度、相對質(zhì)量等建立代價模型。考慮沖突的不確定性,張東亞[13]以碰撞概率和傷亡概率的乘積為代價模型。KUMFER等[14]通過實驗得出在特定的碰撞場景中,盡管其他倫理體系有助于建立機器學(xué)習(xí)開發(fā)所需要的規(guī)則,但后果論具有減少事故中人員傷亡的優(yōu)點。PUGNETTI等[15]依據(jù)兩難困境中行人的年齡、性別、社會地位等性質(zhì)得到的生命價值代價進行避險決策。上述研究在計算代價損失時,忽略了道義對代價的影響。無差別地計算處于道路不同位置(如行車道和人行道)的人的傷害代價,顯然有悖于公眾的倫理價值觀。
綜上所述,現(xiàn)有研究工作未能有效解決沖突各方均涉及人的傷害的兩難困境的避險決策問題,對符合公眾倫理價值的沖突傷害代價的量化建模及規(guī)劃問題優(yōu)化求解是解決兩難工況避險決策的關(guān)鍵。
本文以兩難困境下智能車輛避險規(guī)劃為研究對象,考慮碰撞傷害程度、法規(guī)、倫理和沖突不確定等因素,建立沖突各方中對人的傷害名義代價模型,以量化對人的代價損失。以名義代價為優(yōu)化目標(biāo),車輛物理系統(tǒng)限制為約束條件,構(gòu)建分層避險軌跡規(guī)劃優(yōu)化問題。設(shè)計了幾種典型的兩難困境場景,對提出方法的有效性及可行性進行仿真驗證。
盡管困境場景復(fù)雜多樣,但交通參與者可分為三類:本車乘員(U1)、當(dāng)前車道的道路使用者(U2)、非當(dāng)前車道的道路使用者(U3)。為便于表述,研究以圖1所示僅涉及U2和U3傷害的困境場景為例進行探討,由于兩難困境發(fā)生在極短時間內(nèi),忽略U2和U3的運動。不失一般性,研究所提出的方法同樣適用于傷害涉及U1、U2和U3的復(fù)雜困境。
圖1 一種典型的兩難困境
困境沖突中,涉及對人、動物及財產(chǎn)的侵害?;谌说纳辽显瓌t,在涉及對人傷害的沖突中,忽略動物及財產(chǎn)的損失代價,僅考慮對人傷害造成的代價。
名義代價為量綱一參數(shù),描述傷害的相對大小,不僅由生命健康損失所決定,還取決于法律、倫理道德等多個因素。采用名義代價可避免對人生命健康物化造成的倫理爭議。
沖突中對人的傷害是名義代價的主要構(gòu)成。傷亡人數(shù)及傷害程度是確定對人傷害代價的關(guān)鍵因素。盡管現(xiàn)實中人的性別、年齡、社會地位、親屬關(guān)系等均會影響傷害代價的量化,但對人的區(qū)分對待易引起倫理爭議,因此上述因素在名義代價建模時被忽略。
困境中避險決策的實質(zhì)是在各交通參與者間進行風(fēng)險分配。以圖1工況為例,直行制動避險行為使U2承受碰撞風(fēng)險,轉(zhuǎn)向制動避險行為則通過違反規(guī)則(如逆向行駛)將風(fēng)險從U2轉(zhuǎn)移至U3而獲得較小的社會總?cè)藛T傷害。公眾普遍存在兩個共識:①將風(fēng)險轉(zhuǎn)移至無辜的第三方是不道德的行為;②道路使用者應(yīng)該承擔(dān)意外的風(fēng)險,自動駕駛應(yīng)當(dāng)挽救更多人的生命。同時,違反規(guī)則總會給智能車輛的使用者(或所有者)帶來額外的法律風(fēng)險和道德壓力,即使違反規(guī)則可能會降低總的人員傷害。因此,上述倫理、法律因素應(yīng)在量化對U2和U3傷害的名義代價時體現(xiàn)。
如前述,名義代價不是簡單地將對人造成的傷害量化,還受到法規(guī)、倫理等因素的影響,倫理實驗是獲取名義代價的途徑之一。本課題組前期開展了倫理實驗研究,通過在線問卷調(diào)查形式,獲得受調(diào)查者以智能車輛用戶的角度,在面對各種兩難困境時的倫理傾向,建立了轉(zhuǎn)向避險傾向IES模型[16](以圖1僅涉及U2和U3傷亡的工況為例):
(1)
式中,N2和D2分別為直行避險造成U2傷害的傷亡數(shù)量和傷害程度;N3和D3分別為轉(zhuǎn)向避險造成U3傷害的傷亡數(shù)量和傷害程度;其余為模型擬合參數(shù)。
問卷調(diào)查表假設(shè)直行時僅造成對U2的傷害,轉(zhuǎn)向時僅造成對U3的傷害。式(1)中分子部分表示直行避險和轉(zhuǎn)向避險間的傷害代價之差。顯然,當(dāng)直行避險的代價大于轉(zhuǎn)向避險的代價時,公眾傾向轉(zhuǎn)向避險,且代價差越大,轉(zhuǎn)向傾向性越強烈。
由于傳感誤差、動態(tài)環(huán)境的不確定性,確定性模型難以準(zhǔn)確描述避險行為造成的人員傷害??紤]沖突不確定,并基于式(1)IES模型的研究結(jié)論,第i條避險軌跡的名義代價期望為
(2)
傷亡人數(shù)期望與人車沖突概率有關(guān),即
(3)
由于Uj方每個人位置不同,故對于同一避險軌跡,車輛與Uj中每個人的沖突概率也不同。
車輛與行人之間的相對距離是判斷二者是否發(fā)生碰撞的依據(jù)[17]。如圖2所示,dla、dfp、Δθ分別為人車曼哈頓距離、歐氏距離以及相對方位角。OXY和oxy分別為大地坐標(biāo)系和車輛坐標(biāo)系。車輛用一個長L、寬W、航向角為φ的矩形框表示,行人用半徑rp的圓表示。僅考慮前碰撞,車頭用半徑為rv、圓心位于前軸中心的圓表示。
圖2 人車碰撞模型簡化圖
采用曼哈頓距離(即車輛y軸橫向距離)描述人車沖突概率:
Pc=1/[1+exp(kc(dla-(rp+rv)-ds))]
(4)
式中,kc為擬合參數(shù);ds為人車間的安全距離,用于描述人車定位誤差。
KONG等[18]通過分析2003—2009年中國真實人車碰撞案例,得到傷亡概率與碰撞速度vc的邏輯回歸模型:
(5)
式(5)中PAIS3+(vc)和Pfatal(vc)為碰撞速度vc下行人的重傷和死亡的概率,傷亡程度AIS3以下為輕傷,AIS3+為重傷,fatal為死亡。依據(jù)式(5)可以得出碰撞速度vc下行人輕傷概率Pm(vc)、重傷概率Ps(vc)和死亡概率Pd(vc)分別為
(6)
依據(jù)AIS的創(chuàng)傷嚴(yán)重度評分法[19],輕傷、重傷、死亡分別評分為 1、3、6 。碰撞速度vc下行人傷亡程度量化值為
s(v7)=1×Pm(vc)+3×Ps(vc)+6×Pd(vc)
(7)
Uj傷亡程度期望用人群平均傷亡程度表示:
(8)
兩難困境中,軌跡規(guī)劃不能獲得無沖突的避險軌跡。以名義代價期望為目標(biāo)函數(shù),車輛物理系統(tǒng)限制和道路邊界等為約束條件,建立避險軌跡優(yōu)化問題,以期獲得最小沖突名義代價且滿足車輛動力學(xué)、車輛穩(wěn)定性及道路限制的最優(yōu)軌跡。
車輛動力學(xué)系統(tǒng)具有高度非線性,考慮模型精度和計算代價,研究采用小角度轉(zhuǎn)向假設(shè)下基于線性輪胎模型的單軌車輛動力學(xué)模型[20],如圖3所示。
圖3 單軌車輛模型
得到動力學(xué)方程:
(9)
式中,X、Y和φ分別為全局坐標(biāo)系下車輛質(zhì)心位置和航向角;vx、vy和ω分別為車輛質(zhì)心的縱向速度、橫向速度和角速度;m為車輛質(zhì)量;Iz為車身繞z軸的轉(zhuǎn)動慣量;lf、lr分別為車輛質(zhì)心到前后軸的距離;FxT為前后輪縱向合力;Fyf、Fyr為前、后輪側(cè)向力;Cf、Cr分別為車輛前、后輪胎的側(cè)偏剛度;af、ar為前后輪側(cè)偏角;δ為車輛前輪轉(zhuǎn)角。
取狀態(tài)量x=(X,Y,φ,vx,vy,ω)T,控制量u=(FxT,δ)T,即式(9)可表示為
(10)
使用采樣時間為Δt的一階差商方法對式(10)進行離散化得
xk+1=Akxk+Bkuk
(11)
Ak=I+ΔtAtBk=ΔtBt
2.2.1控制量約束
約束條件如下:
(12)
式中,F(xiàn)xT,max為地面提供的最大縱向力;δmax為最大前輪轉(zhuǎn)角;Δδmax為前輪轉(zhuǎn)角變化率Δδ的最大值。
這里僅考慮制動避險,故縱向力取負值。
2.2.2輪胎附著力約束
考慮輪胎附著力約束,將前后軸輪胎的橫、縱向力限制在摩擦圓中:
(13)
(14)
α∈{f,r}
式中,F(xiàn)yα,max為忽略荷載轉(zhuǎn)移時的前后軸輪胎最大側(cè)向力;μ為地面附著系數(shù);G為重力。
由于道路邊界外環(huán)境的復(fù)雜性及難以預(yù)測性,這里僅討論在道路內(nèi)的避險規(guī)劃。采用圖4所示的對車輛前后軸中心限制的道路邊界約束:
圖4 道路邊界限制
(15)
α∈{f,r}
式中,Yu、Yl為道路上、下界的Y向坐標(biāo)值;rf、rr為車前后軸輪廓圓半徑;bf,k、br,k為第k個時刻前后軸中心的Y向坐標(biāo)值;Yk為第k個時刻質(zhì)心的橫向坐標(biāo)值。
2.4.1軌跡規(guī)劃問題的建立
智能車輛避險軌跡規(guī)劃的優(yōu)化問題描述如下:
(16)
s.t.k=1,2,…,N
xk=f(xk-1,uk-1)
(17)
E(xk,uk-1)≤1
(18)
bα,k∈lane,α∈{f,r}
(19)
x0=x(t)
(20)
xk∈Xtuk-1∈Utκk≤κmax
(21)
式(17)為車輛動力學(xué)離散模型;式(18)為輪胎摩擦圓約束,如式(13)所示;式(19)為道路邊界約束,如式(15)所示;式(20)為狀態(tài)量的初始值約束,其中x(t)為t時刻的車輛狀態(tài)量;式(21)為狀態(tài)量、控制量以及軌跡曲率的邊界約束,其中Xt、Ut、κmax為狀態(tài)量、控制量以及軌跡曲率的邊界值。
2.4.2軌跡規(guī)劃問題求解
2.4.2.1 分層優(yōu)化框架
式(16)所述的軌跡規(guī)劃問題具有非線性和非凸性。為實現(xiàn)高效求解并避免陷入局部最優(yōu),采用分層優(yōu)化算法[21-22](如圖5所示):上層為“暖啟動”層,采用曲線插值的方法[23]在可行域中搜索一條名義代價期望次優(yōu)軌跡作為下層優(yōu)化迭代的初始值;下層為數(shù)值優(yōu)化層,采用非線性優(yōu)化方法在上層給出的初始參考軌跡附近迭代優(yōu)化,得到滿足約束的最優(yōu)軌跡。
圖5 分層優(yōu)化框架
2.4.2.2 暖啟動層
圖6 暖啟動候選軌跡
2.4.2.3 數(shù)值優(yōu)化層
由于暖啟動參考軌跡未考慮車輛物理系統(tǒng)限制,需以其為初始值,在連續(xù)空間內(nèi)進一步迭代尋優(yōu)。對于式(16)所示的優(yōu)化問題,采用基于序列二次規(guī)劃(sequential quadratic programming,SQP)求解器的非線性模型預(yù)測控制算法(nonlinear model predictive control,NLMPC)進行優(yōu)化求解,得到滿足名義代價期望最低且符合車輛動力學(xué)、車輛物理約束的最優(yōu)軌跡X*。
文獻[16]根據(jù)對公眾的倫理調(diào)查結(jié)果,對IES模型參數(shù)進行了擬合,沖突概率模型參數(shù)根據(jù)經(jīng)驗選取,如表1所示。軌跡規(guī)劃算法及車輛主要參數(shù)如表2所示。
表1 名義代價與沖突概率模型參數(shù)
設(shè)計了3個涉及U2和U3傷害的沖突場景,場景信息如表3所示。假設(shè)車輛初始檢測到兩難困境時,位于當(dāng)前車道中心線上縱向距離1.434 m處,以60 km/h速度行駛,道路附著系數(shù)為0.7。
表3 仿真場景參數(shù)
3.3.1實驗結(jié)果
3個困境場景的直行制動軌跡、暖啟動參考軌跡、優(yōu)化后的最優(yōu)軌跡如圖7所示。車輛縱向力規(guī)劃、速度響應(yīng)如圖8所示。前輪轉(zhuǎn)角規(guī)劃如圖9所示。優(yōu)化軌跡的車輛前后輪輪胎附著力摩擦圓如圖10所示。三個困境場景的直行制動軌跡(Xbra)、暖啟動參考軌跡(Xwarm)、優(yōu)化軌跡(Xopt)對應(yīng)的對U2、U3方造成的傷亡人數(shù)期望、傷亡程度期望以及名義代價期望見表4~表6。
(a)場景1
圖8 車輛縱向力與速度變化曲線圖
圖9 車輛前輪轉(zhuǎn)角變化曲線圖
(a)場景1前輪摩擦圓 (b)場景1后輪摩擦圓
表4 場景1傷害與名義代價期望
表5 場景2傷害與名義代價期望
表6 場景3傷害與名義代價期望
3.3.2試驗結(jié)果分析
由圖7和表4~表6可知,場景1中最優(yōu)軌跡為制動并轉(zhuǎn)向進入對向車道,與U3方碰撞。與直行制動軌跡相比,雖然對U2、U3方的傷亡程度期望都有所增加,但對U2方的傷亡人數(shù)期望由3降至0.074,對U3方的傷亡人數(shù)期望由0增至0.999,最終使得名義代價期望由1.106下降到0.857。在實踐中及倫理調(diào)查中發(fā)現(xiàn),若違反規(guī)則可以顯著降低總的社會傷害代價時,公眾傾向于違反規(guī)則將風(fēng)險進行轉(zhuǎn)移至U3。
場景2中,最優(yōu)避險軌跡選擇違反規(guī)則越過道路實線,使得對U2的傷亡人數(shù)期望顯著降低(由2降至0.486),而對U3的傷害風(fēng)險略微增加(傷亡人數(shù)期望由0增至0.272),總的名義代價期望大幅降低(由直行制動的0.783減小至0.480)。優(yōu)化的避險軌跡基本符合公眾的顯著降低社會總傷害的預(yù)期。
場景3中,U2、U3方行人數(shù)量相同,轉(zhuǎn)向避險僅將風(fēng)險由U2轉(zhuǎn)移到U3方,不會產(chǎn)生傷亡程度期望和傷亡人數(shù)期望的顯著下降,智能車輛的用戶反而會因為轉(zhuǎn)移風(fēng)險至所謂“無辜”的第三方(即U3)而承擔(dān)法律風(fēng)險和道德壓力。最優(yōu)避險軌跡選擇以最大減速度直線行使,通過降低沖突速度以降低對人的傷害。
對比表4~表6,盡管場景1~3暖啟動參考軌跡產(chǎn)生最小名義代價期望,但暖啟動軌跡未考慮車輛物理系統(tǒng)限制,軌跡無法跟蹤。優(yōu)化后的避險軌跡的名義代價期望則是系統(tǒng)狀態(tài)可達條件下的最小名義代價。由圖10可知,3個場景下優(yōu)化軌跡的前輪胎縱橫向附著力始終位于輪胎的附著極限,充分利用了輪胎附著力實現(xiàn)轉(zhuǎn)向和減速。
(1)針對沖突各方均涉及人員傷害的兩難困境,綜合碰撞傷亡代價、法規(guī)、倫理和沖突不確定等因素,建立避險軌跡對沖突各方的名義代價期望模型,以量化對道路參與者的代價損失。
(2)基于所提出的名義代價期望模型,建立了困境下避險軌跡規(guī)劃的優(yōu)化問題。以名義代價期望為目標(biāo),車輛物理系統(tǒng)限制、道路邊界等為約束條件,采用分層優(yōu)化算法,解決了兩難困境中最優(yōu)避險軌跡的規(guī)劃問題。
(3)由3個涉及U2和U3傷害的兩難困境場景仿真實驗表明,所提出的方法獲得的優(yōu)化避險軌跡符合倫理實驗調(diào)查時的公眾預(yù)期。
(4)盡管本文僅討論了傷害涉及U2和U3方,提出的方法不失一般性,可滿足傷害同時涉及U1、U2和U3方的一般困境場景的避險規(guī)劃要求。