王婉秋,肖凌云,馬明輝,錢宇彬
(1.上海工程技術(shù)大學(xué) 機(jī)械與汽車工程學(xué)院,上海 201620;2.國(guó)家市場(chǎng)監(jiān)督管理總局,北京 100101)
雙車道公路彎道是事故多發(fā)的路段。雙車道公路彎道事故機(jī)理的研究離不開雙車道公路彎道駕駛行為的研究。駕駛?cè)说鸟{駛行為影響因素眾多,包括彎道的三維線形、車輛的動(dòng)力學(xué)特性以及作為一個(gè)復(fù)雜生物的駕駛?cè)说母兄?、判斷,駕駛行為是各因素綜合作用的產(chǎn)物。PRAKASH[1]根據(jù)駕駛?cè)似谕囁?,建立基于人工神?jīng)網(wǎng)絡(luò)的駕駛?cè)怂俣瓤刂颇P?;LI[2]研究受彎道坡度和曲率影響的駕駛?cè)说乃俣饶P停籎ALALI[3]建立基于PID控制策略的多點(diǎn)預(yù)瞄速度控制模型,前視距離考慮駕駛?cè)说姆磻?yīng)時(shí)間和速度的影響;LEE[4]研究縱向速度控制模型和橫向轉(zhuǎn)向模型,橫向轉(zhuǎn)向模型考慮駕駛?cè)擞捎谑直奂∪庖鸬难舆t時(shí)間,以及受速度和曲線半徑影響的前視距離;GUAN[5]以逼近于理想解(TOPSIS)的方法將駕駛?cè)说哪:兄芰σ胂到y(tǒng)模型的建立;ZHUANG[6]引用基于誤差消除算法的人工神經(jīng)網(wǎng)絡(luò)方法尋求駕駛?cè)说淖顑?yōu)前視時(shí)間。部分學(xué)者將駕駛?cè)说哪:兄芰σ肽P?,但未考慮駕駛?cè)说闹饔^特性,部分學(xué)者在軌跡跟蹤模型中考慮了駕駛?cè)饲耙晻r(shí)間隨駕駛環(huán)境實(shí)時(shí)變化的特性,然而速度控制模型卻以跟隨期望車速為主,未考慮駕駛?cè)穗S著前方道路信息動(dòng)態(tài)確定速度的特性。本研究在文獻(xiàn)[7]中研究了駕駛?cè)说哪:兄饔^決策行為在雙車道公路駕駛行為中的影響,并進(jìn)行了建模,然而文獻(xiàn)[7]中前方道路線形對(duì)駕駛?cè)诵袨榈挠绊戇M(jìn)行了一定的假設(shè),假設(shè)前方道路線形首先影響駕駛?cè)说乃俣瓤刂菩袨?,然后在速度決策下,駕駛?cè)诉M(jìn)行方向控制,然而實(shí)際駕駛中,駕駛?cè)说乃俣瓤刂菩袨楹头较蚩刂菩袨橥峭竭M(jìn)行??紤]駕駛行為是駕駛?cè)司C合考慮前方道路線形,結(jié)合車輛動(dòng)力性能、自身的模糊分析和主觀判斷的結(jié)果,駕駛?cè)擞谢诙鄠€(gè)決策因素對(duì)多個(gè)目標(biāo)進(jìn)行優(yōu)化決策的能力,本研究選擇多目標(biāo)遺傳優(yōu)化算法研究駕駛?cè)说哪繕?biāo)決策過(guò)程。
首先研究受前方道路線形影響的決策因素和對(duì)應(yīng)目標(biāo)集的初始樣本,決策因素的初始樣本考慮駕駛?cè)说闹饔^傾向性,選取Beta分布抽樣和拉丁超立方抽樣;為了增加不同速度和轉(zhuǎn)角條件下目標(biāo)集因素的可比性,基于熵權(quán)方法和模糊理論建立目標(biāo)集的相對(duì)指標(biāo)值;然后引入NSGA_II多目標(biāo)遺傳算法,研究染色體編碼、交叉和變異操作、數(shù)據(jù)越界處理以及精英保留策略等若干關(guān)鍵問(wèn)題,得到?jīng)Q策因素的Pareto最優(yōu)解集;基于多目標(biāo)模糊優(yōu)選算法得到?jīng)Q策因素的最優(yōu)解;最后選取試驗(yàn)路段,通過(guò)2種仿真方法的仿真結(jié)果與實(shí)測(cè)結(jié)果的對(duì)比分析驗(yàn)證模型的有效性。
基于文獻(xiàn)[7]的研究,彎道的決策因素為車速V與方向盤轉(zhuǎn)角δ,目標(biāo)集為行駛軌跡弧長(zhǎng)L,側(cè)向偏移d,橫向力系數(shù)μ。初始樣本的獲取分為速度V的初始樣本的獲取和方向盤轉(zhuǎn)角δ的初始樣本的獲取。
參考文獻(xiàn)[7]的速度范圍[Vmin,Vmax],考慮駕駛?cè)嗽诒WC安全條件下追求較高車速的特性,車速V的初始樣本抽樣選取Beta分布隨機(jī)抽樣方法。Beta分布是定義在[0,1]區(qū)間的連續(xù)概率分布族,屬于偏態(tài)分布,形狀參數(shù)α=4,β=1,如圖1中曲線所示,其概率密度函數(shù)為:
圖1 Beta分布曲線(α=4,β=1)
(1)
式中,隨機(jī)變量Z∈[0,1],Γ表示gamma函數(shù)?;贐eta分布抽樣的結(jié)果Zk,k=1,2,…,M位于區(qū)間[0,1]間,需將其換算為區(qū)間[Vmin,Vmax]的值,即
V′k=Vmin+(Vmax-Vmin)Zk,k=1, 2,…,M。
(2)
對(duì)應(yīng)速度V′k的方向盤轉(zhuǎn)角范圍為[δkmin,δkmax],δkmin,δkmax為瞬時(shí)行駛軌跡圓弧與前方線形影響范圍存在交點(diǎn)的最小、最大方向盤轉(zhuǎn)角。方向盤轉(zhuǎn)角δ的初始樣本采用均勻分層抽樣的拉丁超立方抽樣方法,在[0,1]中隨機(jī)抽取N個(gè)樣本點(diǎn)Δkt,t=1,2,…,N,再將其換算為[δkmin,δkmax]區(qū)間的值,如式3所示,式中k=1,2,…,M,t=1,2,…,N。
δ′kt=δkmin+(δkmax-δkmin)Δkt。
(3)
為了統(tǒng)一速度和方向盤轉(zhuǎn)角的標(biāo)號(hào),將速度樣本進(jìn)行變換,V′kt=V′k,k=1,2,…,M,t=1,2,…,N,將決策變量以矩陣形式表示[Vi,δi],i=1,2,…,MN,其中Vi=V′kt,δi=δ′kt,i=1,2,…,MN,k=1,2,…,M,t=1,2,…,N。
依據(jù)文獻(xiàn)[7]中目標(biāo)集的計(jì)算方法,計(jì)算Vi,δi(i=1,2,…,MN)條件下的目標(biāo)集中行駛軌跡弧長(zhǎng)li、橫向力系數(shù)μi和側(cè)向偏移di(i=1,…,MN)。其中目標(biāo)集的指標(biāo)為絕對(duì)指標(biāo),考慮速度V和方向盤轉(zhuǎn)角δ的差異性,為了增加目標(biāo)集之間的可比性,依據(jù)式(4),將目標(biāo)集的指標(biāo)變換為相對(duì)指標(biāo)。
(4)
式中,WV,WS分別為速度V和方向盤轉(zhuǎn)角δ的權(quán)重,采用熵權(quán)法[8-9]計(jì)算。該法依據(jù)指標(biāo)的變異性大小確定權(quán)重,即指標(biāo)的變異性越大,其信息熵越小,則權(quán)重越大。將Vi,δi(i=1,2,…,MN)進(jìn)行標(biāo)準(zhǔn)化處理后得V′i,δ′i(i=1,2,…,MN),其對(duì)應(yīng)信息熵EV,ES計(jì)算式為式(5)。
(5)
通過(guò)信息熵,由式(6)計(jì)算速度V和方向盤轉(zhuǎn)角δ的權(quán)重WV,WS。
(6)
考慮駕駛?cè)藢?duì)目標(biāo)集相對(duì)指標(biāo)l′i,μ′i,d′i(i=1,2,…,MN)的感受具有模糊性,即行駛軌跡弧長(zhǎng)l′i具有越長(zhǎng)越好的模糊性,橫向力系數(shù)μ′i和側(cè)向偏移d′i具有越小越好的模糊性。“越……,越……”的模糊性用相對(duì)隸屬度[10]進(jìn)行描述,計(jì)算式為式(7)。
(7)
式中,rli,rμi,rdi分別為目標(biāo)集相對(duì)指標(biāo)l′i,μ′i,d′i的相對(duì)隸屬度。
涉及2個(gè)決策、3個(gè)目標(biāo)的優(yōu)化問(wèn)題的數(shù)學(xué)模型描述為如下優(yōu)化模型:
maxrli, maxrμi, maxrdi
(8)
本研究采用非支配的精英策略遺傳算法NSGA_Ⅱ?qū)δP?進(jìn)行優(yōu)化。該方法包括染色體編碼、交叉和變異操作、數(shù)據(jù)越界處理以及精英保留策略等若干關(guān)鍵問(wèn)題。
依據(jù)第1節(jié),第2節(jié)決策集、目標(biāo)集初始樣本的獲取方法,種群染色體以向量形式進(jìn)行編碼,如式(9),染色體包括7個(gè)基因,基因以實(shí)數(shù)表示。
B=[V,δ,rl,rμ,rd,R,D],
(9)
式中,基因rl,rμ,rd,R,D由基因V,δ計(jì)算得到。基因V,δ為個(gè)體的決策集信息,在約束條件里按Beta分布和拉丁超立方分布隨機(jī)取值,如1節(jié)所示;基因rl,rμ,rd為個(gè)體的目標(biāo)集相對(duì)指標(biāo)信息,計(jì)算方法如2節(jié)所示;基因R為個(gè)體的非支配等級(jí),通過(guò)擂臺(tái)法[11]構(gòu)造Pareto非支配集,并按非支配排序[12]計(jì)算得到;基因D為個(gè)體的擁擠距離值[12],即D=Dl+Dμ+Dd,其中Dl,Dμ,Dd分別為基因rl,rμ,rd的擁擠距離值。
基于種群染色體的編碼B,得到初始種群矩陣M=[B1,B2,…,BMN]T,Bi=[Vi,δi,rli,rμi,rdi,Ri,Di],i=1,2,…,MN。
3.2.1 種群選擇
采用錦標(biāo)賽法[12]從初始種群M選擇適合繁殖的父代進(jìn)入競(jìng)標(biāo)池。每次隨機(jī)選擇2個(gè)相異個(gè)體Bi,Bj,i≠j,比較其非支配等級(jí)Ri和Rj。若Ri≠Rj,留下max(Ri,Rj)的個(gè)體;若Ri=Rj,則比較擁擠距離值Di,Dj,選擇max(Di,Dj)的個(gè)體。
3.2.2 交叉算子
(10)
式中,ω為傳播因子,定義為第t代父代個(gè)體p1,p2的解碼實(shí)數(shù)值差值與第t+1代子代個(gè)體c1,c2解碼實(shí)數(shù)值差值的比值。由第t代父代個(gè)體p1,p2的二進(jìn)制串分割位點(diǎn)的隨機(jī)性,得滿足一定概率u的ω值計(jì)算式(11)。
(11)
基于1.1節(jié)染色體編碼一節(jié)的內(nèi)容,第t+1代染色體的基因rl(t+1),rμ(t+1),rd(t+1),Rt+1,Dt+1的交叉值由第t+1代染色體基因Vt+1,δt+1的交叉值計(jì)算得到。
3.2.3 變異算子
(12)
式中,ui為[0,1]區(qū)間內(nèi)的隨機(jī)數(shù);ηm為分布指數(shù),ηm>0。
3.2.4 越界處理
依據(jù)染色體的基因V,δ取值的約束條件δ∈[δmin,δmax],V∈[Vmin,Vmax],經(jīng)過(guò)交叉和變異操作的第t+1代染色體基因值V,δ存在越界處理。鑒于本研究?jī)?yōu)化目標(biāo)數(shù)為3,每代種群的最優(yōu)解為Pareto解集,常規(guī)取端點(diǎn)值的越界處理方法,會(huì)造成種群Pareto解集在在邊界過(guò)于集中,從而影響種群的多樣性,本研究提出基于Beta分布抽樣的越界處理方法。Beta分布的偏態(tài)分布特性,使得越界基因值V,δ在邊界附近取值的概率大,保證了基因V,δ值接近端點(diǎn)值的特性,而且隨機(jī)抽樣方法也保證了種群的多樣性。以S代表V,δ,針對(duì)S>Smax的越界情況,兼顧種群的多樣性和端點(diǎn)值的逼近性,Beta分布形狀參數(shù)取α=30、β=1.2,如圖2中曲線1,基于Beta分布抽樣的結(jié)果,將其換算為區(qū)間[Smin,Smax]的值,越界基因值S在邊界Smax附近取值的概率大;針對(duì)S 圖2 Beta分布 為了保留父代種群Mft=[B1t,B2t,…,BMNt]T和子代種群Mct=[B1(t+1),B2(t+1),…,BMN(t+1)]T的優(yōu)良個(gè)體,將其合并為R(t+1)=[B1t,…,BMNt,B1(t+1),…,BMN(t+1)]T,基于3.2.1節(jié)的精英保留策略從R(t+1)中選擇MN個(gè)精英個(gè)體組成新一代種群。 由NSGA_II多目標(biāo)遺傳算法獲得Pareto最優(yōu)解集MP=[Bp1,…,BpMN]T,Bpi=[Vi,δi,rli,rμi,rdi,Ri,Di]i=1,2,…,MN,駕駛?cè)藦腜areto最優(yōu)解集Mp中挑選最優(yōu)解Bpi的決策因素是目標(biāo)集相對(duì)隸屬度指標(biāo)rli,rμi,rdi,i=1,2,…,MN,其決策過(guò)程需考慮駕駛?cè)说哪:兄⒅饔^決策能力。本研究引用文獻(xiàn)[7]的相關(guān)研究成果,基于最優(yōu)解集Mp中個(gè)體Bpi的目標(biāo)集相對(duì)隸屬度指標(biāo)rli,rμi,rdi,i=1,2,…,MN,建立多目標(biāo)模糊優(yōu)選決策模型,權(quán)重的確定采用文獻(xiàn)[7]主客觀權(quán)重確定方法,客觀權(quán)重采用灰色關(guān)聯(lián)分析法[17-18],駕駛?cè)藢?duì)權(quán)重的主觀感受通過(guò)主觀傾向性曲線模型[7]對(duì)相對(duì)指標(biāo)l′,μ′和d′進(jìn)行無(wú)量綱化的方法引入。主觀傾向性曲線模型見式(13),以m代表相對(duì)指標(biāo)l′,μ′和d′的值,W為m對(duì)應(yīng)的無(wú)量綱值,mmax,a為待定參數(shù),mmax代表相對(duì)指標(biāo)l′,μ′和d′的邊界因子mlmax,mμmax和mdmax,a為主觀傾向因子。基于多目標(biāo)模糊優(yōu)選決策模型選擇最優(yōu)個(gè)體Bpi,從而獲得駕駛?cè)藅時(shí)刻的最優(yōu)速度Vp和最優(yōu)方向盤轉(zhuǎn)角δp。 W=1-exp(-(Z)a),Z=1/(1-m/mmax)-1。 (13) 本研究選取安徽省合肥市境內(nèi)的S311(合水公路),采集5處曲線路段過(guò)往車輛的車速與行駛軌跡,數(shù)據(jù)采集方法參見文獻(xiàn)[7],不再贅述。初始觀測(cè)斷面為直線和前緩和曲線交點(diǎn)前60 m的位置,其上采集的85%分位統(tǒng)計(jì)車速作為試驗(yàn)路段的初始車速,其余觀測(cè)斷面(直線和前緩和曲線交點(diǎn)ZH、前緩和曲線和圓曲線交點(diǎn)HY、圓曲線和后緩和曲線交點(diǎn)YH 和后緩和曲線與直線交點(diǎn)HZ)的特征車速V85,以及觀測(cè)斷面(圓曲線中點(diǎn)QZ)和觀測(cè)斷面(HY 和HZ)附近的行車軌跡側(cè)向偏移最大值Δdmax作為駕駛?cè)四P万?yàn)證的數(shù)據(jù)來(lái)源[7]。 參數(shù)M=20,N=20,初始種群大小為MN=400,最大迭代次數(shù)為100,交叉概率Pc=0.9,變異概率Pm=0.1,分布指數(shù)ηm=10。試驗(yàn)彎道的曲線半徑R=160 m,前緩和曲線長(zhǎng)度60 m,圓曲線長(zhǎng)160 m,后緩和曲線長(zhǎng)60 m,圓曲線超高6%,初始車速V0=61.52 km/h,最大加速度amax=0.55g,最大減速度a′max=-0.1g,緩和曲線和圓曲線內(nèi)的前方線形影響范圍l=[0,0.3V],直線路段前方線形影響范圍l=[0.3V,0.6V]。采用本研究中NSGA_Ⅱ多目標(biāo)遺傳算法,編程完成試驗(yàn)路段駕駛?cè)四P偷慕⒑颓蠼?。本研究抽取位于前緩和曲線路段、圓曲線路段、后緩和曲線路段內(nèi)的3個(gè)特征斷面,其里程樁號(hào)分別為208.40,304.46,371.90 m,3個(gè)特征斷面的目標(biāo)集相對(duì)隸屬度指標(biāo)rl,rμ,rd的初始樣本值與Pareto最優(yōu)解集如圖3~圖5中(a)、(b)所示。 圖3 208.40 m里程點(diǎn)的目標(biāo)集初始樣本值與Pareto最優(yōu)解集 圖4 304.46 m里程點(diǎn)目標(biāo)集初始樣本值與Pareto最優(yōu)解集 圖5 里程點(diǎn)371.90 m目標(biāo)集的初始樣本值與Pareto最優(yōu)解集 從圖3、圖4、圖5(b)中Pareto最優(yōu)解集知,當(dāng)車輛處于前緩和曲線路段和后緩和曲線路段時(shí),隨著rl的增大,rμ,rd的值減??;當(dāng)車輛位于圓曲線段內(nèi),隨著rl的增大,rμ值減小,rd值增大。目標(biāo)集相對(duì)隸屬度指標(biāo)rl,rμ,rd在試驗(yàn)段內(nèi)不會(huì)同時(shí)達(dá)到最優(yōu)。針對(duì)Pareto最優(yōu)解集采用多目標(biāo)模糊優(yōu)選決策算法獲得最優(yōu)解,其中目標(biāo)集相對(duì)指標(biāo)l′,μ′,d′的主觀傾向性模型參數(shù)值由試算法獲得,使特征斷面的運(yùn)行車速和行駛軌跡仿真值盡可能的接近于實(shí)測(cè)值,通過(guò)試算,mlmax=0.7l′max,mμmax=1.2μ′max,mdmax=1.2d′max(其中l(wèi)′max,μ′max,d′max為相對(duì)指標(biāo)l′,μ′,d′的最大值),主觀傾向因子a=2.0。試驗(yàn)路段的決策變量V,δ的仿真數(shù)據(jù)和實(shí)測(cè)數(shù)據(jù)的對(duì)比如圖6所示。 圖6 R=160 m試驗(yàn)段運(yùn)行車速和行駛軌跡試驗(yàn)值與基于NSGA_Ⅱ多目標(biāo)遺傳算法的仿真值對(duì)比 從圖6可以看出,融合NSGA_Ⅱ多目標(biāo)遺傳算法和模糊優(yōu)選決策算法的駕駛?cè)四P洼^好地模擬了駕駛?cè)说倪\(yùn)行車速和行駛軌跡,其值與實(shí)測(cè)值差異性較小,特別在圓曲線路段,車速仿真值存在小幅度的加速行為,其值與試驗(yàn)數(shù)據(jù)較為接近。整個(gè)彎道車速總平均誤差為0.46%,行駛軌跡誤差最大點(diǎn)(QZ點(diǎn)附近)的誤差值為37%,如圖6(a)、(b)圖所示。與此對(duì)應(yīng),將文獻(xiàn)[7]中多目標(biāo)模糊優(yōu)選決策算法應(yīng)用于此試驗(yàn)路段,仿真結(jié)果與實(shí)測(cè)數(shù)據(jù)的對(duì)比如圖7所示,圓曲線路段,車輛基本處于勻速行駛狀態(tài)。在圖7中,運(yùn)行車速和行駛軌跡的仿真值與實(shí)測(cè)值的差異性較大,車速仿真值與試驗(yàn)值的總平均誤差為1.83%,行駛軌跡誤差最大點(diǎn)(QZ點(diǎn)附近)的誤差值為67%,均大于本研究方法的仿真誤差值。這與文獻(xiàn)[7]中將駕駛?cè)四P瓦M(jìn)行了一定的假設(shè)和簡(jiǎn)化計(jì)算有關(guān),其假設(shè)駕駛?cè)说乃俣瓤刂菩袨橄扔谲壽E跟蹤行為完成,決策Vi的目標(biāo)值視為綜合值,即在速度Vi下,m個(gè)方向盤轉(zhuǎn)角δk∈X。 圖7 R=160 m試驗(yàn)段運(yùn)行車速和行駛軌跡試驗(yàn)值與基于NSGA_Ⅱ多目標(biāo)模糊優(yōu)選決策算法的仿真值對(duì)比 X={δ1,δ2,…,δm} 對(duì)應(yīng)的目標(biāo)值的綜合值,忽視了決策Vi,δk∈X引起的目標(biāo)值的微觀變化。 選擇曲線半徑R=240 m的試驗(yàn)路段,依據(jù)本研究中2種仿真方法對(duì)其進(jìn)行仿真計(jì)算,試驗(yàn)值與仿真值的對(duì)比如圖8、9所示,車速仿真值與試驗(yàn)值的總平均誤差分別為1.2%和2.0%,行駛軌跡誤差最大點(diǎn)(QZ點(diǎn)附近)的誤差值分別為7.0%和48%。同理可知,采用融合NSGA_Ⅱ多目標(biāo)遺傳算法和模糊優(yōu)選決策算法的仿真結(jié)果優(yōu)于單純采用多目標(biāo)模糊優(yōu)選決策算法的仿真結(jié)果,其較好地模擬了駕駛?cè)说倪\(yùn)行車速和行駛軌跡,與試驗(yàn)數(shù)據(jù)較為接近。其余試驗(yàn)路段受篇幅限制不再贅述。 圖8 R=240 m試驗(yàn)段運(yùn)行車速和行駛軌跡試驗(yàn)值與基于NSGA_Ⅱ多目標(biāo)遺傳算法的仿真值對(duì)比 圖9 R=240 m試驗(yàn)段運(yùn)行車速和行駛軌跡試驗(yàn)值與基于NSGA_Ⅱ多目標(biāo)模糊優(yōu)選決策算法的仿真值對(duì)比 本研究針對(duì)雙車道公路駕駛?cè)四P椭?個(gè)決策變量、3個(gè)相互沖突目標(biāo)的多目標(biāo)優(yōu)化問(wèn)題,研究了基于NSGA_Ⅱ的多目標(biāo)遺傳優(yōu)化算法,算法中涉及了初始樣本的抽樣、目標(biāo)值的計(jì)算、交叉和變異算法、數(shù)據(jù)越界處理等若干關(guān)鍵問(wèn)題的分析和求解;采用多目標(biāo)模糊優(yōu)選決策算法對(duì)優(yōu)化結(jié)果進(jìn)行決策得到最優(yōu)解。通過(guò)2種仿真方法與試驗(yàn)數(shù)據(jù)的對(duì)比分析,驗(yàn)證了本研究提出的模型及算法的有效性。結(jié)果表明,采用基于NSGA_Ⅱ和模糊優(yōu)選決策聯(lián)合優(yōu)化算法的仿真結(jié)果試實(shí)驗(yàn)數(shù)據(jù)具有較好的一致性。3.3 精英保留策略
4 多目標(biāo)模糊優(yōu)選決策
5 試驗(yàn)結(jié)果及分析
6 結(jié)論