周雪峰,鄭長(zhǎng)江
(河海大學(xué)土木與交通學(xué)院,江蘇南京210098)
混合交通是我國(guó)城市道路交通運(yùn)行的顯著特征[1],其中行人與機(jī)動(dòng)車混行是其主要的表現(xiàn)形式,路段人行橫道是為了方便行人過(guò)街而設(shè)計(jì)的,在這一路段上存在著大量的人車混行。在國(guó)內(nèi)城市的次干道以及支路上,路段人行橫道一般都是無(wú)信號(hào)控制的,所以行人和機(jī)動(dòng)車在通過(guò)人行橫道時(shí)會(huì)引發(fā)沖突,導(dǎo)致行人或機(jī)動(dòng)車輛的搶行。王迎華等[2]通過(guò)實(shí)際交通調(diào)查,發(fā)現(xiàn)在無(wú)信號(hào)控制的人行橫道上,行人和機(jī)動(dòng)車的禮讓情況與雙方的數(shù)量及所占比重有關(guān)。從理論上分析了人、車的通行能力與延誤情況,并分別建立了無(wú)信號(hào)人行橫道處機(jī)動(dòng)車數(shù)量占優(yōu)及行人數(shù)量占優(yōu)時(shí)的人、車延誤模型。王俊驊等[3]通過(guò)運(yùn)用交通沖突技術(shù)理論,對(duì)上海市9個(gè)路段的無(wú)信號(hào)人行橫道上的行人與機(jī)動(dòng)車沖突過(guò)程進(jìn)行了全程錄像。通過(guò)獲得沖突過(guò)程中的車速變化過(guò)程、車輛運(yùn)行軌跡變化過(guò)程以及行人的避險(xiǎn)行為,建立了行人與機(jī)動(dòng)車沖突嚴(yán)重程度的辨別指標(biāo),對(duì)行人與機(jī)動(dòng)車沖突過(guò)程中行人以及機(jī)動(dòng)車的避險(xiǎn)特性進(jìn)行了定量的總結(jié)與分析。國(guó)外在此方面的研究,主要有兩種,一種是假定人行橫道處的機(jī)動(dòng)車具有先行權(quán),另一種是假定行人具有先行權(quán)[4]。而以上兩種假設(shè),都與國(guó)內(nèi)無(wú)信號(hào)控制人行橫道處行人與機(jī)動(dòng)車的實(shí)際運(yùn)行情況及有關(guān)規(guī)定不符。本文從博弈論的角度以行人與機(jī)動(dòng)車為例,對(duì)城市道路無(wú)信號(hào)控制路段人行橫道上的先行權(quán)進(jìn)行分析。
博弈論(game theory),是研究決策主體的行為發(fā)生直接相互作用時(shí)候的決策以及這種決策的均衡問(wèn)題的。從參與人行動(dòng)的先后順序角度看,博弈可以劃分為靜態(tài)博弈和動(dòng)態(tài)博弈。從參與人對(duì)有關(guān)其他參與人的特征、戰(zhàn)略空間及支付函數(shù)的認(rèn)識(shí)角度看,博弈可以劃分為完全信息博弈和不完全信息博弈。本文主要用到的是完全信息博弈[5]。
道路交通的參與人主要是行人和機(jī)動(dòng)車駕駛員,當(dāng)他們參與交通活動(dòng)時(shí),相互之間會(huì)有聯(lián)系同時(shí)也會(huì)有利益的沖突。在城市道路無(wú)信號(hào)控制路段人行橫道處,同時(shí)到達(dá)人行橫道處的機(jī)動(dòng)車與行人都希望自己先行通過(guò)人行橫道,而在實(shí)際生活中先行通過(guò)者只可以有一方,另一方則必須處于等待的位置,這樣就會(huì)存在利益沖突。再有,當(dāng)參與者其中一方先行搶行時(shí),相互都可以觀察到對(duì)方的行動(dòng),則此時(shí)當(dāng)另一方對(duì)自己的利益受到損害,會(huì)做出如何行動(dòng)。實(shí)質(zhì)上這些都是利益沖突的主體之間所進(jìn)行的博弈結(jié)果,即博弈一方的決策必然影響到其他博弈方的利益,并促使對(duì)方做出相應(yīng)反應(yīng),從而影響到博弈結(jié)局[6]。所以可以從博弈論的角度對(duì)這些現(xiàn)象進(jìn)行分析。
城市道路兩側(cè)存在著商店等吸引源,行人為了方便到對(duì)面會(huì)選擇橫穿馬路,從而與道路上行駛的機(jī)動(dòng)車產(chǎn)生沖突。在我國(guó)城市次干道以及支路中,一般是設(shè)置無(wú)控制的人行橫道來(lái)達(dá)到行人過(guò)街的目的,在一定程度上可以減少人機(jī)沖突發(fā)生的可能性。
從行人角度來(lái)看,本文是以單個(gè)行人為研究對(duì)象的,行人最突出的特點(diǎn)是行動(dòng)靈活,可以在極短的時(shí)間和距離內(nèi)改變自己的行動(dòng),所以在穿越過(guò)程中占據(jù)優(yōu)勢(shì)。當(dāng)行人到達(dá)判斷點(diǎn)后,會(huì)觀察交通環(huán)境,包括當(dāng)前的道路條件(人行橫道長(zhǎng)短等)及交通條件(車速、車輛間隙等),并根據(jù)以上信息來(lái)決定是否穿越。在穿越?jīng)Q策確定后,若行人判斷可以穿越,則會(huì)加速通過(guò)人行橫道;若行人判斷不可以穿越,則會(huì)減速慢行或是禮讓機(jī)動(dòng)車。
從機(jī)動(dòng)車角度來(lái)看,機(jī)動(dòng)車在穿越前駕駛員要觀察當(dāng)前的道路條件(車道等)和交通條件(行人間隙、行人速度等)。駕駛員會(huì)根據(jù)以上信息來(lái)決定是否穿越。之后駕駛員會(huì)根據(jù)自己的決策對(duì)機(jī)動(dòng)車進(jìn)行控制,執(zhí)行是穿越通過(guò)或是不穿越減速停車等待。即把穿越活動(dòng)分為兩個(gè)階段:穿越?jīng)Q策階段和穿越執(zhí)行階段。在穿越?jīng)Q策階段后,接下來(lái)是穿越執(zhí)行行為:若判斷穿越,則駕駛員執(zhí)行穿越行為;若判斷不穿越,則駕駛員執(zhí)行減速停車行為,一般情況下不停車,但也有部分駕駛員會(huì)采取換道改變行駛路徑繞行[8]。
行人和機(jī)動(dòng)車在通過(guò)無(wú)控制路段人行橫道時(shí),實(shí)際上是一個(gè)相互禮讓、相互阻撓的過(guò)程。圖1為南京市某路段人行橫道示意圖。
圖1 南京市某路段人行橫道Fig.1 A crosswalk of a certain road in Nanjing
假定在道路無(wú)信號(hào)控制路段人行橫道上,有一行人欲通過(guò)人行橫道到馬路對(duì)面,同時(shí)在道路上有一機(jī)動(dòng)車也正準(zhǔn)備駛過(guò)人行橫道。此時(shí)如果行人與機(jī)動(dòng)車都搶行,兩者必然會(huì)相互碰撞引發(fā)交通事故;如果行人與機(jī)動(dòng)車中至少有一方愿意讓行,則雙方都可以通過(guò)人行橫道。從雙方搶行的行為中可以看出,雙方一致認(rèn)為通過(guò)人行橫道的時(shí)間越短,自身所得的效用值就會(huì)越大。根據(jù)以上假設(shè),當(dāng)雙方都搶行時(shí),通過(guò)人行橫道的時(shí)間最長(zhǎng),但由于雙方心理上都沒(méi)有理虧,所以令雙方所得效用值都為5;當(dāng)一方禮讓而另一方選擇搶行時(shí),禮讓方雖然此時(shí)通過(guò)人行橫道的時(shí)間比雙方都搶行時(shí)的時(shí)間要短,但由于禮讓方心理上產(chǎn)生不舒服的感覺(jué)[9],因此對(duì)于禮讓方,他所獲效用值比雙方都搶行時(shí)所取得的效用值小,令其為4,搶行方此時(shí)的時(shí)間最短,所獲得的效用最大則令其為8;當(dāng)雙方都禮讓時(shí)雙方都會(huì)停下來(lái),此時(shí)產(chǎn)生等待時(shí)間,但他們通過(guò)人行橫道的時(shí)間應(yīng)介于雙方都搶行與僅有一方搶行之間,效用值也應(yīng)該介于上述兩種情況之間,假定雙方的效用值均為6。根據(jù)以上分析,可以建立表1的博弈矩陣模型。
表1 行人-機(jī)動(dòng)車搶行靜態(tài)博弈模型ITab.1 A complete information static game model I for grabbing the road between the pedestrians and the vehicles
行人和機(jī)動(dòng)車駕駛員都是理性的參與人,他們都會(huì)追求最大的效用值。對(duì)于行人來(lái)說(shuō),當(dāng)機(jī)動(dòng)車搶行時(shí),他根據(jù)效用值的對(duì)比也會(huì)選擇搶行,行人的效用對(duì)比式為5>4;當(dāng)機(jī)動(dòng)車禮讓時(shí),他根據(jù)效用值的對(duì)比還是會(huì)選擇搶行,此時(shí)行人的效用對(duì)比式為8>6。綜上所述,不管機(jī)動(dòng)車駕駛員是選擇搶行還是禮讓,行人的最優(yōu)策略都是搶行。同理可以分析出搶行也是機(jī)動(dòng)車駕駛員的最優(yōu)策略。
因此策略{搶行,搶行}的組合就成為了唯一的納什均衡。而對(duì)于策略{禮讓,禮讓},雖然可以使他們的效用值都變大,但不可以構(gòu)成納什均衡。根據(jù)以上分析,當(dāng)個(gè)體都是理性的參與者的時(shí),搶行就成為他們最好的策略選擇。此時(shí)就會(huì)陷入“囚徒困境”的悖論,這種結(jié)果對(duì)雙方都是不利的。
現(xiàn)在對(duì)民眾進(jìn)行交通安全宣傳教育,使民眾認(rèn)識(shí)到遵守交通法規(guī)的必要性,當(dāng)發(fā)生交通事故時(shí),此時(shí)所引起的危害會(huì)使兩者的效用損失得更大,所以在交通運(yùn)行過(guò)程中,禮讓是值得雙方選擇的策略。因此他們都會(huì)修改自己的效用值。假設(shè)修改表1中的效用值如表2。
現(xiàn)在對(duì)表2進(jìn)行分析,對(duì)于行人來(lái)說(shuō),不管機(jī)動(dòng)車駕駛員是選擇搶行還是禮讓,根據(jù)行人的效用對(duì)比8>5 和10>7 可知,禮讓總是行人的最優(yōu)策略;同理對(duì)機(jī)動(dòng)車來(lái)說(shuō),禮讓也是他的最優(yōu)策略。這樣策略{禮讓,禮讓}的組合就成為了唯一的納什均衡。這樣可以減少交通事故的發(fā)生,提高民眾的素質(zhì)文明出行,這也是交管部門期望看到的結(jié)果。
在表1的基礎(chǔ)上假設(shè)交管部門要對(duì)搶行行為進(jìn)行一定的處罰,因?yàn)樾腥耸侨鮿?shì)群體,所以機(jī)動(dòng)車的處罰力度相應(yīng)的要比行人高,我們假設(shè)行人的處罰力度為C,機(jī)動(dòng)車的處罰力度為2C,可以構(gòu)建新的博弈矩陣模型表3。
表2 行人-機(jī)動(dòng)車搶行靜態(tài)博弈模型IITab.2 A complete information static game model II for grabbing the road between the pedestrians and the vehicles
表3 行人-機(jī)動(dòng)車搶行靜態(tài)博弈模型ⅢTab.3 A complete information static game model Ⅲfor grabbing the road between the pedestrians and the vehicles
假設(shè)行人搶行的概率為P1,禮讓的概率為1-P1;機(jī)動(dòng)車搶行的概率為P2,禮讓的概率為1-P2。
給定P1,行人搶行時(shí)的期望收益Eg1函數(shù)為
Eg1=(5-C)P1+(8-C)P1
行人禮讓時(shí)的期望收益Eg2函數(shù)為
Eg2=4(1-P1)+6(1-P1)
令Eg1=Eg2[10],得到P1=,我們不希望行人搶行,希望它的概率盡量的小,所以令0 <P1<0.5,經(jīng)計(jì)算得0 <C<。同理,通過(guò)機(jī)動(dòng)車期望收益的計(jì)算得到相同的結(jié)果。
要使策略{禮讓,禮讓}的組合構(gòu)成唯一的納什均衡,同樣必須滿足下面的條件
解不等式(1),(2)可得C>,結(jié)合上面結(jié)果可得,通過(guò)對(duì)搶行行為的交通處罰,迫使搶行者的效用值下降在1/2到3/2個(gè)單位之間時(shí),策略{禮讓,禮讓}的組合就會(huì)變成納什均衡,雙方的最優(yōu)策略都是禮讓。
根據(jù)以上兩個(gè)博弈模型的分析,得到兩個(gè)觀點(diǎn):一是通過(guò)道路交通安全的宣傳教育來(lái)提高民眾的素質(zhì),讓他們主動(dòng)選擇禮讓,文明出行;二是當(dāng)民眾的交通安全意識(shí)不強(qiáng)時(shí),可以通過(guò)交管部門制定處罰條例迫使他們選擇禮讓行為。
在道路無(wú)信號(hào)控制路段人行橫道上,有一個(gè)行人欲通過(guò)人行橫道到馬路對(duì)面,同時(shí)在道路上一輛機(jī)動(dòng)車也正準(zhǔn)備駛過(guò)人行橫道,此時(shí)他們之間的距離要比靜態(tài)博弈時(shí)更近一些,雙方都可以覺(jué)察到對(duì)方的行動(dòng),此時(shí)轉(zhuǎn)化為完全信息動(dòng)態(tài)博弈。以行人為例,若他將機(jī)動(dòng)車定位為先行者,那他自己就是后行者;若他把自己定位為先行者,那機(jī)動(dòng)車就是后行者。同理在機(jī)動(dòng)車駕駛員心里自己與行人也有一個(gè)定位。雙方在交叉過(guò)程中都不希望發(fā)生交通事故,所以只要一方選擇搶行,則另一方的最優(yōu)策略為禮讓,這樣雙方才可以安全通過(guò)人行橫道。從雙方搶行的行為中可以看出,雙方一致認(rèn)為通過(guò)人行橫道的時(shí)間越短,自身所得的效用值就會(huì)越大。建立與靜態(tài)博弈相似的假設(shè),當(dāng)雙方都搶行時(shí),通過(guò)人行橫道的時(shí)間最長(zhǎng),但由于雙方心理上都沒(méi)有理虧,所以令雙方所得效用值都為5;先行者搶行而后行者禮讓時(shí),后行者雖然此時(shí)通過(guò)人行橫道的時(shí)間比雙方都搶行時(shí)的時(shí)間要短,但是由于后行者心理上產(chǎn)生不舒服的感覺(jué),因此對(duì)于后行者,他所獲效用值比雙方都搶行時(shí)所取得的效用值小,令其為6,先行者此時(shí)的時(shí)間最短,所獲得的效用最大則令其為8;先行者禮讓而后行者搶行時(shí),由于先行者搶行被視為“理所當(dāng)然”,而他卻選擇禮讓,則其所得效用值最小,令其為0,此時(shí)后行者搶行所得效用最大為8,若后行者也選擇禮讓,則其效用會(huì)小一些,令其所得效用為4。根據(jù)以上分析,可以建立如表4的博弈矩陣模型。
我們對(duì)表4進(jìn)行分析,對(duì)于后行者來(lái)說(shuō),當(dāng)先行者搶行時(shí),后行者的最優(yōu)策略是禮讓,因?yàn)楹笮姓叩男в脤?duì)比式為6>5;當(dāng)先行者禮讓時(shí),后行者的最優(yōu)策略是搶行,因?yàn)楹笮姓叩男в脤?duì)比式為8>4。但行人和機(jī)動(dòng)車駕駛員都是理性的參與人,他們都會(huì)追求最大的效用值,所以對(duì)于先行者來(lái)說(shuō),無(wú)論后行者選擇什么策略,他的最優(yōu)策略都是搶行。此時(shí),先行者禮讓這一策略就變成一個(gè)不可置信的戰(zhàn)略,應(yīng)該從均衡中剔除。這一模型就變成了子博弈精煉納什均衡模型,其最優(yōu)策略為先行者搶行,后行者禮讓,{搶行,禮讓}構(gòu)成了唯一的子博弈精煉納什均衡。根據(jù)表4可以得到圖2的博弈樹(shù)。
表4 行人-機(jī)動(dòng)車搶行動(dòng)態(tài)博弈模型ⅣTab.4 A complete information dynamic game model Ⅳfor grabbing the road between the pedestrians and the vehicles
圖2 行人-機(jī)動(dòng)車搶行動(dòng)態(tài)博弈樹(shù)Fig.2 A game tree for grabbing the road between the pedestrians and the vehicles
當(dāng)處于第一階段(完全信息靜態(tài)博弈)時(shí),通過(guò)一定的措施使它的最優(yōu)策略為{禮讓,禮讓}。在這一階段,如果沖突得以解決則就此結(jié)束,但如果沖突沒(méi)有解決,則將進(jìn)入第二個(gè)階段(完全信息動(dòng)態(tài)博弈)。在第二個(gè)階段中,一方變?yōu)橄刃姓?,另一方變?yōu)楹笮姓?,此時(shí)的最優(yōu)策略為{搶行,禮讓},雙方得以通過(guò)路口。這樣通過(guò)靜動(dòng)態(tài)的博弈,行人與機(jī)動(dòng)車的利益沖突最終會(huì)得到解決,減少了交通事故的發(fā)生。
在道路無(wú)信號(hào)控制路段人行橫道上,行人與機(jī)動(dòng)車發(fā)生著利益的沖突,作為理性的個(gè)體,各方都會(huì)從自身的角度出發(fā)來(lái)選擇何種交通行為。本文通過(guò)建立完全信息靜態(tài)博弈和動(dòng)態(tài)博弈兩個(gè)模型對(duì)兩者的交通行為進(jìn)行了分析,得出為了減少交通事故的發(fā)生,交管部門必須采取相應(yīng)的措施。
博弈論是研究決策主體的行為發(fā)生直接相互作用時(shí)候的決策以及這種決策的均衡問(wèn)題的,是用來(lái)解決一些交通問(wèn)題的新方法。運(yùn)用博弈論分析無(wú)信號(hào)控制路段人行橫道處行人與機(jī)動(dòng)車?yán)鏇_突的問(wèn)題,有利于深入了解雙方的交通行為選擇,為交管部門調(diào)節(jié)交通參與人的交通行為提供可靠的依據(jù),為解決無(wú)信號(hào)控制路段人行橫道處的利益沖突提供了新的思路。
[1]黃文忠,楊佩昆.無(wú)控制人行橫道處的行人和機(jī)動(dòng)車延誤分析[J].同濟(jì)大學(xué)學(xué)報(bào),1995,23(1):31-36.
[2]王迎華,李鳳超.無(wú)信號(hào)人行橫道人、車干擾分析[J].交通科技,2007(6):85-87.
[3]王俊弊,方守恩.路段行人—機(jī)動(dòng)車沖突觀測(cè)方法及沖突特性[J].同濟(jì)大學(xué)學(xué)報(bào),2008,36(4):503-507.
[4]GRIFFITHS J D.A mathematical model of a nonsignalized pedestrian crossing[J].Trans Science,1981,15(3):212-216.
[5]張維迎.博弈論與信息經(jīng)濟(jì)學(xué)[M].上海:上海人民出版社,2001:6-7
[6]易欣.房地產(chǎn)企業(yè)戰(zhàn)略聯(lián)盟行為的博弈分析[J].華東交通大學(xué)學(xué)報(bào),2012,29(4):96-101.
[7]鄭長(zhǎng)江,劉峰,黃曉迪.無(wú)信號(hào)控制路段人行橫道行人過(guò)街時(shí)間研究[J].武漢理工大學(xué)學(xué)報(bào),2012,36(3):475-476.
[8]唐勍勍.基于合作博弈的平面信號(hào)交叉口行人和機(jī)動(dòng)車干擾研究[D].北京:北京交通大學(xué),2010:34-36.
[9]邵祖峰.博弈論在道路交通管理中的應(yīng)用[J].道路交通與安全,2006,6(3):8-10.
[10]董甜甜,譚建春.博弈原理在解決交通擁擠中的分析[J].重慶師范大學(xué)學(xué)報(bào),2012,29(2):99-102.