郭運瑞,董瑞
(河南科技學院,河南新鄉(xiāng)453003)
城市機動交通與非機動交通的演化博弈分析
郭運瑞,董瑞
(河南科技學院,河南新鄉(xiāng)453003)
利用演化博弈中的動態(tài)復制方法,以城市內城區(qū)的機動交通群與非機動交通群為研究對象,對機動交通與非機動交通隨機配對后,根據(jù)鷹鴿博弈的思想建立了博弈雙方的收益矩陣.討論了交通執(zhí)法頻率、范圍和力度等模型參數(shù),易發(fā)生交通擁堵路段的機動交通與非機動交通違規(guī)選擇的影響,解釋了城市交通擁堵的部分原因:出行者的個人素質因素和地方政府交通執(zhí)法因素.
演化博弈;復制動態(tài);交通擁堵;穩(wěn)定性
我國的交通擁堵問題首先出現(xiàn)在特大城市,很快省會城市、計劃單列市也卷入交通擁堵之中,甚至一些三線城市都相繼出現(xiàn)了嚴重的交通擁堵狀況.交通擁堵對經(jīng)濟發(fā)展和居民生活產(chǎn)生了很多負面影響:增加了城市的建設費用、降低了基礎設施的使用壽命,增加了居民的出行時間、出行費用等成本,降低了居民的生活質量,交通事故頻發(fā)、交通事故隱患嚴重,城市大范圍、長時間的交通擁堵,嚴重阻礙城市經(jīng)濟社會的健康發(fā)展[1].造成城市交通擁擠的原因很多,我國城市化速度快、私家車輛劇增,而道路的設施運輸能力和交通管理措施沒有及時地配套跟進,城市交通信號控制不能發(fā)揮作用等都是形成和加劇擁堵的原因.大城市以功能分區(qū)進行規(guī)劃,增大了市民的出行需要,加重了市民對私人汽車的依賴,同時也加重了城市公共交通負擔.還有一些城市商業(yè)區(qū)域過于集中于市中心,各種服務、商品集中在一條街上,人流量非常大,但卻沒有提供足夠的停車位,機動車道、人行道的空間嚴重不足[2-4].
大中型城市普遍存在的行人、非機動車和機動車三元混合交通流結構,使得現(xiàn)有道路交通設施的運輸能力得不到充分利用.交通管理只是在路口進行,而中間路段是機動車和行人混行,流量大、管理亂,從而造成在特定地區(qū)和特定時段的交通癱瘓.本文應用演化博弈理論的思想和方法,把出行人群是否遵守交通規(guī)則當作一個學習的漸進演化系統(tǒng),強調博弈的動態(tài)性和宏觀性,并注重從分析影響系統(tǒng)演化過程及演化穩(wěn)定的出行人素質及交通法規(guī)執(zhí)行等因素的角度,對出行人群中機動車司機與非機動車及行人的策略進行研究.
演化博弈論是把博弈論和生物演化過程分析結合起來的一種新理論,它起源于行為生態(tài)學和生物進化論[5-6].演化博弈論研究的對象是一個“種群”,而不是單個的參與者.演化博弈思想用于分析交通擁堵問題的文獻比較少,文獻[7]建立了單總體出行方式演化博弈模型.由于出行者的有限理性,其最佳策略就是模仿和改進過去自己和別人的最有利戰(zhàn)略.通過長期的模仿和改進,所有的博弈方會趨于某個穩(wěn)定的策略,這個穩(wěn)定的策略被稱為“演化穩(wěn)定策略”(evolutionary stable strategy,ESS)[6].當出行者絕大多數(shù)選擇某種策略(遵守交規(guī)或者不遵守)時,少數(shù)人違背這種策略對自己不利.在大群體反復博弈中,復制動態(tài)(replication dynamics)演化博弈是常用的一種.復制動態(tài)是描述某一特定策略在一個種群中被采用的比例或頻率的動態(tài)微分方程,其動態(tài)變化速度可以用動態(tài)微分方程表示,式中x為一個種群中博弈方采用策略S的比[6].
為了研究方便,本文引入符號如下:
x:內城區(qū)行駛的機動車輛選擇遵守交通規(guī)則的概率;
y:內城區(qū)行駛的非機動車輛和行人選擇遵守交通規(guī)則的概率;
u1,u2:分別表示機動車和非機動車遵守交規(guī)時通行某路段的支付;
v1:機動交通遵守交規(guī),非機動交通不遵守時節(jié)省的等待支付;
v2:非機動交通遵守交規(guī),機動交通不遵守時節(jié)省的等待支付;
p1:機動交通遵守交規(guī),非機動交通不遵守時發(fā)生交通事故的概率;
p2:非機動交通遵守交規(guī),機動交通不遵守時發(fā)生交通事故的概率;
p3:兩者均不遵守交規(guī)時發(fā)生交通事故的概率;
q1:機動交通不遵守交規(guī)被處罰的概率;
q2:非機動交通不遵守交規(guī)被處罰的概率;
g1:機動交通不遵守交規(guī)由處罰引發(fā)的支付;
g2:非機動交通不遵守交規(guī)由處罰引發(fā)的支付;
f1,f2:分別表示機動交通遵守交規(guī),非機動交通不遵守時由交通事故引發(fā)的兩者的支付;f3,f4:分別表示機動交通不遵守交規(guī),非機動交通遵守時由交通事故引發(fā)的兩者的支付;f5,f6:分別表示二者均不遵守時由交通事故引發(fā)的兩者的支付;
3.1 博弈主體
以機動交通方式出行者與以非機動交通方式出行者作為城市內城區(qū)某些路段(路口與非路口)交通擁堵形成與發(fā)展的兩大因素,二者的行為發(fā)展遵循著演化博弈論的基本假設.
3.2 策略選擇
雙方的策略集合分別為C(遵守交規(guī),不遵守交規(guī))和L(遵守交規(guī),不遵守交規(guī)).當兩者都選擇遵守交規(guī)時,就會選擇耐心等待,交通擁堵狀況就會緩解甚至不會發(fā)生擁堵;當機動交通選擇遵守交規(guī)時而非機動交通選擇不遵守時,可以減少自己的等待時間,但同時增加了發(fā)生事故的風險;當交通擁堵嚴重、等待時間過長時,非機動交通也有不遵守交規(guī)的動力;當兩者都選擇不遵守交規(guī)時,擁堵狀況嚴重.這種發(fā)展系統(tǒng)是通過自身的演化所形成的,機動交通和非機動交通根據(jù)對方的策略選擇,考慮在自身群體中的相對適應性來選擇和調整各自的策略.
3.3 收益矩陣
根據(jù)鷹鴿博弈[5]的思想建立機動交通與非機動交通博弈的收益矩陣如表1所示:
表1 機動交通與非機動交通博弈的支付矩陣Tab.1 PayingMatrix ofevolutionary game ofmotorized and non-motorized transport
3.4 機動交通與非機動交通演化博弈支付分析
3.4.1 機動交通的支付分析當機動交通選擇遵守交規(guī)時,其支付為
當機動交通選擇不遵守交規(guī)時,其支付為
因此,機動交通的平均支付為
由此可得到機動交通選擇遵守交規(guī)的復制動態(tài)方程為
3.4.2非機動交通的支付分析同機動交通的支付分析過程類似,同樣可以得到非機動交通選擇聯(lián)動發(fā)展時的復制動態(tài)方程為
3.5 機動交通與非機動交通演化博弈穩(wěn)定性分析
(1)在平衡點E1(0,0),系統(tǒng)在平衡點E1(0,0)的穩(wěn)定情況有如下3種:①當機動交通與非機動交通均可以由交通違章獲得便利(v1>0,v2>0),減少支付,因違章被交管部門懲罰而增加的支付(q1g1,q2g2)非常少,是否交通違規(guī)對由交通事故引發(fā)的支付影響不大時, P2>0,Q2>0時,由于det J>0,trJ<0,平衡點E1(0,0)是系統(tǒng)的穩(wěn)定點;②當全路段檢查交通違規(guī),機動交通與非機動交通都會因違規(guī)被查而帶來較大的支付時,P2<0,Q2<0,由于det J>0,trJ>0平衡點E1(0,0)是系統(tǒng)的不穩(wěn)定平衡點;③當全路段檢查交通違規(guī),機動交通會因違規(guī)被查而帶來較大的支付而非機動交通不會因違規(guī)而增加支付時,P2Q2<0,由于det J<0,平衡點E1(0,0)是系統(tǒng)的鞍點.
(2)在平衡點E2(0,1),系統(tǒng)在平衡點E2(0,1)的穩(wěn)定情況有如下3種:①當機動交通可以由交通違章獲得便利(v1>0),減少支付,因違章被交管部門懲罰而增加的支付(q1g1)非常少,而非機動交通因違章被交管部門懲罰而增加的支付(q2g2)比較大時,P1-P2<0,Q2<0,由于det J>0,trJ<0,平衡點E2(0,1)是系統(tǒng)的穩(wěn)定點,但這種情況實際上幾乎不會發(fā)生;②當發(fā)生與①相反的情況時,P1-P2>0,Q2>0,由于det J>0,trJ>0,平衡點E2(0,1)是系統(tǒng)的不穩(wěn)定平衡點;③當全路段檢查交通違規(guī),機動交通與非機動交通都會因違規(guī)被查而帶來較大的支付或者全路段均不檢查交通違規(guī)時,(P1-P2)Q2<0,由于det J>0,平衡點是系統(tǒng)的鞍點.
(4)在平衡點E4(1,1),系統(tǒng)在平衡點E4(1,1)的穩(wěn)定情況有如下3種:①當全路段檢查交通違規(guī),機動交通與非機動交通都會因違規(guī)被查而帶來較大的支付時,(P1-P2)<0,(Q1-Q2)<0,由于,平衡點E4(1,1)是系統(tǒng)的穩(wěn)定點;②當機動交通與非機動交通均可以由交通違章獲得便利,因違章被交管部門懲罰而增加的支付非常少發(fā)生與①相反的情況時,(P1-P2)>0,(Q1-Q2)>0,由于平衡點E4(1,1)是系統(tǒng)的不穩(wěn)定平衡點;③當全路段檢查交通違規(guī),機動交通與非機動交通只有一方會因違規(guī)被查而帶來較大的支付時(,Q1-Q2)(P1-P2)<0,由于detJ< 0,平衡點E(41,1)是系統(tǒng)的鞍點.
trJ=0,下面對P2Q(2P1-P2)(Q1-Q2)P1Q1的符號進行分析.當博弈方生在交通非常擁擠的路段,機動交通與非機動交通同時選擇違規(guī)與單方違規(guī)相比只是加重了擁擠的程度,并不增加雙方由交通事故引發(fā)的支付時,可假定P1>0,Q1>0.當全段交通違規(guī)檢查,機動交通與非機動交通都會由于違規(guī)招致的懲罰支付遠大于違規(guī)產(chǎn)生的便利時(,P1-P2)>0(,Q1-Q2)>0,P2<0,Q2<0,因此detJ< 0;當機動交通與非機動交通均可以由交通違章獲得便利,而因違章被交管部門懲罰而增加的支付非常少時(,P1-P2)>0(,Q1-Q2)>0, P2>0,Q2>0,因此detJ< 0;當全路段檢查交通違規(guī),機動交通與非機動交通只有一方會因違規(guī)被查而帶來較大的支付時(,Q1-Q2)(P1-P2)<0,P2Q2<0,detJ< 0.綜上,detJ< 0恒成立.
本文根據(jù)鷹鴿博弈的思想建立了機動交通與非機動交通博弈的收益矩陣,得到5個平衡點E1(0,0),E2(0,1),E3(1,0),E4(1,1)和進一步分析發(fā)現(xiàn)各平衡點僅在特定情況下才能成為穩(wěn)定點:當機動交通與非機動交通均可以由交通違章獲得便利,減少支付,因違章被交管部門懲罰而增加的支付非常少,是否交通違規(guī)對由交通事故引發(fā)的支付影響不大時,平衡點E1(0,0)是系統(tǒng)的穩(wěn)定點;當機動交通可以由交通違章獲得便利,減少支付,因違章被交管部門懲罰而增加的支付非常少,而非機動交通因違章被交管部門懲罰而增加的支付比較大時,平衡點E2(0,1)是系統(tǒng)的穩(wěn)定點,但這種情況實際上幾乎不會發(fā)生;當非機動交通可以由交通違章獲得便利,減少支付,因違章被交管部門懲罰而增加的支付非常少,而機動交通因違章被交管部門懲罰而增加的支付比較大時,平衡點E3(1,0)是系統(tǒng)的穩(wěn)定點;當全路段檢查交通違規(guī),機動交通與非機動交通都會因違規(guī)被查而帶來較大的支付時,平衡點E4(1,1)是系統(tǒng)的穩(wěn)定點;而平衡點不會成為穩(wěn)定點.可見僅在當全路段檢查交通違規(guī),機動交通與非機動交通都會因違規(guī)被查而帶來較大的支付時,模型的演化穩(wěn)定策略是(遵守交規(guī),遵守交規(guī)).即要想減少因機動交通與非機動交通不守交規(guī)而引起的交通擁堵,嚴格檢查交通違規(guī)并嚴厲處罰才能實現(xiàn)雙方的守法.
文中模型只考慮了嚴格執(zhí)法給機動交通與非機動交通帶來的懲罰性支付,并未涉及交通執(zhí)法成本和當事人守法意識等問題,模型不能很好地作為對現(xiàn)實交通情景的準確抽象.應該認識到除了復制動態(tài),演化博弈還有更加先進的學習機制,比如強化學習、適應性學習的機制,今后需對它們做進一步的應用研究.
[1]劉波.緩解城市交通擁堵探討[J].公共管理,2011(6):145-147.
[2]閆慶軍.基于外部性的交通擁堵成因分析與緩解策略[J].經(jīng)濟論壇,2005(5):57-59.
[3]趙冬斌,劉德榮,易建強.基于自適應動態(tài)規(guī)劃的城市交通信號優(yōu)化控制方法綜述[J].自動化學報,2009,35(6):676-681.
[4]張莉娜.淺談解決中國城市交通擁堵問題的主要思路[J].現(xiàn)代企業(yè)文化,2009(5):118-119.
[5]Maynard SJ.The theory ofgamesand theevolution ofanimalconflicts[J].Journalof TheoreticalBiology,1974,47(1):209-221.
[6]Maynard SJ,PriceGR.The logic ofanimalconflict[J].Nature,1973,246:15-18.
[7]陳星光,周晶,朱振濤.城市交通出行方式選擇的演化博弈分析[J].管理工程學報,2009,23(2):140-142.
[8]Friedman D.Evolutionary games in economics[J].Econometrica,1991,59(3):637-666.
(責任編輯:盧奇)
Evolutionary game ofmotorized and non-motorized transport in city
Guo Yunrui,Dong Rui
(Henan InstituteofScienceand Technology,Xinxiang453003,China)
By using of the evolutionary game theory based on bounded rationality,proposes a dynamic unsymmetrical replicating model of motorized and non-motorized transport.Motorized and non-motorized transport are random ly paired based on the idea of hawk-dove game payoffmatrix of the game.This paper discusses the impact of themodel parameters:the traffic enforcement frequency,scope and intensity of the city.The reasons of urban traffic congestion have been explained:the traveler's personal quality factors and local government traffic enforcement factors.
evolution;game theory;traffic congestion;stability
O225
A
1008-7516(2013)03-0090-05
10.3969/j.issn.1008-7516.2013.03.019
2013-04-18
2012年河南省政府決策研究招標課題(2012B252)
郭運瑞(1964-),女,河南輝縣人,教授.主要從事最優(yōu)化理論及應用、小波分析及應用研究.