李陳洋,雷愛國,吳嘯宇,洪 泰
(南京理工大學(xué) 自動化學(xué)院,南京 210094)
軌道交通和常規(guī)公交是城市客運交通的基礎(chǔ),其中軌道交通相比常規(guī)公交具有運行速度快、荷載能力強等特點,構(gòu)成了許多城市公共交通線網(wǎng)的“骨架”,但在一些工作地點相對集中地區(qū)軌道交通可達性明顯低于常規(guī)公交。因此,合理分配公共交通資源、優(yōu)化公共交通出行結(jié)構(gòu)、提高公交服務(wù)水平會對社會建設(shè)和發(fā)展產(chǎn)生深遠影響。目前,博弈演化理論、不確定性模型以及約束規(guī)劃等先進的數(shù)學(xué)思想被廣泛應(yīng)用于公共交通的出行選擇問題中[1-2]。
1973年,Maynard等[3]和Smith等[4]將博弈論的基本理論與生物進化現(xiàn)象相結(jié)合,提出了演化博弈理論中具有里程碑意義的均衡概念:進化穩(wěn)定策略(ESS),該理論也成為演化博弈理論的基石。國外學(xué)者研究大都集中在交通出行行為選擇問題上:Golob[5]考慮了人口密度對出行方式選擇的影響,研究表明人口密度對出行方式的劃分密切相關(guān);Bento等[6]分析了城市空間結(jié)構(gòu)對出行需求的影響,解決了城市形態(tài)、道路密度對通勤方式選擇的影響;Koryagin等[7]基于logit模型研究了乘客出行方式,證明了乘客與交通管理者之間存在納什均衡;Syahlendra[8]以三種交通出行方式為背景,基于離散選擇模型對調(diào)查結(jié)果進行回歸分析,得到不同交通方式的劃分主體;Yin等[9]從出行行為角度分析公共交通出行時空特征,研究了公共交通出行行為的影響因素。國內(nèi)學(xué)者在博弈論應(yīng)用出行方式選擇的問題上研究較多:蔡鑒明等[10]建立考慮出行者異質(zhì)特性和城市交通運行狀態(tài)的演化博弈模型,使用多智能體仿真方法研究引入共享交通后的城市居民中長距離出行方式演化過程;周雨陽等[11]對地鐵公交線路合作博弈進行研究,表明合作收益分配模型可以公平合理地分配合作收益;王桂鵬[12]基于前景理論對城市交通出行方式選擇的演化博弈進行分析;武曉暉等[13]把交通方式的選擇和是否接收低碳理念作為策略的兩個維度,建立了居民低碳出行多維博弈模型;劉晧等[14]考慮政府介入因素,分析出租車出行方式選擇的演化博弈。在道路阻抗函數(shù)理論研究方面,我國學(xué)者基于經(jīng)典的BPR(美國聯(lián)邦公路局函數(shù)),提出了符合我國國情的回歸道路阻抗函數(shù)模型[15]。
總的來看,現(xiàn)有研究成果在考慮出行者公共交通方式選擇時,一方面,單一考慮出行成本對交通方式選擇的影響;另一方面,僅用少量參數(shù)定義出行收益作為博弈矩陣的收益,沒有用符合具體情況的參數(shù)來量化出行成本涉及到的影響因素。為進一步完善博弈理論在公共交通方式選擇上的研究,應(yīng)將出行收益與出行成本結(jié)合,更加綜合全面地看待問題。因此,文中首先依據(jù)出行影響因素構(gòu)建出行成本函數(shù);其次,對兩類出行者不同出行方式的出行收益進行量化,在計算道路交通出行時間時,引入BPR路阻函數(shù)計算通行時間建立道路出行者出行時間與交通流量之間的關(guān)系;最后,創(chuàng)造性的將兩者結(jié)合,既考慮了出行收益也考慮了出行過程中出行影響因素對出行的影響,結(jié)合仿真分析證明所建模型的合理性。
演化博弈論是將經(jīng)典博弈論與演化理論有機結(jié)合而產(chǎn)生的一種理論[16],主要包括群體和在每一個群體中對應(yīng)的各自行動集合;收益函數(shù)(pay off function)是群體采取某一種策略時獲得的收益;復(fù)制動態(tài)則反映群體參與者的學(xué)習、模仿過程;均衡(equilibrium)反映演化的收斂演化動態(tài),包括靜態(tài)的ESS(演化穩(wěn)定策略)、動態(tài)的EE等概念。
出行者的出行成本主要包含時間、貨幣兩個因素。隨著生活水平的提高,現(xiàn)代居民也同時更加注重出行質(zhì)量,為使模型更符合實際情況這里再引入舒適度這一指標,為使三個不同變量單位統(tǒng)一,對舒適度、出行費用做歸一化處理,具體成本函數(shù)為[17]
θi=Ti+αiCi+βiEi
(1)
式中:θi為出行者選擇第i種交通方式時的出行成本,元;Ti為出行者選用第i種交通方式時的乘車時間,min,乘車時間計算分為兩種情況,選擇常規(guī)公交方式的應(yīng)根據(jù)分擔的交通流量由道路阻抗函數(shù)求出行駛時間,選擇軌道交通方式的出行時間一般為定值,則由調(diào)查軌道交通運行不同時段表所得;Ci為出行者選擇第i種出行方式的舒適度;Ei為出行者選擇第i種交通方式時的出行費用,元;αi,βi分別為出行費用、出行舒適度在第i種交通方式的時間價值系數(shù)(反映交通方式的時間效用)。
查閱相關(guān)文獻資料[17],交通方式的舒適程度取決于所乘交通工具的擁擠程度,以每位乘客平均所占的有效面積表示擁擠程度,在文中所選的模型中分別采用出行費用的10%和20%作為舒適度成本,主要分為3個等級,其評判標準如表1所示。
表1 擁擠度評價標準
1966年美國聯(lián)邦公路局對大量路段進行交通調(diào)查,從而根據(jù)收集到的交通數(shù)據(jù)回歸分析出道路行程時間與流量的關(guān)系式,后來應(yīng)用廣泛且被稱為BPR路阻函數(shù)模型(見圖1)。其對道路阻抗的實質(zhì)把握非常準確,且具有良好的數(shù)學(xué)性質(zhì),數(shù)學(xué)表達式為[15]
(2)
式中:t為車輛在道路中行駛時間;t0為路段的自由流行程時間;Q為路段的車流量;C為路段的實際通行能力;α,β為模型待定參數(shù),文獻建議取α=0.15,β=4.0。
圖1 BPR函數(shù)
以上是與美國道路相適應(yīng)的道路阻抗函數(shù),可以看出它只考慮了機動車流量對道路產(chǎn)生的影響。但我國交通狀況復(fù)雜,呈機非混行的交通特點,針對這些情況,國內(nèi)學(xué)者提出了適應(yīng)我國國情的道路阻抗函數(shù)模型為[15]
(3)
式中:V1,V2為機動車、非機動車路段交通量,輛·h-1;C1,C2為機動車、非機動車路段實際通行能力,輛·h-1;k1,k2為回歸參數(shù),均大于0。
在博弈模型的構(gòu)建中最主要的元素有:收益矩陣,其用來描述兩個或多個參與對象的策略和支付矩陣;復(fù)制動態(tài)方程,用于描述某一特定策略在一個種群中被采用的頻數(shù)或頻度的動態(tài)微分方程;演化穩(wěn)定策略,用于分析動態(tài)復(fù)制方程隨參數(shù)變化的收斂。在構(gòu)建一個完整的博弈模型前,為了對處于不完全信息中的演化穩(wěn)定性進行分析,首先結(jié)合要分析的對象做出以下六點假設(shè):
假設(shè)一:在博弈模型中,分別將時間敏感度的強、弱看作一個整體,兩者在博弈中被視為獨立個體,各自追求利益最大化。
假設(shè)二:假定出行者從出發(fā)到目的地僅有常規(guī)公交和城市軌道交通兩種交通方式選擇。
假設(shè)三:在選擇公共交通出行方式時,時間敏感度不同的雙方可以根據(jù)自己的情況,合理選擇自身的行為,即博弈模型的策略集有{常規(guī)公交,常規(guī)公交}、{常規(guī)公交,軌道交通}、{軌道交通,常規(guī)公交}、{軌道交通,軌道交通}。
假設(shè)四:設(shè)定時間敏感度強出行者選擇常規(guī)公交的比例為x,選擇軌道交通的比例為1-x;而時間敏感度弱出行者選擇常規(guī)公交的比例為y,選擇軌道交通的比例為1-y。
假設(shè)五:當兩種出行者選擇的交通方式相同時,時間敏感度強的出行者基本收益將損失a,時間敏感度弱的出行者基本收益損失b,但當兩類出行者選擇不同交通方式博弈時不會造成任一方損失,且a>b。
假設(shè)六:假設(shè)時間敏感度強出行者選擇常規(guī)公交出行獲得的收益為A1(例如車費收益及滿足出行需求目的所獲得收益),選擇軌道交通出行獲得的收益為A2(例如時間效益及滿足出行者舒適度需求所獲得收益);同理,時間敏感度弱出行者分別選擇兩類出行方式所得出行收益為Bi(i=1,2),意義同上。
基于以上假設(shè),便可以得到在考慮出行成本情況下對時間敏感度不同的兩類出行者的出行收益演化博弈模型矩陣,如表2所示。
表2 兩類出行者出行收益演化博弈矩陣
由于時間敏感度弱的出行者選擇常規(guī)公交的概率為y,則選擇軌道交通的概率為1-y;時間敏感度強的出行者選擇常規(guī)公交的概率為x,則選擇軌道交通的概率為1-x。假設(shè)時間敏感度強出行者選擇常規(guī)公交的期望收益為f1,選擇軌道交通的期望收益為f2,平均收益為f12[18]。
f1=y(A1-T1-α1C1-β1E1-a)+
(1-y)(A1-T1-α1C1-β1E1)
(4)
f2=y(A2-T2-α2C2-β2E2)+
(1-y)(A2-T2-α2C2-a)
(5)
f12=xf1+(1-x)f2
(6)
同理,時間敏感度弱的出行者選擇常規(guī)公交的期望收益為f3,選擇軌道交通的期望收益為f4,平均收益為f34。
f3=x(B1-T1-α1C1-β1E1-b)+
(1-x)(B1-T1-α1C1-β1E1)
(7)
f4=x(B2-T2-α2C2-β2E2)+
(1-x)(B2-T2-α2C2-β2E2-b)
(8)
f34=yf3+(1-y)f4
(9)
由上述式(6)、式(9)可得時間敏感度強、弱的復(fù)制動態(tài)方程分別為F1(x,y)和F2(x,y)。
F1(x,y)=x(1-x)(-2ay+A1-T1-α1C1-
β1E1-A2+T2+β2E2+α2C2+a)
F2(x,y)=y(1-y)(-2bx+B1-T1-α1C1-
β1E1-B2+T2+β2E2+α2C2+b)
(10)
利用雅可比矩陣的局部穩(wěn)定分析法進行分析,該系統(tǒng)的雅可比矩陣[19]為
(11)
矩陣J的行列式為
det|J|=(1-2x)(-2ay+A1-T1-α1C1-
β1E1-A2+T2+β2E2+α2C2+a)·
(1-2y)(-2bx+B1-T1-α1C1-β1E1-
B2+T2+α2C2+β2E2+b)-
y(1-y)2b·x(1-x)2a
(12)
矩陣J的軌跡為
tr(J)=(1-2x)(-2ay+A1-T1-α1C1-
β1E1-A2+T2+β2E2+α2C2+
a)+(1-2y)(-2bx+B1-T1-α1C1-
β1E1-B2+T2+α2C2+β2E2+b)
(13)
在系統(tǒng)復(fù)制動態(tài)方程(10)中,令F1(x,y)=0,F2(x,y)=0,可以得到局部均衡點O(0,0),A(1,0),B(0,1),C(1,1),D(x*,y*),其中博弈雙方的鞍點值為
令λ1=A1-T1-α1C1-β1E1-A2+T2+β2E2+α2C2+a,表示時間敏感度弱的出行者選擇軌道交通出行時,時間敏感度強的出行者選擇常規(guī)公交、軌道交通的收益差值。
令λ2=B1-T1-α1C1-β1E1-B2+T2+β2E2+α2C2+b,表示時間敏感度強的出行者選擇軌道交通出行時,時間敏感度弱的出行者選擇常規(guī)公交、軌道交通的收益差值。
令λ3=B1-T1-α1C1-β1E1-B2+T2+β2E2+α2C2-b,表示為時間敏感度強出行者選擇常規(guī)公交出行時,時間敏感度弱的出行者選擇常規(guī)公交與軌道交通的收益差值。
令λ4=A1-T1-α1C1-β1E1-A2+T2+β2E2+α2C2-a,表示為時間敏感度弱出行者選擇常規(guī)公交出行時,時間敏感度強的出行者選擇常規(guī)公交與軌道交通的收益差值。
根據(jù)博弈演化理論,滿足det|J|>0,tr(J)<0的均衡點為系統(tǒng)演化穩(wěn)定點(ESS),針對不同情形下的參數(shù)對博弈演化策略進行討論,上面共有4個參數(shù),每個參數(shù)都存在正負的可能,這樣共有16種情形,每種情形都要根據(jù)λ的值判斷該情形下演化是否穩(wěn)定。仔細分析參數(shù)后發(fā)現(xiàn)λ1-λ4=2a,λ2-λ3=3b,即λ1>λ4,λ2>λ3,這樣便能剔除掉λ1<0,λ4>0 或λ2<0,λ3>0情形下的7種組合,分別為
1)λ1<0,λ2<0,λ3<0,λ4<0;
2)λ1<0,λ2<0,λ3>0,λ4<0;
3)λ1<0,λ2<0,λ3>0,λ4>0;
4)λ1<0,λ2>0,λ3<0,λ4>0;
5)λ1<0,λ2>0,λ3>0,λ4>0;
6)λ1>0,λ2<0,λ3>0,λ4<0;
7)λ1>0,λ2<0,λ3>0,λ4>0。
下面討論另外9種符合意義的參數(shù)條件下5個均衡點的演化博弈情形。用含參表達式來代表各個均衡點的行列式,結(jié)果如表3所示。
表3 均衡點數(shù)值帶入結(jié)果
下面根據(jù)表3結(jié)果由λi的正、負情形分別討論以下9種情形的分析結(jié)果。
情形1:λ1>0,λ2>0,λ3>0,λ4>0。此時易得僅在均衡點C(1,1)處,有det|J|>0,tr(J)<0,即該點為ESS,對應(yīng)的演化穩(wěn)定策略為{常規(guī)公交,常規(guī)公交},即時間敏感度強出行者選擇常規(guī)公交出行,時間敏感度弱出行者選擇常規(guī)公交出行。
情形2:λ1<0,λ2>0,λ3<0,λ4<0。此時易得僅在均衡點B(0,1)處,有det|J|>0,tr(J)<0,即該點為ESS,對應(yīng)的演化穩(wěn)定策略為{軌道交通,常規(guī)公交},即時間敏感度強出行者選擇軌道交通出行,時間敏感度弱出行者選擇常規(guī)公交出行。
情形3:λ1<0,λ2>0,λ3>0,λ4<0。此時易得僅在均衡點B(0,1)處,有det|J|>0,tr(J)<0,即該點為ESS,對應(yīng)的演化穩(wěn)定策略為{軌道交通,常規(guī)公交},即時間敏感度強出行者選擇軌道交通出行,時間敏感度弱出行者選擇常規(guī)公交出行。
情形4:λ1>0,λ2<0,λ3<0,λ4<0。此時易得僅在均衡點A(1,0)處,有det|J|>0,tr(J)<0,即該點為ESS,對應(yīng)的演化穩(wěn)定策略為{常規(guī)公交,軌道交通},即時間敏感度強出行者選擇常規(guī)公交出行,時間敏感度弱出行者選擇軌道交通出行。
情形5:λ1>0,λ2<0,λ3<0,λ4>0。此時易得僅在均衡點A(1,0)處,有det|J|>0,tr(J)<0,即該點為ESS,對應(yīng)的演化穩(wěn)定策略為{常規(guī)公交,軌道交通},即時間敏感度強出行者選擇常規(guī)公交出行,時間敏感度弱出行者選擇軌道交通出行。
情形6:λ1>0,λ2>0,λ3<0,λ4<0。此時易得在A(1,0)、B(0,1)兩點處有det|J|>0,tr(J)<0,則這兩點均為ESS,對應(yīng)的演化穩(wěn)定策略為{常規(guī)公交,軌道交通}和{軌道交通,常規(guī)公交}。其演化如圖2所示,可知此時當初始狀態(tài)為O(0,0)時,即時間敏感度強、弱雙方都選擇常規(guī)公交時,雙方的出行收益最小,此時雙方會有改變策略的強烈動機,尤其是時間敏感度強的一方,最終會演化博弈至A(1,0)、B(0,1),進一步解釋為當時間敏感度強出行者選擇常規(guī)公交時,時間敏感度弱出行者會選擇軌道交通,即演化為A(1,0),反之演化為B(0,1)。當初始狀態(tài)為C(1,1)時,即兩類出行者都選擇軌道交通出行時,會因為交通狀況以及因兩者選擇同一種交通方式造成的損失等因素而改變演化策略,同樣會演化穩(wěn)定至A(1,0)、B(0,1)。
圖2 情形6動態(tài)演化相位
情形7:λ1>0,λ2>0,λ3<0,λ4>0。此時易得僅在均衡點A(1,0)處,有det|J|>0,tr(J)<0,即該點為ESS,對應(yīng)的演化穩(wěn)定策略為{常規(guī)公交,軌道交通},即時間敏感度強出行者選擇常規(guī)公交出行,時間敏感度弱出行者選擇軌道交通出行。
情形8:λ1>0,λ2>0,λ3>0,λ4<0。此時易得僅在均衡點B(0,1)處,有det|J|>0,tr(J)<0,即該點為ESS,對應(yīng)的演化穩(wěn)定策略為{軌道交通,常規(guī)公交},即時間敏感度強出行者選擇軌道交通出行,時間敏感度弱出行者選擇常規(guī)公交出行。
情形9:λ1<0,λ2<0,λ3<0,λ4<0。此時易得僅在O(0,0)處,det|J|>0,tr(J)<0,即該點為ESS,對應(yīng)的演化穩(wěn)定策略為{軌道交通,軌道交通},即時間敏感度強、弱出行者都選擇軌道交通出行。
以上9種演化情形的均衡點穩(wěn)定性分析如表4所示。
表4 均衡點穩(wěn)定性分析
在上述構(gòu)建的博弈模型中,從λi的表達式來看,有11個參數(shù)的變動會引起λi的正負變化,這會造成不同策略的轉(zhuǎn)變,考慮到αi、βi(時間價值系數(shù))和Ci(舒適度系數(shù))當模型構(gòu)建完成后為定值,故以下僅考慮其他6種參數(shù)的變化所帶來的影響。
由表5可看出A1的增大會引起λ1、λ4的增大,A2增大會引起λ1、λ4的減小,又因為λ1>λ4,若最初情形為1,故適當增加A2的值會引起情形1向情形8的轉(zhuǎn)移;B1的增大會引起λ2、λ3的增大,B2的增大會引起λ2、λ3的減小,同理λ2>λ3,適當增大B2會引起情形1向情形7的轉(zhuǎn)移;a增加會引起λ1增大、λ4的減小,若最初情形為9,增加a的值會引起情形9向情形7的轉(zhuǎn)移,b的增大則會引起λ2的增加、λ4的減小,故增大b的值會引起情形9向情形2的轉(zhuǎn)移;而E1和T1的增大則會同時引起λi的減小,E2和T2的增大則會同時引起λi的增大,同樣增大或減小其值也會引起不同情形下的轉(zhuǎn)移。
表5 參數(shù)變化對λi的影響
某市區(qū)公共交通主要分地鐵和公交兩大類,居民出行時主要選擇地鐵X和公交Y線路。簡化路線拓撲如圖3所示。通過對該地區(qū)進行實地調(diào)研,并通過問卷形式對居民的出行選擇進行調(diào)查,選定第一組數(shù)據(jù)整理計算后得到的相關(guān)模型參數(shù)如表6所示(表中數(shù)據(jù)單位已標準化)。
圖3 某市路線拓撲
表6 參數(shù)值
圖4 不同時間敏感度出行者動態(tài)演化數(shù)值變化
圖5 雙方策略選擇概率演化曲線
圖6 概率x、y動態(tài)演化
下面探究在其他條件不變的情況下a值的不同對演化的影響。由λi的表達式可看出a值僅影響λ1,λ4的正負,當a值不斷增大,即不同時間敏感度出行者選擇常規(guī)公交出行方式時給時間敏感度強出行者造成損失增大時,會使λ1值增大,λ4值減小,當λ1>0,λ4<0時,情形1會向情形8演化,即最終演化結(jié)果會趨向于B(0,1),策略集為{軌道交通,常規(guī)公交},故在滿足情形1的情況下a的大小僅僅影響x的走向,對y無影響,其中x隨a的變化如圖7所示。由圖7可看出,當a較小時,x演化總趨向于1,當a增大到一定程度時,x會逐漸趨向于0。反映到實際情況時,常規(guī)公交、軌道交通都是城市公共交通的重要組成部分,兩者在承擔城市居民出行時,扮演著相互協(xié)作的作用。當兩類出行者選擇常規(guī)公交的比例較大時,會給時間敏感度強出行者造成較大損失,蒙受損失較大一方便會尋求軌道交通作為出行方式,故圖7的演化結(jié)果與實際情況相符,這也很好印證了軌道交通在城市公共交通中扮演的作用。隨著地面交通壓力的不斷增大,交通延誤不斷增加,而軌道交通則起到了緩解這一交通問題的作用。
選定第二組測試數(shù)據(jù)A1=120,A2=105,B1=100,B2=83,a=8,b=5,其他參數(shù)同上。此情形下計算出的λ1>0,λ2>0,λ3<0,λ4<0,對應(yīng)情形6。
圖8 不同時間敏感度出行者動態(tài)演化數(shù)值變化
圖9 雙方策略選擇概率演化
根據(jù)出行者對出行時間敏感度的不同建立了演化博弈模型,以出行者出行收益為基礎(chǔ)結(jié)合出行成本建立了博弈收益函數(shù),同時考慮了在計算道路交通的通行時間時,引入了BPR道路阻抗函數(shù),更加合理地計算了通行時間,重點研究了對時間敏感強、弱雙方的策略選擇問題。
1)演化博弈的過程根據(jù)參數(shù)的正負可以劃分為9種不同情形,其中有4種情形的演化策略為{常規(guī)公交,軌道交通},有4種情形的演化策略為{軌道交通,常規(guī)公交},有1種情形的演化策略為{常規(guī)公交,常規(guī)公交},有1種情形的演化策略為{軌道交通,軌道交通}。
2)在該博弈模型中共涉及到10個參數(shù),除去時間敏感度系數(shù)、舒適度系數(shù),其它參數(shù)的增大或減小會引起不同情形間的轉(zhuǎn)移,即會引起博弈雙方向不同策略轉(zhuǎn)化。在數(shù)值分析部分模擬了隨著時間敏感度強的收益損失a的增大,其演化方向會隨之向另一方轉(zhuǎn)化,即由策略{常規(guī)公交,常規(guī)公交}向{軌道交通,常規(guī)公交}的策略轉(zhuǎn)化。
3)常規(guī)公交、軌道交通作為城市公共交通的重要組成部分,相關(guān)部門在規(guī)劃設(shè)計時更要合理分配資源。交通規(guī)劃部門通過適當疏通地面交通減小延誤、提高行車準點率、合理規(guī)劃常規(guī)交通和軌道交通的線路走向等措施便能最大限度地使交通資源得到充分利用。同時,由上述模型也能看出,當兩種公共交通方式出行收益一定時,車票的變化也會對演化博弈走向產(chǎn)生影響。相關(guān)部門在進行交通運輸規(guī)劃與管理時,要綜合、全面考慮影響出行的各因素,做好調(diào)研,合理做出預(yù)判,且要根據(jù)實際交通狀況做出調(diào)整,以保證交通順暢運行。