李雪巖,李雪梅,李學(xué)偉,趙 云,邱荷婷
(北京交通大學(xué)經(jīng)濟(jì)管理學(xué)院 北京 100044)
?
基于動態(tài)參照點的多主體有限理性路徑選擇模型
李雪巖,李雪梅,李學(xué)偉,趙云,邱荷婷
(北京交通大學(xué)經(jīng)濟(jì)管理學(xué)院 北京 100044)
摘要:為了研究有限理性假設(shè)下出行者的自適應(yīng)調(diào)整行為對交通網(wǎng)絡(luò)分流的影響,利用累積前景理論結(jié)合演化元胞自動機建立了具有個體交互機制的多主體路徑選擇模型。在模型中將出行者劃分為風(fēng)險追求者與風(fēng)險厭惡者,基于出行時間可靠性并借鑒元胞遺傳算法的思想設(shè)計了具有異質(zhì)特點的出行者動態(tài)參照點及其演化規(guī)則,使出行者個體能夠依據(jù)決策環(huán)境的變化動態(tài)地調(diào)整自身的出行時間預(yù)算,更加符合出行者的實際行為特征。最后將多主體參照點演化規(guī)則與傳統(tǒng)的相繼平均算法相結(jié)合,求解路網(wǎng)配流。研究發(fā)現(xiàn):演化模型較好地繼承了傳統(tǒng)模型中的路徑分流特點;不同的出行者類型比例及出行者的信息接收程度是影響路網(wǎng)分流結(jié)構(gòu)的重要因素。
關(guān)鍵詞:有限理性;多主體;風(fēng)險;元胞遺傳算法;動態(tài)參照點;交通流量分配;
0引言
不確定的交通需求、出行者的動態(tài)選擇行為決定了交通系統(tǒng)具有動態(tài)性、時變性、隨機性等特征,也意味著交通系統(tǒng)是一個典型的復(fù)雜系統(tǒng)。傳統(tǒng)的動態(tài)交通分配模型往往基于期望效用理論(expected utility theory,EUT)或隨機效用理論(random utility theory,RUT)來研究出行者的路徑選擇行為和路網(wǎng)分流均衡問題,在該研究框架下,通常假設(shè)出行者具備完美信息及完全理性,按照效用最大或阻抗最小原則進(jìn)行路徑選擇。然而,無論是在交通網(wǎng)絡(luò)中還是在其他領(lǐng)域,許多實際現(xiàn)象和實驗數(shù)據(jù)都與這種完全理性的假設(shè)不符[1—3]并且無法用上述兩種理論解釋。
通過心理學(xué)實驗,Kahneman和Tversky發(fā)現(xiàn)人們對效用進(jìn)行判斷時往往會設(shè)定一個十分重要的基準(zhǔn),即“參照點”,然后依據(jù)實際效用與參照點的相對位置進(jìn)行決策,參照點的選取對決策結(jié)果會產(chǎn)生至關(guān)重要的影響,根據(jù)這一思想,先后提出了前景理論(Prospect Theory)[4]與累積前景理論(Cumulative Prospect Theory)[5],這兩大理論被不少學(xué)者應(yīng)用于出行行為研究中。Erel Avineri[3]采用基于固定參照點的累積前景理論建立了一個具有反饋學(xué)習(xí)機制的出行選擇模型,研究了出行時間可靠性與出行者時間敏感度之間的關(guān)系;Jou Rong Chang[6]通過對參照點及風(fēng)險態(tài)度等相關(guān)參數(shù)進(jìn)行基于實證數(shù)據(jù)的估計,建立了基于累積前景理論的高速公路司機駕駛選擇模型,研究發(fā)現(xiàn)累積前景理論較好地反映了實際當(dāng)中的駕駛選擇行為;Xu Hongli[7]將出行時間預(yù)算設(shè)置為參照點,基于累積前景理論建立了一個路徑選擇模型,進(jìn)一步,在時間預(yù)算的基礎(chǔ)上,通過設(shè)置不同出行者的理想準(zhǔn)點到達(dá)概率從而構(gòu)造了不同類別的參照點[8];Paolo Delle Site[9]建立了一個基于“參照點依賴”的隨機用戶均衡模型,以路徑流量和時間作為參照點變化依據(jù),研究了出行者的實際選擇與其參照路徑的偏差現(xiàn)象;王偉[10]在基于累積前景理論的隨機網(wǎng)絡(luò)均衡模型中將期望-超額出行時間作為內(nèi)生參照點,模擬了出行者同時參考出行時間的可靠性和不可靠性時路網(wǎng)的分流情況;Giselle de Moraes Ramos[11]在利用前景理論研究出行行為時設(shè)計了出行者同質(zhì)及異質(zhì)條件下的參照點及其依據(jù)出行經(jīng)驗對參照點的更新機制;張波[12]以早高峰工作出行為研究對象,分析和設(shè)計了出行者同時選擇出行路徑和出發(fā)時間時的參照點設(shè)定規(guī)則。
通過上述文獻(xiàn)可知,不同的參照點選取規(guī)則,會產(chǎn)生不同的交通網(wǎng)絡(luò)分流結(jié)果。從不同文獻(xiàn)中對于參照點的定義和描述來看,參照點的形成是一個復(fù)雜的心理過程,不同的決策者面對相同的決策環(huán)境可能會產(chǎn)生不同的參照點,而相同的決策者面對重復(fù)的決策環(huán)境也可能會產(chǎn)生不同的參照點。
一般認(rèn)為,參照點具有“內(nèi)生性”,來源于決策者的個性、歷史經(jīng)驗、習(xí)慣等因素,但從實際當(dāng)中人們的決策行為來看,這種“內(nèi)生性”又不可避免地受到外部決策環(huán)境及各種信息傳播的影響,常見的例子如人們對某個決策的風(fēng)險態(tài)度經(jīng)常會隨著一些外部事件的發(fā)生而變化。目前,對參照點形成外部影響機制的研究并不多見。此外,在實際的出行決策中,受到出行信息、個人稟賦、決策環(huán)境等影響,出行者個體之間勢必存在著理性程度的差異[13],雖然許多既有的研究已對出行者群體做出有限理性假設(shè),但這種有限理性假設(shè)大多是以“同質(zhì)”性為前提,較少涉及個體理性程度的差異問題。
就出行信息的影響而言,在實際的出行決策中,出行信息(如預(yù)計時間、路徑狀況等)在出行者群體中的交互、傳播和學(xué)習(xí)[14]是影響出行者個體路徑選擇行為的重要因素,體現(xiàn)了出行者個體的自適應(yīng)調(diào)整機制[15],依據(jù)復(fù)雜性科學(xué)的思想,這種具有交互性的自適應(yīng)調(diào)整機制是交通系統(tǒng)內(nèi)部產(chǎn)生正反饋的重要因素[16],而系統(tǒng)內(nèi)部正反饋的產(chǎn)生勢必會打破既有解析范式下的路網(wǎng)分流均衡。目前的研究大多將出行者的行為模式解析化,將整體行為簡化為個體行為之和,認(rèn)為局部個體間的異質(zhì)特點可以相互抵消,忽略了局部反饋對整體均衡的擾動作用。
交通系統(tǒng)路徑選擇均衡的形成,應(yīng)當(dāng)是一個多主體參與的、具有局部信息交互作用及出行者自適應(yīng)調(diào)整機制的動態(tài)演化過程。
針對上述問題,本文從實際決策中出行者的個體行為出發(fā),在兩個方面對既有的基于有限理性的路徑選擇模型做出了改進(jìn)工作:1)利用元胞自動機對既有研究中解析范式下的選擇模型進(jìn)行離散化,將每一個元胞抽象為一個出行者,通過出行風(fēng)險態(tài)度及出行預(yù)算時間這兩個屬性刻畫不同類型出行者的異質(zhì)特點,從而形成多主體決策模型;2)借鑒元胞遺傳算法中種群進(jìn)化的思想建立出行者的信息交互機制及參照點的動態(tài)演化規(guī)則,本文提出的模型及算法可以為交通規(guī)劃、人性化管理、動態(tài)誘導(dǎo)等交通管理方案的實施提供一定參考。
1基本假設(shè)
1.1路網(wǎng)假設(shè)
根據(jù)流量守恒原理,存在如下等價關(guān)系:
(1)
(2)
(3)
(4)
1.2出行者假設(shè)
與既有研究不同,本文不再將出行者視為一個具有同質(zhì)特點的群體,而是依據(jù)多主體思想及自底向上的建模思想,將出行者還原為一個個具有自適應(yīng)調(diào)整能力的個體來研究其路徑選擇行為,故本文對出行者做出如下假設(shè):
1) 不同的出行者為出行活動預(yù)留的時間不同,該指標(biāo)的變化取決于出行者的風(fēng)險態(tài)度及出行信息交互情況。
2) 出行者個體依據(jù)風(fēng)險態(tài)度分為兩種類型:風(fēng)險追求型與風(fēng)險厭惡型,風(fēng)險追求型的出行者對未來的路況較為樂觀,傾向于在未來的出行活動中預(yù)留更少的出行時間;而風(fēng)險厭惡型的出行者則比較保守,傾向于在未來的出行活動中預(yù)留更多的出行時間。
3) 出行者個體具有出行信息的學(xué)習(xí)能力,并且其對路徑特點的判斷會受到周圍信息的影響。每次出行活動完成后,不同出行者個體之間會進(jìn)行信息交互,從而更新自身的出行偏好,如出行活動預(yù)留的時間、路徑選擇概率。
2模型建立
2.1多主體路徑選擇元胞自動機模型
作為探索復(fù)雜系統(tǒng)的有力工具,元胞自動機已被證明能夠較好地模擬交通系統(tǒng)中的路徑選擇[14]、交通運輸服務(wù)選擇[17]等行為,因此,依據(jù)上文假設(shè),鑒于出行者的異質(zhì)及信息交互特點,本文采用元胞自動機來建立出行選擇決策模型。
1) 元胞空間:n×n的網(wǎng)格,顯然,dw=n2。
2) 鄰居形式:Moore型鄰居,即每個出行者擁有8個鄰居,如圖1所示:
3) 元胞狀態(tài):用一個四元組表示
(5)
4)演化規(guī)則:每完成一次OD對間的出行活動后,出行者都會依據(jù)風(fēng)險態(tài)度及信息交互機制更新自身的出行預(yù)留時間,本文引入元胞遺傳算法的思想來模擬這一過程,具體步驟見2.3節(jié)。
2.2基于累積前景理論的多主體路徑選擇過程
2.2.1參照點
在前景理論的假設(shè)中,人們往往依據(jù)效用的相對數(shù)值而非絕對數(shù)值來衡量一項決策的優(yōu)劣,因此,“參照點”的設(shè)置尤為重要,一般而言,出行者為了避免遲到,均會在出發(fā)前對路上所消耗的時間做一個預(yù)計,基于此,Lo H K[18]提出了出行時間預(yù)算的概念,進(jìn)一步,Xu Hongli[7—8]及王偉[10]將這一概念應(yīng)用于出行時間參照點的確定。本文繼續(xù)借鑒這一方法,構(gòu)建多主體的出行時間參照點。
(6)
(7)
(8)
2.2.2路徑選擇決策
累積前景理論的基本觀點之一就是在不確定的條件下,人們習(xí)慣將決策結(jié)果相對于參照點的相對值作為衡量決策效用的標(biāo)準(zhǔn),依據(jù)這個相對值將每種可能的決策結(jié)果評判為“收益”或“損失”,具體可用價值函數(shù)表示為
(9)
其中,0<α,β<1,α與β反映了出行者的風(fēng)險偏好水平,其值越大表示出行者對風(fēng)險越敏感,反之對風(fēng)險越不敏感;λ表示損失規(guī)避系數(shù),其值越大,表示出行者對損失的規(guī)避程度越高。
決策權(quán)重函數(shù)表示為
(10)
則累積決策權(quán)重表示為
(11)
(12)
如t時刻路網(wǎng)達(dá)到均衡狀態(tài),則出行者個體(i,j)選擇OD對間路徑p的理想概率為
(13)
2.3基于元胞遺傳算法思想的多主體出行信息交互過程
2.3.1基于元胞遺傳算法的多主體建模思想
元胞遺傳算法是元胞自動機與遺傳算法的有機結(jié)合[20],其原理在于通過元胞空間內(nèi)個體元胞之間的信息交互,使種群內(nèi)的優(yōu)秀信息得到傳播和保存,本文則將元胞遺傳算法的思想和演化規(guī)則引入多主體路徑選擇模型中的信息交互過程。
由前文的出行者假設(shè)可知,每完成一次出行活動后,不同出行者之間都會通過信息交互來更新下一次出行的預(yù)算時間(參照點),這種個體出行預(yù)算時間的更新方式可借助元胞遺傳算法的演化規(guī)則表示如下。
2.3.2參照點演化規(guī)則
對于t時刻的出行活動,個體(i,j)的參照點按照如下步驟演化。
步驟2:選擇。個體(i,j)與“鄰居”進(jìn)行信息交流,選擇周圍“鄰居”中OD對間平均出行時間預(yù)算最長與最短的個體:
(14)
(15)
步驟3:交叉。個體(i,j)依據(jù)自身的風(fēng)險態(tài)度類型更新其時間預(yù)算系數(shù)ρt(i,j),
如果個體(i,j)為風(fēng)險追求型,即l(i,j)=1,則時間預(yù)算系數(shù)更新如:
ρt+1(i,j)=(1-pc)·ρt(i,j)+pc·ρt(imin,jmin)
(16)
如果個體(i,j)為風(fēng)險厭惡型,即l(i,j)=0,則時間預(yù)算系數(shù)更新如下:
ρt+1(i,j)=(1-pc)·ρt(i,j)+pc·ρt(imax,jmax)
(17)
其中,參數(shù)pc表示出行者以何種程度吸收周圍的出行信息,該參數(shù)決定了出行者參照點的位置變化。
通過上述步驟,出行者完成參照點的更新??梢?,在一定的信息傳播范圍內(nèi)(鄰居),風(fēng)險追求型的出行者越來越傾向于預(yù)留較少的出行時間;而風(fēng)險厭惡型的出行者越來越傾向于預(yù)留較多的出行時間。元胞遺傳算法規(guī)則的引入,恰當(dāng)?shù)乜坍嬃诉@一過程。
2.4路網(wǎng)均衡模型
依據(jù)隨機用戶均衡原理,多主體路網(wǎng)平衡狀態(tài)滿足條件:
(18)
3模型求解演化算法
本文將MSA(Method of Successive Average)算法與多主體參照點演化規(guī)則進(jìn)行有機結(jié)合,形成多主體有限理性(Bounded Rational Multi-Agent)路徑選擇演化算法(BRMA-MSA),具體步驟為
步驟1:路徑搜索。將OD對之間的所有簡單無環(huán)路徑作為有效路徑集Rw。
步驟4:依據(jù)2.3.2節(jié)的參照點演化規(guī)則更新出行者的風(fēng)險態(tài)度系數(shù)ρt(i,j)。
(19)
步驟6:令t=t+1,返回步驟3。
4算例分析
4.1算例網(wǎng)絡(luò)
以目前文獻(xiàn)中廣泛采用的如圖3所示的路網(wǎng)為例,對本文提出的模型進(jìn)行模擬。對于路徑行程時間,則采用BPR函數(shù):
(20)
4.2參數(shù)取值
此外,依據(jù)Kahneman,Tversky及Prelec所給出的參數(shù)取值[19],本文取α=β=0.88,λ=2.25,γ=0.74;其余參數(shù)設(shè)置為:θ=1,dw=n2=2 500。
4.3路徑選擇演化結(jié)果
令pr=0.5,pc=0.5,對本文模型進(jìn)行仿真,演化50步后,出行者群體的路徑選擇趨于穩(wěn)定,將演化過程中的路徑屬性統(tǒng)計如表2:
由表2可見,路徑3與路徑5的流量相對較大,這是由于路徑3與路徑5的行程時間及其方差均相對較小,繼而路徑前景相對較大;雖然路徑6也具有較小的行程時間方差,但由于其行程時間最大,路徑前景最小,故其流量最小。演化結(jié)果說明,本文提出的模型較好地繼承了基于累積前景理論的路網(wǎng)分流模型的特點,體現(xiàn)了出行者群體的有限理性。
4.4出行者類型及信息接收程度變化仿真
4.4.1路徑前景
調(diào)整出行者中不同風(fēng)險態(tài)度人群的比例pr及出行者的信息接受程度pc,演化至穩(wěn)定狀態(tài),圖4給出了演化過程中元胞空間內(nèi)不同路徑的前景值隨pr及pc的變化情況:
觀察圖4不難發(fā)現(xiàn):1)在出行者群體不同的風(fēng)險態(tài)度比例條件下,路徑前景均呈現(xiàn)了隨出行者信息接受程度pc的變化趨勢,表明路徑分流具有顯著的參照點依賴效應(yīng)。2)當(dāng)出行者中風(fēng)險追求者的比例較小時(pr=0,pr=0.3),各條路徑的前景效用值隨出行者信息接收程度的增加呈現(xiàn)增長趨勢,且pr越小,增長幅度越大;而當(dāng)出行者中風(fēng)險追求者的比例較大時(pr=0.6,pr=0.9),各條路徑的前景效用值隨出行者信息接收程度的增加呈現(xiàn)降低趨勢,且pr越大,降低幅度越大。這是由于,當(dāng)風(fēng)險追求者的比例較小時,出行者總體更加傾向于預(yù)留較長的出行時間,其出行前景表現(xiàn)為“收益”的概率較大,在此基礎(chǔ)上,出行者的信息接收程度越大,則意味著出行者“風(fēng)險規(guī)避”的信念越強烈,使其不斷預(yù)留更長的出行時間,則不同路徑前景值的增長幅度就越大;當(dāng)風(fēng)險追求者的比例較大時,出行者總體更加傾向于預(yù)留較短的出行時間,其出行前景表現(xiàn)為“損失”的概率較大,在此基礎(chǔ)上,出行者的信息接收程度越大,則意味著出行者“風(fēng)險追求”的信念越強烈,使其不斷預(yù)留更短的出行時間,則不同路徑前景值的降低幅度就越大。
進(jìn)一步,表3給出了不同路徑之間前景值的差異隨出行者信息接收程度的變化情況,由累積前景理論可知,路徑之間前景效用的差異是決定出行者群體在路網(wǎng)中分流的重要因素,結(jié)合表3可以發(fā)現(xiàn),在出行者信息接收程度的變化過程中,風(fēng)險追求者比例pr越小,不同路徑前景之間的差異變化越大,即此時出行者信息接收程度(交互作用)的大小會較大程度影響其對不同路徑優(yōu)劣的判斷,而當(dāng)pr增大時,不同路徑前景之間的差異變化減弱,即此時出行者信息接收程度(交互作用)的大小對不同路徑優(yōu)劣的判斷影響較小。這種不同路徑之間前景值差異的變化,體現(xiàn)了多主體在不同風(fēng)險態(tài)度及信息接收程度影響下的有限理性特點。
4.4.2路徑分流
調(diào)整出行者中不同風(fēng)險態(tài)度人群的比例pr及出行者的信息接收程度pc,演化至穩(wěn)定狀態(tài),圖5給出了演化過程中不同路徑的流量隨pr及pc的變化情況。
通過圖5可見,在演化中調(diào)節(jié)出行者群體中不同風(fēng)險態(tài)度人數(shù)的比例pr,形成了不同的路網(wǎng)分流結(jié)構(gòu),當(dāng)pr由小變大(即風(fēng)險追求者由少變多)時,路徑1,5的流量增加,路徑2,3,4,6的流量減小,由4.4.1節(jié)可知,這是由于當(dāng)出行者具有不同的風(fēng)險態(tài)度時,不同路徑的前景效用值發(fā)生了變化。此外,當(dāng)pr較小(即風(fēng)險厭惡者較多)時,出行者的信息接收程度(交互作用)對路徑流量的影響較大;當(dāng)pr較大(即風(fēng)險追求者較多)時,出行者的信息接收程度(交互作用)對路徑流量的影響較?。挥杀?可知,這是由于在不同信息接收程度下,對于出行者而言,不同路徑之間前景效用的差異發(fā)生了變化。
結(jié)合4.4.1節(jié)與本節(jié)的仿真結(jié)果可知,路網(wǎng)分流結(jié)構(gòu)的差異是多主體有限理性條件下出行者信息接收程度與群體風(fēng)險態(tài)度共同作用的結(jié)果。
5實際采集數(shù)據(jù)分析
為進(jìn)一步說明本文所建立模型的實際意義,特選取北京市海淀區(qū)交大東路與高粱橋斜街作為交通流量實際采集對象,記錄駛向西直門方向的車流量。選取原因在于:兩條路徑的交匯點即位于西直門商業(yè)樞紐與換乘樞紐,是大量車流流向的目的地,兩條路徑的流量分配情況能更好體現(xiàn)出行者群體的路徑選擇行為。
表4給出了北京市海淀區(qū)“交大東路”與“高粱橋斜街”的交通流量數(shù)據(jù)采集結(jié)果,不難發(fā)現(xiàn):
1)兩條路徑在高峰期與非高峰期的車流量具有明顯差異,這是由于,出行者群體在高峰期與非高峰期往往具有不同的出行時間參照點(風(fēng)險態(tài)度),高峰期的出行者往往風(fēng)險厭惡者占多數(shù)(預(yù)留較多出行時間),非高峰期的出行者往往風(fēng)險追求者占多數(shù)(預(yù)留較少出行時間),可見,上述采集結(jié)果較好地體現(xiàn)了出行者群體風(fēng)險態(tài)度對路徑流量的影響。
2)高峰期選擇兩條路徑的出行者人數(shù)比例差異大于非高峰期(在高峰期,駛向西直門方向且選擇“交大東路”的出行者是選擇“高粱橋斜街”的1.6倍,而非高峰期則是1.2倍)。這說明,高峰期(風(fēng)險厭惡者占據(jù)多數(shù))出行者群體的路徑選擇行為對路徑流量的影響更大,而在本文的模型中,出行者群體路徑選擇行為通過多主體間的信息交互作用實現(xiàn),因此,這一現(xiàn)象較好地印證了第4節(jié)中“當(dāng)pr較小(即風(fēng)險厭惡者較多)時,出行者的信息接收程度(交互作用)對路徑流量的影響較大;當(dāng)pr較大(即風(fēng)險追求者較多)時,出行者的信息接收程度(交互作用)對路徑流量的影響較小”這一仿真結(jié)果。
6小結(jié)
本文在前人工作的基礎(chǔ)上,對路徑選擇模型中的出行者假設(shè)做出了進(jìn)一步改進(jìn),基于自底向上的復(fù)雜系統(tǒng)多主體建模思想,刻畫了出行者的風(fēng)險態(tài)度差異及信息傳播機制,設(shè)計了具有演化機制的動態(tài)參照點,從而使新模型進(jìn)一步接近現(xiàn)實中人們的出行決策行為。通過路網(wǎng)分流算例仿真及相應(yīng)的實證數(shù)據(jù)采集分析,發(fā)現(xiàn)出行者的異質(zhì)特點(風(fēng)險態(tài)度、信息接收程度)是影響其對出行前景效用感知及路網(wǎng)分流結(jié)果的重要因素,此外,本文提出的模型較好地解釋了實際交通流分配中的流量變化現(xiàn)象。
本文只考慮了固定需求下的多主體路徑選擇情景,并且僅考慮了風(fēng)險態(tài)度及信息接收程度的影響,因此,未來的研究包括:1)彈性需求下的多主體路徑選擇問題;2)將更多的多主體自適應(yīng)屬性引入路徑選擇模型。
參考文獻(xiàn):
[1]Simon H A.Behavioral model of rational choice[J].Quarterly Journal of Economics,1955,69:99-120.
[2]Ellsberg D.Risk,Ambiguity and the savage axioms[J].Quarterly Journal of Economics,1961,75(4):643-669.
[3]Avineri E,Prashker J N.Sensitivity to travel time variability:travelers learning perspective [J].Transportation Research Part C,2005,13(2):157-183.
[4]Kahneman D,Tversky A.Prospect theory:an analysis of decision under risk[J].Econometrica,1979,47(2):263-291.
[5]Tversky A,Kahneman D.Advances in prospect theory:Cumulative representation of uncertainty[J].Risk Uncertainty,1992,5(4):297-323.
[6]Jou R C,Chen K H.An application of cumulative prospect theory to freeway drivers'route choice behaviours [J].Transportation Research Part A,2013,49(3):123-131.
[7]Xu H L,Zhou J, Xu W.A decision-making rule for modeling travelers'route choice behavior based on cumulative prospect theory [J].Transportation Research Part C,2011,19(2):218-228.
[8]Xu H L,Zhou J,Xu W.A prospect-based user equilibrium model with endogenous reference points and its application in congestion pricing [J].Transportation Research Part B,2011,45(2): 3111-328.
[9]Paolo De S,F(xiàn)rancesco F.Stochastic user equilibrium with reference-dependent route choice and endogenous reference points [J].Procedia-Social and Behavioral Sciences,2012,54(10):547-556.
[10]王偉,孫會君.基于內(nèi)生參考點的交通網(wǎng)絡(luò)均衡模型[J].應(yīng)用數(shù)學(xué)和力學(xué),2013,34(2):190-198.
Wang Wei,Sun Huijun.Traffic network equilibrium model based on endogenous reference point [J].Applied Mathematics and Mechanics,2013,34(2):190-198.
[11]Giselle de M R,Winnie D,Serge H.Modelling travellers'heterogeneous route choice behaviour as prospect maximizers [J].The Journal of Choice Modelling,2013,6(3):17-33.
[12]張波,雋志才,林徐勛.基于累積前景理論的出發(fā)時間選擇SDUO模型[J].管理工程學(xué)報,2013,27(1):68-76.
Zhang Bo,Juan Zhicai,Lin Xuxun.Stochastic dynamic user optimum model with departure time choice based on cumulative prospect theory [J].Journal of Industrial Engineering/Engineering Management,2013,27(1):68-76.
[13]Caspar G C,Harry J P. Measuring user benefits of changes in the transport system when traveler awareness is limited [J].Transportation Research Part A,2009,43(6):536-547.
[14]Ann van A,Erik R L.Self-organising behaviour in the presence of negative externalities:a conceptual model of commuter choice [J].European Journal of Operational Research,2004,157:501-513.
[15]度巍,黃崇超,肖海燕,等.信息系統(tǒng)下彈性需求隨機用戶均衡演化模型[J].交通運輸系統(tǒng)工程與信息,2013,13(6):120-126.
Du Wei,Huang Chongchao,Xiao Haiyan,et al.Stochastic user equilibrium evolutionary model with elastic demand and advanced traveler information systems [J].Journal of Transportation Systems Engineering and Information Technology,2013,13(6):120-126.
[16]John H M, Scott E P. Complex Adaptive Systems: an Introduction to Computational Models of Social Life [M]. Princeton, New Jersey: Princeton University Press, 2007.
[17]寇勇剛,吳桐水,朱金福.航空服務(wù)創(chuàng)新的元胞自動機競爭演化模擬[J].系統(tǒng)工程理論與實踐,2011, 31(6):1071-1076.
Kou Yonggang,Wu Tongshui,Zhu Jinfu.Simulating of evolution for the aviation service innovation competition with cellular automata [J].Systems Engineering Theory & Practice,2011, 31(6):1071-1076.
[18]Lo H K,Luo X W,Siu B W Y.Degradable transport network:travel time budget of travelers with heterogeneous risk aversion [J].Transportation Research Part B,2006,40(9):792-806.
[19]張波.基于前景理論的動態(tài)路徑選擇行為研究[D].上海:上海交通大學(xué)安泰經(jīng)濟(jì)與管理學(xué)院,2012.
Zhang Bo.Research on dynamic route choice behavior based on prospect theory [D].Shanghai:Antai College of Economics & Management Shanghai Jiao Tong University,2012.
[20]Asmaa A N,Ahmet T E, Tughrul A.Dynamic fault-tolerant three-dimensional cellular genetic algorithms[J]. J. Parallel Distrib.Comput,2013,(73):122-136.
(責(zé)任編輯耿金花)
Dynamic Reference Points based Bounded Rational Multi-Agent Model of Route Choice
LI Xueyan, LI Xuemei, LI Xuewei, ZHAO yun, QIU Heting
(School of Economics and Management, Beijing Jiaotong University, Beijing 100044, China)
Abstract:For the research of the impacts of travellers’ adaptive behavior on traffic flow assignment under bounded rationality, the multi-agent model of route choice with interaction among travellers is established using cumulative prospect theory and cellular automaton, in which travellers are grouped into two types: risk lovers and risk averse. Travellers’ heterogeneous dynamic reference points and evolution rules are designed based on travel time reliability and the idea of cellular genetic algorithm, so travellers can dynamically adjust their budget of travel time according to environment. The new model is more in tune with travellers’ actual behavior. Then by combining multi-passengers’ evolution rule with method of successive average, the new traffic flow assignment is solved. The study found that (1) the new model inherited the characteristics of the traditional traffic flow assignment model; (2) proportions of travellers with different risk attitude and travellers’ information receiving degree are critical factors which affecting traffic flow assignment.
Key words:bounded rationality; multi-agent; risk; cellular genetic algorithm; dynamic reference points; traffic flow assignment;
文章編號:1672—3813(2016)02—0027—09;
DOI:10.13306/j.1672-3813.2016.02.004
收稿日期:2014-05-23;修回日期:2014-12-10
基金項目:國家自然科學(xué)基金(71273023);高等學(xué)校博士學(xué)科點專項科研基金:(20130009110020);中央高校基本科研業(yè)務(wù)費專項資金(2013YJS039;2014YJS059)
作者簡介:李雪巖(1987-),男,內(nèi)蒙古呼和浩特人,博士研究生,主要研究方向為管理科學(xué)及復(fù)雜系統(tǒng)決策理論。
中圖分類號:N945
文獻(xiàn)標(biāo)識碼:A