夏新海,許倫輝,楊景山,彭智敏
(1.廣州航海學(xué)院 港口與航運(yùn)管理學(xué)院,廣東 廣州 510725;2.華南理工大學(xué) 土木與交通學(xué)院,廣東 廣州 510640;3.廣州航海學(xué)院 土木與工程管理學(xué)院,廣東 廣州 510725;4.廣州大學(xué) 機(jī)械與電子工程學(xué)院 廣東 廣州 510006)
交叉口是城市路網(wǎng)中各向交通流匯聚交錯(cuò)的地點(diǎn),對(duì)它的交通信號(hào)控制是城市交通控制系統(tǒng)的核心,并且是實(shí)現(xiàn)干道和區(qū)域交通信號(hào)協(xié)調(diào)控制系統(tǒng)的基礎(chǔ)。要實(shí)現(xiàn)未來(lái)城市交通信號(hào)控制的智慧化,交叉口交通信號(hào)控制顯得極為重要[1]。交叉口交通信號(hào)控制用到的Webster方法、沖突點(diǎn)法等方法難以適應(yīng)交通條件發(fā)生的變化。常規(guī)感應(yīng)控制沒(méi)有考慮到相位之間的矛盾,增加綠燈時(shí)間可能會(huì)造成其他相位平均車(chē)輛排隊(duì)長(zhǎng)度增大。雖然SCOOT,SCATS,OPAC等自適應(yīng)交通信號(hào)控制系統(tǒng)比固定交通信號(hào)控制和感應(yīng)式交通信號(hào)控制方案的性能要好,但其往往在可擴(kuò)展性和魯棒性等方面受到限制。近10年來(lái)神經(jīng)模糊網(wǎng)絡(luò)、tabu搜索、自組織協(xié)調(diào)圖、情感算法、遺傳算法等方法用來(lái)改進(jìn)交叉口交通信號(hào)控制方案,但存在指數(shù)復(fù)雜性和需要大量數(shù)據(jù)來(lái)校準(zhǔn)參數(shù)等局限性。
博弈論是研究理性決策者之間策略交互的數(shù)學(xué)模型,其被認(rèn)為是解決城市交通信號(hào)控制問(wèn)題的合適方法,有利于提高協(xié)調(diào)控制效率,能較好地適應(yīng)交通需求水平的動(dòng)態(tài)變化[2-4]。早期,一些學(xué)者(如Villalobos 等[5],楊曉芳等[6],朱銘琳等[7],李建明等[8],Clempner 等[9])使用非合作博弈來(lái)進(jìn)行交叉口相位交通信號(hào)協(xié)調(diào)控制,并取得了一定的效果。但非合作博弈各參與者沒(méi)有交互動(dòng)作等信息,其納什均衡缺乏對(duì)效率的考慮,并容易陷入局部最優(yōu)解,協(xié)調(diào)效率有限。Elhenawy等[10]采用斗雞博弈來(lái)進(jìn)行單交叉口交通控制,但未考慮交通信號(hào)設(shè)置。于是,一些學(xué)者結(jié)合合作和非合作博弈進(jìn)行信號(hào)控制交叉口相位協(xié)調(diào)控制研究。彭敏等[11]采用二人合作博弈確定交叉口放行方向以及二人非合作博弈來(lái)確定該方向上各信號(hào)燈放行時(shí)間來(lái)建立交叉口交通信號(hào)博弈模型。Zhao等[12]提出了基于協(xié)調(diào)博弈和Pareto效率的交叉口交通信號(hào)控制,利用非合作博弈框架對(duì)交叉口進(jìn)行建模,利用合作博弈模型中的Pareto效率概念進(jìn)行求解。也有學(xué)者利用聯(lián)盟博弈研究單交叉口交通信號(hào)控制。如盧維科等[13]建立了以執(zhí)行綠燈的相位和下一相位為聯(lián)盟的單信號(hào)交叉口合作博弈控制模型。但是上述研究對(duì)相位合作時(shí)交叉口交通信號(hào)控制系統(tǒng)的漸近穩(wěn)定性缺乏深入的研究。
也有學(xué)者將車(chē)聯(lián)網(wǎng)和博弈論相結(jié)合研究交叉口交通信號(hào)控制。Xu等[14]提出了一種V2I技術(shù)環(huán)境下延誤車(chē)輛選擇路徑與交通信號(hào)調(diào)整之間的博弈模型,但參與人不是相位。談判博弈作為一種合作博弈,將其應(yīng)用于交叉口各相位協(xié)調(diào)控制的研究較少。Tan等[15],Abdelghaffar等[16]利用納什談判解來(lái)優(yōu)化交叉口交通信號(hào)控制,但缺乏算法的穩(wěn)定性分析。Valencia等[17]、夏新海等[18]嘗試?yán)谜勁胁┺倪M(jìn)行多個(gè)交叉口交通信號(hào)協(xié)調(diào)控制,但缺乏信號(hào)控制交叉口效用空間的凸性分析,因此在交通需求處于過(guò)飽和狀態(tài)時(shí)不一定能保證算法的最優(yōu)性。
談判博弈模型允許各參與者之間通過(guò)交互信息進(jìn)行協(xié)商,適合離散動(dòng)態(tài)交互問(wèn)題建模。鑒于此,本研究主要目的是利用談判模型建立信號(hào)控制交叉口相位間博弈協(xié)調(diào)框架,將其轉(zhuǎn)化為局部數(shù)學(xué)規(guī)劃問(wèn)題,并對(duì)其相位效用空間進(jìn)行了凸性分析。在此基礎(chǔ)上,設(shè)計(jì)有效的求解算法,并對(duì)算法的穩(wěn)定性進(jìn)行理論分析。最后設(shè)計(jì)不同的交通需求情景,驗(yàn)證所提出算法的有效性和穩(wěn)定性。
因此,本研究就理論貢獻(xiàn)而言,對(duì)相位效用空間的凸性和相位合作時(shí)交叉口交通信號(hào)控制系統(tǒng)的穩(wěn)定性進(jìn)行了理論分析。從方法論的角度來(lái)看,相位利用感知的效用選擇合作,保持相位局部控制決策的有效性,并盡可能實(shí)現(xiàn)整個(gè)交叉口信號(hào)控制的效率,以計(jì)算效率高的方式找到相位信號(hào)控制問(wèn)題的合作解決方案。
本談判博弈模型針對(duì)信號(hào)控制十字交叉口。以其信號(hào)控制交叉口兩相鄰相位為例,相位1和2(其中相位1為某一時(shí)刻末將要執(zhí)行綠燈相位,相位2為相位1的下一相位)總是存在一種矛盾。隨著綠燈時(shí)間的增大,執(zhí)行綠燈相位1的平均車(chē)輛排隊(duì)長(zhǎng)度變小,而執(zhí)行紅燈相位2的平均車(chē)輛排隊(duì)長(zhǎng)度在增加。這種交互可以描述成兩個(gè)相位對(duì)綠燈資源的博弈。
因此,城市交叉口交通信號(hào)控制中每個(gè)相位在進(jìn)行局部交通信號(hào)控制時(shí)均受到其他相位局部交通信號(hào)控制的影響,并且每一相位需要在交叉口交通信號(hào)控制性能和相位局部交通信號(hào)控制性能之間進(jìn)行權(quán)衡,使得各相位間交通信號(hào)控制能夠共創(chuàng)雙贏,因此各相位間為了相互的利益需要進(jìn)行合作,進(jìn)行控制動(dòng)作等信息的交互。此交互環(huán)境屬于離散動(dòng)態(tài)交互。車(chē)聯(lián)網(wǎng)技術(shù)的發(fā)展使得各相位之間以及各相位和交叉口交通信號(hào)控制器之間能交換性能指標(biāo)和控制方案等信息,因此交叉口交通信號(hào)控制問(wèn)題可用時(shí)間離散動(dòng)態(tài)談判博弈框架來(lái)描述。
假設(shè)交通信號(hào)控制交叉口由M個(gè)信號(hào)控制相位組成,其信號(hào)周期為C(s),最大和最小周期分別為Cmax,Cmin,相位的綠燈間隔時(shí)間為Ii(s),每個(gè)相位的綠燈持續(xù)時(shí)間為Gi(s),相位最小綠燈時(shí)間為Gmin(s)。
定義此談判博弈模型為元組G=(N,{Ai}i∈N,{φi(a(k)}i∈N,{ηi}i∈N)。其中N={1,…,M}為信號(hào)控制交叉口中各相位的集合。
Ai為信號(hào)控制交叉口中第i個(gè)相位的可行動(dòng)作集合。對(duì)于每個(gè)相位,其動(dòng)作ai∈Ai,Ai={1,0}。其中,動(dòng)作1表示保持綠燈指示,意味著沒(méi)有信號(hào)變化(即綠燈指示將保持綠色;紅燈指示將保持紅色)。動(dòng)作0表示改變綠燈指示,意味著交通信號(hào)指示將在仿真時(shí)間間隔內(nèi)改變(即綠燈指示將變?yōu)辄S色,然后變?yōu)榧t色;紅燈指示將變?yōu)榫G色)。當(dāng)某一個(gè)相位保持綠燈指示,而所有其他相位保持紅燈指示。
φi(a(k)):A1×…×AM→R:為在時(shí)間步k時(shí),當(dāng)信號(hào)控制交叉口各相位采用聯(lián)合動(dòng)作a(k)時(shí)第i個(gè)相位的效用函數(shù),其決定了信號(hào)控制交叉口中第i個(gè)相位的喜好和策略,并給出了一定程度的理性。其中a(k)為聯(lián)合動(dòng)作向量,a(k)=(a1,a2,…,aM)。
博弈中每個(gè)相位的效用函數(shù)φi可定義為應(yīng)用特定動(dòng)作后每個(gè)相位相應(yīng)車(chē)道車(chē)輛排隊(duì)長(zhǎng)度總和的估計(jì)值,根據(jù)如下思路計(jì)算。
在仿真中,使用Vissim軟件監(jiān)控車(chē)速,假設(shè)車(chē)輛與交叉口交通信號(hào)控制器有某種形式的通信(即,車(chē)輛與基礎(chǔ)設(shè)施[V2I]通信),或使用閉路電視攝像機(jī)的視頻圖像處理器的檢測(cè)能力,包括車(chē)輛排隊(duì)檢測(cè)、車(chē)輛方向的檢測(cè)、車(chē)速檢測(cè),并且計(jì)算出進(jìn)入交叉口的車(chē)流。所有進(jìn)入車(chē)道的這些參數(shù)都會(huì)不斷更新。
(1)
(2)
每個(gè)相位的效用為:
(3)
式中,Δt為更新時(shí)間間隔;Qi(t+Δt)為相位i在Δt之后的估計(jì)排隊(duì)長(zhǎng)度;Qinl為車(chē)流到達(dá)率(veh/h/車(chē)道);Qoutl為車(chē)流駛出率(veh/h/車(chē)道)。Qoutl通常在連接的下游端測(cè)量,而Qinl則在距離連接的下游端相當(dāng)于阻塞密度上的談判初始點(diǎn)值(定義見(jiàn)下文)處測(cè)量。
使用運(yùn)動(dòng)學(xué)公式(4)來(lái)估計(jì)Qinl,其中sgn(x)是符號(hào)函數(shù)。
(4)
對(duì)于Qoutl,計(jì)算可分為3種情況。對(duì)處于綠燈相位并希望保持當(dāng)前相位(條件c1)的相位,可以簡(jiǎn)單地使用飽和流率進(jìn)行估算;對(duì)處于紅燈相位并希望切換到綠燈相位(條件c2)的相位,不能使用飽和流率(綠燈相位將剛剛開(kāi)始),因此使用運(yùn)動(dòng)學(xué)公式來(lái)估計(jì);對(duì)于其他條件,駛離車(chē)輛的數(shù)量為零。因此Qoutl的公式如(5)所示:
(5)
式中,μl為車(chē)道l的飽和流率;ΔL可用如下公式估算:
(6)
ηi為信號(hào)控制交叉口中第i個(gè)相位的談判初始點(diǎn),為期望性能的最大損失,其反映信號(hào)控制交叉口中第i個(gè)相位是否參與合作的意愿。
交叉口交通信號(hào)控制的目標(biāo)是使不同相位的排隊(duì)長(zhǎng)度最小化并相等。根據(jù)文獻(xiàn)Nash[19]的雙人博弈談判模型,此博弈問(wèn)題可轉(zhuǎn)化為如下局部線性數(shù)學(xué)規(guī)劃問(wèn)題(其中l(wèi)og(_)函數(shù)來(lái)自于Nash乘積的轉(zhuǎn)換)來(lái)求解最優(yōu)動(dòng)作:
(7)
s.t.:
ηi(k)≥φi(a(k));Cmin≤C≤Cmax;
式中wi=1/M。
根據(jù)文獻(xiàn)Nash[19],若效用空間{φi(a(k)}i∈N為有界的閉凸集,則式(7)存在唯一的最優(yōu)解,即能保證收斂到最優(yōu)解。因此,為了設(shè)計(jì)有效算法求解談判博弈模型,需要對(duì)信號(hào)控制相位效用空間凸性進(jìn)行分析。
設(shè)一信號(hào)周期長(zhǎng)為C的交通信號(hào),其有效紅燈時(shí)間為R;有效綠燈時(shí)間為G;有效綠燈時(shí)間內(nèi)的飽和流率為μ;車(chē)輛平均到達(dá)率為λ;通行能力為c(c=μG/C);一個(gè)周期內(nèi)的服務(wù)車(chē)輛數(shù)為n′(n′=λC);延誤車(chē)輛數(shù)為n。
(1)非飽和交通需求下(λ 非飽和交通條件下一個(gè)信號(hào)周期內(nèi)全部車(chē)輛的總延誤時(shí)間,用ω(veh·s)表示,可以得到一個(gè)周期內(nèi)每輛車(chē)的平均延誤時(shí)間為[20]: (8) 設(shè)G1,G2為兩個(gè)相位(南北車(chē)流和東西車(chē)流各一個(gè)相位)的有效綠燈時(shí)間;L為損失時(shí)間;μ為進(jìn)口車(chē)道飽和流率;λ為進(jìn)口車(chē)道到達(dá)率,則有R1=L+G2,R2=L+G1,并且L=C-G1-G2。 4個(gè)入口車(chē)道的總車(chē)均延誤為: (9) 式中i為入口車(chē)道編號(hào)。根據(jù)式(8)、(9)有: (10) 將R1,R2,C用L,G1,G2替換,4個(gè)進(jìn)口道上的平均車(chē)輛排隊(duì)長(zhǎng)度之和為: (11) 因此,需要證明車(chē)輛排隊(duì)長(zhǎng)度函數(shù)(y)是一個(gè)凸函數(shù)。令 式中,a,b,c,d是正常數(shù),于是有: (12) 設(shè)η為特定車(chē)道上可存儲(chǔ)的最大車(chē)輛排隊(duì)長(zhǎng)度,根據(jù)前述,博弈效用定義為車(chē)輛排隊(duì)長(zhǎng)度,即φ=y。因?yàn)橥瓿闪诉@一步的y是一個(gè)凸函數(shù),所以不等式(y(G1,G2)≤常數(shù))定義了一個(gè)凸集,即φ≤η為凸集。式(12)可以推廣到任意數(shù)量有多個(gè)流向車(chē)流的相位。 因此對(duì)于非飽和交通需求,效用空間是凸的,局部?jī)?yōu)化問(wèn)題(7)能保證收斂到唯一的最優(yōu)解。 (2)過(guò)飽和交通需求(λ>c),效用空間不是凸的 對(duì)于過(guò)飽和的交通條件,綠燈間隔(即λiC>μiG)結(jié)束時(shí),排隊(duì)車(chē)輛沒(méi)有被清除,剩余的排隊(duì)車(chē)輛在整個(gè)分析時(shí)間段T內(nèi)持續(xù)增加。 為了計(jì)算在綠燈期間無(wú)法提供放行服務(wù)的排隊(duì)車(chē)輛數(shù),必須在式(12)中添加4個(gè)進(jìn)口道與過(guò)飽和延誤有關(guān)的附加項(xiàng)(y2)。過(guò)飽和平均排隊(duì)長(zhǎng)度(y2)為: (13) 式中,Zi為正增凸函數(shù);Z-1為正減凸函數(shù);μi為正常數(shù)。因此,μi(Zi-L)Z-1為一個(gè)凸函數(shù),-μi(Zi-L)Z-1為一個(gè)凹函數(shù)。于是,對(duì)于過(guò)飽和交通需求,總排隊(duì)長(zhǎng)度函數(shù)不是凸函數(shù)。 因此,對(duì)于過(guò)飽和交通需求,效用空間不是凸的,當(dāng)車(chē)輛排隊(duì)溢出超過(guò)初始參考點(diǎn)時(shí),局部?jī)?yōu)化問(wèn)題(6)不能保證收斂到最優(yōu)解。 (1)保證算法的最優(yōu)性 根據(jù)本研究第2部分研究結(jié)論,對(duì)于非飽和交通需求下,局部?jī)?yōu)化問(wèn)題(6)是可行的,算法能保證收斂到唯一的最優(yōu)解。而對(duì)于過(guò)飽和交通需求,局部?jī)?yōu)化問(wèn)題(6)不可行。因此,為了保證算法收斂到最優(yōu)解,算法在當(dāng)時(shí)間步k=0時(shí),將相位談判初始點(diǎn)設(shè)置為基于車(chē)道長(zhǎng)度可容納的最大可測(cè)排隊(duì)長(zhǎng)度。 (2)避免繁瑣的迭代過(guò)程 算法由一系列步驟組成,其結(jié)果是以合作或非合作的方式解決局部?jī)?yōu)化問(wèn)題(6)[19]。信號(hào)控制交叉口相位i與其他相位j交換動(dòng)作、談判初始值,可以避免繁瑣的迭代過(guò)程,信號(hào)控制交叉口各相位根據(jù)從合作行為中感知的效用來(lái)決定是否合作。 (3)合理構(gòu)建初始點(diǎn) 給定談判初始點(diǎn)的更新條件,其值降低(這意味著相位i決定合作)為增加合作行為的需求提供了強(qiáng)有力的激勵(lì);但是,使其值等于效用函數(shù)的當(dāng)前值(意味著相位i決定不合作)為改變不合作的決策而提供了激勵(lì)。鑒于此,ηi值構(gòu)建如下: (14) 式中α為系數(shù),0≤α≤1。 (1)時(shí)間步k=0,每一相位的ηi設(shè)置為相位所屬的基于車(chē)道長(zhǎng)度可容納的最大可測(cè)車(chē)輛排隊(duì)長(zhǎng)度。 (2)在每一時(shí)間步k,每一相位i將ai,ηi值發(fā)送給其他相位。 (3)對(duì)于每一相位i=1,…,M,根據(jù)接收到的其他相位的信息,求解局部?jī)?yōu)化問(wèn)題(7)。 (5)每一相位更新其談判初始點(diǎn)。如果局部?jī)?yōu)化問(wèn)題(7)可行(非飽和交通需求下),相位i根據(jù)ηi(k+1)=ηi(k)-α(ηi(k)-φia(k))來(lái)更新談判初始點(diǎn)。如果局部?jī)?yōu)化問(wèn)題(7)不可行(過(guò)飽和交通需求下),相位i根據(jù)ηi(k+1)=φia(k))更新談判初始點(diǎn)。 (6)所有相位將更新的控制動(dòng)作和談判初始點(diǎn)發(fā)送給其他相位。 (7)轉(zhuǎn)到步驟(2)。 從算法流程中看出,該算法只需求解一個(gè)優(yōu)化問(wèn)題,其減少了有關(guān)相位之間的通信,減輕了在每個(gè)時(shí)間步處理多個(gè)優(yōu)化問(wèn)題的有關(guān)分布式交通信號(hào)控制的計(jì)算負(fù)擔(dān)。 談判博弈模型求解算法的穩(wěn)定性取決于每個(gè)相位是否決定合作。因此,為了證明此方法的穩(wěn)定性,考慮了兩種情況: (1)所有相位總是相互合作。 (2)一些相位不合作,僅在少量的時(shí)間步內(nèi)開(kāi)始合作。這里不考慮所有相位決定不合作的情況,因?yàn)楦鶕?jù)第3.1節(jié)中提出的談判初始點(diǎn)的構(gòu)建,這種情況只有當(dāng)k→∞,φi(a(k))→∞發(fā)生。根據(jù)前述,對(duì)于不合作的相位有ηi(k+1)=φi(a(k))。 (15) (16) (17) (18) (19) 在時(shí)間步k+1, 全局效用函數(shù)的初始值由式(20)給出: (20) 根據(jù)式(16)有: (21) 并且根據(jù)式(19)有: (22) 其中有 a-i(k)], (23) (24) 式中M(k)≤0,定義如下: (25) (1)?(a(k))≠0,L(a(k))≠0, (2)對(duì)于a(k)=0,L(a(k))=0, (3) ?k,L(a(k+1))-L(a(k))≤M(k)。 其中M(k)為k的一個(gè)非遞增函數(shù)時(shí),控制系統(tǒng)的狀態(tài)收斂到原點(diǎn)附近。因此,系統(tǒng)是穩(wěn)定的。由于不能證明M(k)收斂到原點(diǎn),因此在一般情況下不能保證漸近穩(wěn)定性。 一種特例是所有相位總是決定合作,即?k,C(k)=N。在這種情況下: (26) (27) (28) 因此: (29) 那么有 (30) 根據(jù)前述,L(a(k))為二次正凸函數(shù),滿足: (1)?(a(k))≠0,L(a(k))≠0。 (2)對(duì)于a(k)=0,L(a(k))=0。 所以有: (1)?k,Mc(k)>0。 (2)L(a(k+1))-L(a(k))是k的遞減函數(shù),其下限為0。 因此,L(a(k))滿足Lyapunov函數(shù)的條件,并證明了當(dāng)相位總是決定合作時(shí)交叉口交通信號(hào)控制系統(tǒng)的漸近穩(wěn)定性。 仿真試驗(yàn)將在具有4個(gè)方向(東、南、西、北)進(jìn)口道的十字交叉口進(jìn)行測(cè)試,每個(gè)進(jìn)口道由3條車(chē)道組成。劃分4個(gè)相位,分別為:東西進(jìn)口車(chē)流直行及右轉(zhuǎn),東西進(jìn)口車(chē)流左轉(zhuǎn),南北進(jìn)口車(chē)流直行及右轉(zhuǎn),南北進(jìn)口車(chē)流左轉(zhuǎn)。各相位原始交通需求(O-D)矩陣見(jiàn)表1,其在VISSIM仿真平臺(tái)中設(shè)置。 表1 原始交通需求O-D矩陣(單位:veh/h)Tab.1 Original traffic demand O-D matrix(unit:veh/h) 采用韋伯斯特方法對(duì)固定配時(shí)方案進(jìn)行優(yōu)化,黃燈時(shí)間ty為3 s,全紅時(shí)間為2 s。感應(yīng)控制的最大綠燈時(shí)間和固定交通信號(hào)控制方案相同。感應(yīng)控制的最小綠燈時(shí)間為6 s,最大綠燈時(shí)間為31 s,綠燈延長(zhǎng)時(shí)間為2 s。因當(dāng)Δt很小時(shí),即接近黃燈時(shí)間時(shí),對(duì)應(yīng)切換函數(shù)的下一相位的效用函數(shù)在太短的有效綠燈時(shí)間內(nèi)緩慢增加。當(dāng)Δt較大時(shí),由于使用的所有變量都是在一個(gè)時(shí)刻檢測(cè)到的,因此使用的運(yùn)動(dòng)學(xué)公式見(jiàn)式(4)的估計(jì)將有較大的偏差,故取Δt=17 s。其他仿真參數(shù)值設(shè)置如下。 臨界速度:sTh=3.6(km/h);飽和流率:μ=1 655(veh/h/ln);自由流速度:80(km/h);阻塞密度:150(veh/h/ln)。時(shí)間步k=0,各相位的談判初始點(diǎn)設(shè)置為ηi=12。采用平均車(chē)輛排隊(duì)長(zhǎng)度、平均車(chē)輛行駛時(shí)間、總車(chē)均延誤對(duì)本研究方法、韋伯斯特固定信號(hào)控制和感應(yīng)控制方法的性能進(jìn)行評(píng)價(jià)。 以韋伯斯特的固定信號(hào)控制和感應(yīng)控制方法為基準(zhǔn)來(lái)評(píng)估本研究方法的性能。使用3個(gè)仿真場(chǎng)景:1個(gè)是表1所示的原始O-D交通需求矩陣;第2個(gè)是較低的交通需求,即原始O-D交通需求矩陣的80%;第3個(gè)是較高的需求,即原始O-D交通需求矩陣的120%。第1和第2個(gè)交通需求屬于非飽和交通需求,第3個(gè)交通需求屬于過(guò)飽和交通需求。 (1)算法有效性分析 表2給出了在原始交通需求下,Δt=17 s時(shí),通過(guò)使用韋伯斯特的固定信號(hào)控制、感應(yīng)控制方法和本研究方法得到的每條車(chē)道的平均車(chē)輛排隊(duì)長(zhǎng)度的均值和標(biāo)準(zhǔn)差。很明顯,雖然本方法并不是對(duì)幾乎所有車(chē)道都是最好的,但最后的結(jié)果表明本研究方法是最好的。另一方面,韋伯斯特方法在交通流量較大的相位效果較好,感應(yīng)控制方法在交通流量較小的相位效果較好,這使得同一算法下不同相位的差異較大。然而,對(duì)于本研究算法,無(wú)論交通流水平如何,幾乎所有車(chē)道的平均車(chē)輛排隊(duì)長(zhǎng)度都在同一水平上。由表2可知,采用本研究算法進(jìn)行交通信號(hào)控制時(shí),各個(gè)相位相關(guān)車(chē)道平均車(chē)輛排隊(duì)長(zhǎng)度波動(dòng)趨勢(shì)保持一致,即1個(gè)信號(hào)周期結(jié)束時(shí),不同相位之間平均車(chē)輛排隊(duì)相差不大,較好地實(shí)現(xiàn)了車(chē)輛排隊(duì)長(zhǎng)度均衡,表明了博弈中各個(gè)相位之間不是對(duì)立而是追求共同收益的關(guān)系。因此,可以將本研究算法具有更好的協(xié)調(diào)均衡性,以確保交通信號(hào)系統(tǒng)更有效。 表2 在原始交通需求下,不同方法下該測(cè)試交叉口各車(chē)道的平均車(chē)輛排隊(duì)長(zhǎng)度均值和標(biāo)準(zhǔn)差Tab.2 Standard deviations and mean values of average vehicle queue length for every lane of tested intersection by different methods under original traffic demand 不同方法和不同交通需求下本研究方法與韋伯斯特方法和感應(yīng)控制方法相比性能改進(jìn)情況見(jiàn)表3??梢钥闯觯嗽谳^低的交通需求下感應(yīng)控制方法運(yùn)行較優(yōu)外,本研究方法的3個(gè)有效性測(cè)試指標(biāo)的平均值相比之下都取得更好的值。特別是過(guò)飽和交通需求(高交通需求)時(shí),通過(guò)在時(shí)間步k=0時(shí)將相位談判初始點(diǎn)設(shè)置為基于車(chē)道長(zhǎng)度可容納的最大可測(cè)排隊(duì)長(zhǎng)度,本算法仍然保證收斂到最優(yōu)值,并且相對(duì)于非飽和交通需求,改進(jìn)效果更好。 表3 不同交通需求和不同方法的性能指標(biāo)值Tab.3 Performance indictors obtained by different methods under different traffic demands (2)算法穩(wěn)定性分析 表4顯示了不同交通需求下不同性能指標(biāo)的標(biāo)準(zhǔn)差,可以看出本研究方法除了在較低及原始的交通需求下部分指標(biāo)的標(biāo)準(zhǔn)差略低于感應(yīng)控制方法的部分指標(biāo)的標(biāo)準(zhǔn)差外,其他情況標(biāo)準(zhǔn)差明顯低于另外兩種方法,即各相位車(chē)流到達(dá)率類(lèi)似的情況下,平均車(chē)輛排隊(duì)長(zhǎng)度等指標(biāo)不會(huì)出現(xiàn)較大波動(dòng)。這是因?yàn)橄辔辉跊Q定合作過(guò)程中進(jìn)行動(dòng)作和談判初始點(diǎn)的交互,交叉口交通信號(hào)控制系統(tǒng)具有一定的漸近穩(wěn)定性。因此本研究方法更穩(wěn)定。 表4 不同交通需求下不同方法的性能指標(biāo)值的標(biāo)準(zhǔn)差Tab.4 Standard deviations of performance indictors obtained by different methods under different traffic demands 本研究提出了一種基于實(shí)時(shí)談判博弈優(yōu)化模型的信號(hào)控制交叉口相位協(xié)調(diào)控制方法。在進(jìn)行相位效用空間凸性分析的基礎(chǔ)上設(shè)計(jì)有效的求解算法。此算法可以避免繁瑣的迭代過(guò)程,并能保證算法在過(guò)飽和交通需求下收斂到最優(yōu)解。對(duì)算法的穩(wěn)定性進(jìn)行了理論分析。當(dāng)相位總是決定合作時(shí)交叉口交通信號(hào)控制系統(tǒng)具有漸近穩(wěn)定性。通過(guò)仿真試驗(yàn)分析對(duì)該算法與韋伯斯特方法和感應(yīng)控制方法在平均車(chē)輛排隊(duì)長(zhǎng)度、車(chē)均行駛時(shí)間和平均總延誤方面進(jìn)行了比較。結(jié)果表明,在不同交通需求下,該方法具有更好的有效性和穩(wěn)定性。 未來(lái)進(jìn)一步將本研究的算法擴(kuò)展到多交叉口,并引入智能網(wǎng)聯(lián)技術(shù)[22],以利于城市交通信號(hào)協(xié)調(diào)控制。另外,本研究采用可變相序,雖然可以通過(guò)提取道路數(shù)據(jù)選取最有價(jià)值通行相位,但是改變交叉口的相序時(shí)沒(méi)有考慮駕駛員停車(chē)按相位順序等待綠燈的習(xí)慣,以及由于相位切換造成的處理沖突的時(shí)間變長(zhǎng)問(wèn)題,這些將是以后的研究方向。3 談判博弈模型求解算法設(shè)計(jì)
3.1 基本思想
3.2 算法流程
4 算法穩(wěn)定性理論分析
5 仿真試驗(yàn)分析
5.1 測(cè)試交叉口
5.2 仿真參數(shù)和測(cè)試指標(biāo)
5.3 結(jié)果和討論
6 結(jié)論