馬雪婧 邵春福▲ 錢(qián)劍培 王天倚
(1. 北京交通大學(xué)城市交通復(fù)雜系統(tǒng)理論與技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室 北京 100044;
2.南通恒龍信息科技有限公司 江蘇 南通 226000)
?
交通事件持續(xù)時(shí)間預(yù)測(cè)的貝葉斯網(wǎng)絡(luò)模型*
馬雪婧1邵春福1▲錢(qián)劍培1王天倚2
(1. 北京交通大學(xué)城市交通復(fù)雜系統(tǒng)理論與技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室北京 100044;
2.南通恒龍信息科技有限公司江蘇 南通 226000)
摘要交通事件是引發(fā)道路交通擁堵的主要因素之一,通過(guò)實(shí)時(shí)交通誘導(dǎo)等手段可以降低其對(duì)交通運(yùn)行造成的影響,而及時(shí)準(zhǔn)確地預(yù)測(cè)事件持續(xù)時(shí)間則是實(shí)現(xiàn)有效管控的前提條件?;贛IT打分函數(shù),融合自上而下的網(wǎng)絡(luò)生長(zhǎng)規(guī)則,引入蟻群算法尋找最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu),即以S-ACOB算法為核心搭建最優(yōu)貝葉斯網(wǎng)絡(luò)模型。增加了節(jié)點(diǎn)隨機(jī)選擇機(jī)制及局部結(jié)構(gòu)概率選擇模式,降低局部最優(yōu)結(jié)果生成概率,確保貝葉斯網(wǎng)絡(luò)的健壯性。通過(guò)實(shí)例驗(yàn)證及對(duì)比分析,針對(duì)觀測(cè)節(jié)點(diǎn)屬性完備和缺失的情況,網(wǎng)絡(luò)模型預(yù)測(cè)精度分別為76.97%和93.23%,平均預(yù)測(cè)精度可達(dá)87.82%,證明該模型可以有效地預(yù)測(cè)交通事件持續(xù)時(shí)間。
關(guān)鍵詞交通工程;交通事件;持續(xù)時(shí)間預(yù)測(cè);貝葉斯網(wǎng)絡(luò);結(jié)構(gòu)學(xué)習(xí);MIT算法;S-ACOB算法
0引言
據(jù)公安部交通管理局統(tǒng)計(jì),2013年全國(guó)共接報(bào)道路交通事故598.7萬(wàn)起。由于交通事件的處理需要報(bào)警或發(fā)現(xiàn)、響應(yīng)、清除等步驟,有必要準(zhǔn)確預(yù)測(cè)交通事件持續(xù)時(shí)間,并及時(shí)進(jìn)行交通管控、交通誘導(dǎo),提出出行信息服務(wù)。Golob等[1-3]在預(yù)測(cè)交通事件持續(xù)時(shí)間方面進(jìn)行了大量早期研究,提出了各種預(yù)測(cè)方法,主要有:概率分布、回歸分析、風(fēng)險(xiǎn)模型、決策樹(shù)和時(shí)間序列模型等。由于數(shù)據(jù)源、樣本量,以及采用的方法和模型等差異,有學(xué)者提出了一些利用缺失數(shù)據(jù)進(jìn)行預(yù)測(cè)的非參數(shù)方法[4-6],其中,貝葉斯網(wǎng)絡(luò)預(yù)測(cè)效果顯著,不斷有學(xué)者對(duì)該方法進(jìn)行研究和實(shí)證檢驗(yàn)。
Sami Demiroluk等[7]根據(jù)利用K2算法對(duì)交通事件持續(xù)時(shí)間進(jìn)行預(yù)測(cè),最高預(yù)測(cè)精度提高22%;李大韋[8]通過(guò)推理算法構(gòu)建了一般貝葉斯網(wǎng)絡(luò)模型,在數(shù)據(jù)缺失不超過(guò)30%情況下,模型30 min預(yù)測(cè)準(zhǔn)確率超過(guò)80%;張良力等[9]運(yùn)用簇樹(shù)推理算法構(gòu)建貝葉斯網(wǎng)絡(luò)模型對(duì)駕駛行為進(jìn)行分析與預(yù)測(cè);楊超等[10]利用BNT工具箱實(shí)現(xiàn)結(jié)構(gòu)學(xué)習(xí)與參數(shù)學(xué)習(xí),得到的最大絕對(duì)誤差為10.32%;通過(guò)前人的研究成果可以看出,以貝葉斯網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)是可行的。但大多數(shù)研究者采用K2算法或數(shù)據(jù)挖掘平臺(tái)進(jìn)行預(yù)測(cè),具有一定的局限性,在一些情況下不能提供適合當(dāng)前數(shù)據(jù)集的網(wǎng)絡(luò)結(jié)構(gòu),且算法的搜索效率不高;為降低計(jì)算復(fù)雜度,部分論文對(duì)不顯著的事件屬性節(jié)點(diǎn)進(jìn)行刪減,雖然可以減少結(jié)構(gòu)搜索時(shí)間,但是在一定程度上降低了模型的可信度。故而有必要在數(shù)據(jù)集的基礎(chǔ)上,研究網(wǎng)絡(luò)模型搭建方法。筆者結(jié)合了屬性節(jié)點(diǎn)間互信息量與條件獨(dú)立性測(cè)試、局部結(jié)構(gòu)搜索、結(jié)構(gòu)空間搭建、評(píng)分尋優(yōu)搜索等方法,構(gòu)建了以S-ACOB算法為核心的貝葉斯網(wǎng)絡(luò)模型。采用自上而下的網(wǎng)絡(luò)生長(zhǎng)模式,隨機(jī)選擇初始節(jié)點(diǎn)及后續(xù)生長(zhǎng)節(jié)點(diǎn)以增強(qiáng)網(wǎng)絡(luò)結(jié)構(gòu)的多樣性;根據(jù)網(wǎng)絡(luò)生長(zhǎng)規(guī)則搜索合理的局部結(jié)構(gòu),確保模型的準(zhǔn)確性;一次性確定網(wǎng)絡(luò)結(jié)構(gòu)的邊及方向,避免二次搜索,大大提高搜索效率。
1貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)
貝葉斯網(wǎng)絡(luò)是一種有向圖模型,借助有向無(wú)環(huán)圖,圖像化變量之間的相互關(guān)系,得到節(jié)點(diǎn)處的條件概率分配。采用評(píng)分-搜索方法,以打分函數(shù)g(G:D)作為判斷標(biāo)準(zhǔn),構(gòu)建最符合數(shù)據(jù)集D的網(wǎng)絡(luò)結(jié)構(gòu)。常用算法有LL評(píng)分,MDL評(píng)分,BIC評(píng)分,AIC評(píng)分,NML,MIT等。
筆者采用MIT評(píng)分準(zhǔn)則,該評(píng)分使用子節(jié)點(diǎn)與父節(jié)點(diǎn)之間的互信息和獨(dú)立性測(cè)試評(píng)估兩者的相關(guān)程度來(lái)構(gòu)造貝葉斯網(wǎng)。該算法學(xué)習(xí)效率較好,貼合貝葉斯網(wǎng)絡(luò)的語(yǔ)義,更大程度的還原數(shù)據(jù)本來(lái)面目,增強(qiáng)模型的真實(shí)性。
MIT全局打分函數(shù)為[8]
gMIT(G:D)=
(1)
式中:N為樣本容量;Pa(Xi)為變量Xi的父節(jié)點(diǎn)集;ID(Xi,Pa(Xi))為Xi與Pa(Xi)的互信息;χα,liσi(j)為卡方檢驗(yàn)值。
因Pa(Xi)中各變量的分類數(shù)ri會(huì)影響自由度lij的計(jì)算,將Pa(Xi)中變量依據(jù)ri的大小排序,得到變化后Xi的父節(jié)點(diǎn)集為Paσi(j)。式(1)中,前一項(xiàng)主要計(jì)算點(diǎn)Xi與其父節(jié)點(diǎn)集Pa(Xi)的互信息,后一項(xiàng)將獨(dú)立性檢驗(yàn)作為罰項(xiàng)。式(2)計(jì)算了在Paσi(j)情況下,卡方檢驗(yàn)自由度liσi(j)。其中:riσi(j)為排序后的父節(jié)點(diǎn)集Paσi(j)的分類數(shù)。
對(duì)于節(jié)點(diǎn)集合I={X1,…,Xn},其聯(lián)合概率P可以由式(3)表示。
(3)
2S-ACOB算法
ACOB算法[5]是基于蟻群尋優(yōu)的得分搜索算法,使用貪心算法進(jìn)行局部?jī)?yōu)化,但這種方法時(shí)間復(fù)雜度較高。因此一些學(xué)者提出I-ACOB算法[6],通過(guò)條件獨(dú)立性測(cè)試去掉無(wú)關(guān)聯(lián)的邊,并利用ACOB方法在縮小的解集尋找最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu),但只測(cè)試節(jié)點(diǎn)間是否獨(dú)立,未考慮局部網(wǎng)路結(jié)構(gòu)與各節(jié)點(diǎn)的獨(dú)立關(guān)系,如此縮小解集范圍容易造成搜索空間的不完整。筆者所提出S-ACOB的主要目標(biāo)是在保障模型準(zhǔn)確性的基礎(chǔ)上降低運(yùn)算時(shí)間,其具體的實(shí)現(xiàn)思路是在ACOB的基礎(chǔ)上,通過(guò)MIT局部打分函數(shù),判斷局部網(wǎng)絡(luò)結(jié)構(gòu)與后續(xù)生長(zhǎng)節(jié)點(diǎn)之間的獨(dú)立關(guān)系,以得到最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)。
2.1S-ACOB的參數(shù)及規(guī)則
1) 信息素τ。當(dāng)某只螞蟻找到了評(píng)分最大的結(jié)構(gòu),該結(jié)構(gòu)矩陣就被采納并用于更新全局信息素規(guī)則。
(4)
式中:ρ為信息素?fù)]發(fā)系數(shù);1-ρ為信息素殘留因子,ρ?[0,1); Δτij為本次路徑Eij上的信息素增量,初始時(shí)刻Δτij(t)=0。
式(5)為本文中計(jì)算公式。
(5)
2) 啟發(fā)式信息η。每增加一個(gè)新的局部結(jié)構(gòu)(即有向邊Eij),用式(3)計(jì)算該結(jié)構(gòu)對(duì)應(yīng)的得分。螞蟻狀態(tài)轉(zhuǎn)移規(guī)則:在搜索過(guò)程中,螞蟻根據(jù)各條路徑上的信息量及路徑的起發(fā)信息來(lái)計(jì)算狀態(tài)轉(zhuǎn)移概率P。
(6)
式中:allowedk為螞蟻k下一步允許選擇的節(jié)點(diǎn);α為信息啟發(fā)式因子,表示軌跡的相對(duì)重要性;β為期望啟發(fā)式因子,表示起發(fā)信息在螞蟻選擇路徑中的受重視程度;ηij(t) 為啟發(fā)函數(shù);τij(t) 為信息素。
3) 網(wǎng)絡(luò)生長(zhǎng)規(guī)則:采用由上至下的網(wǎng)絡(luò)增長(zhǎng)模式,隨機(jī)選擇初始節(jié)點(diǎn)及后續(xù)生長(zhǎng)節(jié)點(diǎn)。在選擇后續(xù)節(jié)點(diǎn)生長(zhǎng)位置時(shí),通過(guò)局部打分函數(shù)判斷該節(jié)點(diǎn)與已有結(jié)構(gòu)各節(jié)點(diǎn)間的條件獨(dú)立性,得到合理的生長(zhǎng)結(jié)構(gòu),根據(jù)各結(jié)構(gòu)得分確定概率,隨機(jī)選擇最終生長(zhǎng)結(jié)構(gòu)。MIT局部打分函數(shù)[4]如式(7)所示,用于判斷Xj與Xi在Pa(Xi)情況下是否獨(dú)立。
(7)
2.2S-ACOB的算法描述
1) 局部結(jié)構(gòu)搜索程序。
步驟1。輸入的剩余目標(biāo)節(jié)點(diǎn)集合Va、已計(jì)算節(jié)點(diǎn)集合Vb。
步驟2。根據(jù)局部打分函數(shù),判斷Vb(j)是否適合作為Va(i)父節(jié)點(diǎn),若計(jì)算結(jié)果大于零,則將Vb(j)加入到Va(i)的父節(jié)點(diǎn)集合Pa(Va(i))中。
步驟3。將Va(i)與其對(duì)應(yīng)父節(jié)點(diǎn)以鄰接矩陣表示,得到局部結(jié)構(gòu)STU(i)。
步驟4。根據(jù)式(3)計(jì)算得到局部結(jié)構(gòu)集合STU對(duì)應(yīng)的得分集合g。
步驟5。輸出結(jié)構(gòu)集合STU與其對(duì)應(yīng)得分集合g。
2) 蟻群主控程序。
步驟1。輸入數(shù)據(jù)集D 、規(guī)定最大迭代次數(shù)Nmax、螞蟻數(shù)目m。
步驟2。第N次迭代中,第i只螞蟻在目標(biāo)節(jié)點(diǎn)集合Vall中隨機(jī)選擇一個(gè)節(jié)點(diǎn)加入已計(jì)算節(jié)點(diǎn)集合Vb中,剩余目標(biāo)節(jié)點(diǎn)集合為Va。
步驟3。通過(guò)結(jié)構(gòu)搜索算法得到局部結(jié)構(gòu)集合STU與其對(duì)應(yīng)得分集合g。
步驟4。根據(jù)局部結(jié)構(gòu)得分g與全局信息素Tau,確定狀態(tài)轉(zhuǎn)移概率PVa。
步驟5。通過(guò)輪盤(pán)賭方式選定對(duì)應(yīng)的局部結(jié)構(gòu)STU*。
步驟6。將其中新增節(jié)點(diǎn)V*加入Vb中,更新剩余目標(biāo)節(jié)點(diǎn)Va,將新的局部結(jié)構(gòu)STU*加入到表示整體結(jié)構(gòu)的鄰接矩陣CM中。
步驟7。重復(fù)步驟3~6,得到完整結(jié)構(gòu)Ri,計(jì)算得分Gi,并記錄。
步驟8。重復(fù)步驟2~7,記錄在N次迭代中局部最優(yōu)結(jié)構(gòu)R*。
步驟9。更新全局信息素Tau。
步驟10。重復(fù)步驟2~9,得到全局最優(yōu)結(jié)構(gòu)Rbest。
3模型預(yù)測(cè)效果分析
3.1數(shù)據(jù)來(lái)源
研究數(shù)據(jù)主要來(lái)源于荷蘭國(guó)家事件管理中心的拖車(chē)管理部門(mén),還有部分來(lái)源于警察和路政部門(mén)。數(shù)據(jù)記錄了荷蘭第4大城市烏德勒支2005年5月~9月共1 853件事件數(shù)據(jù),其中完備數(shù)據(jù)為1 016條,事件所包含的具體信息見(jiàn)表1。
表1 交通事件影響因素及變量取值
對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析發(fā)現(xiàn),交通事件持續(xù)時(shí)間分布在[0,435] min內(nèi),分布范圍較廣,但76%的樣本中事件持續(xù)時(shí)間集中在120 min以內(nèi)。為了進(jìn)行合理有效的預(yù)測(cè),對(duì)持續(xù)時(shí)間在120 min內(nèi)的事件以10 min為區(qū)間進(jìn)行分類,之外的時(shí)間以20 min為區(qū)間進(jìn)行分類。分類后的交通事件持續(xù)時(shí)間見(jiàn)圖1。
圖1 分類區(qū)間內(nèi)交通事件發(fā)生次數(shù)Fig.1 Frequency chart of classified traffic incident duration
3.2網(wǎng)絡(luò)結(jié)構(gòu)
本文采用MIT評(píng)分函數(shù)對(duì)數(shù)據(jù)集進(jìn)行貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)。結(jié)合S-CAOB算法,借助Matlab平臺(tái)進(jìn)行程序編寫(xiě)與數(shù)據(jù)分析,完成貝葉斯網(wǎng)絡(luò)模型搭建。利用蟻群算法經(jīng)過(guò)反復(fù)迭代后得到最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu),見(jiàn)圖2,對(duì)應(yīng)得分為10 922.54?;谠u(píng)分搜索的方法,是針對(duì)數(shù)據(jù)集進(jìn)行結(jié)構(gòu)學(xué)習(xí),圖中的箭頭并不表示因果聯(lián)系,只能說(shuō)明因素間相互影響。
圖2 全局貝葉斯網(wǎng)絡(luò)圖Fig.2 Global structure of Bayesian network
由圖2可見(jiàn),“事件類型”作為根節(jié)點(diǎn)影響著整個(gè)系統(tǒng)的復(fù)雜程度;“是否需要警察處理”直接或間接的影響的大部分節(jié)點(diǎn),對(duì)于一些較為嚴(yán)重的事件,需要警察進(jìn)行協(xié)調(diào)、處理,警察的參與會(huì)導(dǎo)致處理時(shí)間的延長(zhǎng)。將與“事件持續(xù)時(shí)間(N4)”的無(wú)關(guān)的因素排除掉,得到結(jié)構(gòu)見(jiàn)圖3。
圖3 局部貝葉斯網(wǎng)絡(luò)圖Fig.3 Partial structure of Bayesian network
“車(chē)輛類型(N2)”、“是否需要警察處理(N3)”直接影響著時(shí)間持續(xù)時(shí)間;“事件類型(N1)”作為影響“事件持續(xù)時(shí)間”父節(jié)點(diǎn)的因素間接影響著事件持續(xù)時(shí)間。其他因素可能對(duì)“事件持續(xù)時(shí)間”有著直接或間接的影響,但是在最優(yōu)網(wǎng)絡(luò)圖上不夠顯著,因此為了便于直觀分析予以排除。根據(jù)得到的網(wǎng)絡(luò)結(jié)構(gòu),給出交通事件持續(xù)時(shí)間參數(shù)學(xué)習(xí)結(jié)果(P),見(jiàn)表2。
3.3概率預(yù)測(cè)
在交通事件響應(yīng)過(guò)程中,已知部分或全部事件屬性,可以推斷交通事件持續(xù)時(shí)間的分布概率,同時(shí)結(jié)合樣本數(shù)據(jù),可評(píng)價(jià)貝葉斯網(wǎng)絡(luò)的預(yù)測(cè)精度。由于節(jié)點(diǎn)屬性較多,只給出部分屬性下的概率預(yù)測(cè)圖。
在不完全信息下,即能夠觀測(cè)1個(gè)或2個(gè)節(jié)點(diǎn)屬性時(shí),概率預(yù)測(cè)圖見(jiàn)圖4、圖5。圖3表明,在僅知道事件類型的情況下,不需要考慮其他因素,
即可對(duì)事件持續(xù)時(shí)間可能的分布概率進(jìn)行快速的初步判斷,并制定前期的應(yīng)對(duì)方案,之后可再根據(jù)事件處理過(guò)程中不斷反饋的其他信息進(jìn)一步縮小持續(xù)時(shí)間的預(yù)測(cè)范圍,或者調(diào)整可能持續(xù)時(shí)間的發(fā)生概率。
圖4 事件類型為“拋錨”概率預(yù)測(cè)圖Fig.4 Forecasting probability of "vehicle anchoring"
圖5 事件類型為“拋錨”“不需要警察處理”概率預(yù)測(cè)圖Fig.5 Forecasting probability of "vehicle anchoring""no police force"
在完全信息下,即能夠觀測(cè)全部節(jié)點(diǎn)屬性時(shí),預(yù)測(cè)概率與實(shí)際觀測(cè)概率對(duì)比情況,如圖6所示,預(yù)測(cè)后驗(yàn)概率仍然能夠較好的描述實(shí)際觀測(cè)概率。
圖6 事件類型為“碰撞”“車(chē)輛類型小汽車(chē)”“不需要警察處理”概率預(yù)測(cè)圖Fig.6 Forecasting probability of "crash""car" "no police force"
3.4研究對(duì)比
由于荷蘭交通數(shù)據(jù)數(shù)據(jù)記錄較為全面,很多學(xué)者采用不同的方法利用該數(shù)據(jù)進(jìn)行研究。Wen等[11]構(gòu)建了KNN模型,對(duì)于墜物、拋錨、事故三種事件類型的事件,預(yù)測(cè)誤差小于15 min的比例分別為75.66%,67.25%,84.94%,但K值變化對(duì)預(yù)測(cè)精度影響較大,同時(shí)事件各屬性的權(quán)重計(jì)算方法不合理,僅適用于二值變量。Wu等[12]構(gòu)建了SVR模型,對(duì)于3種事件類型的預(yù)測(cè)誤差小于15 min的比例分別為76.92%,68.82%,71.01%,但對(duì)于持續(xù)時(shí)間超過(guò)1 h的事件,拋錨和事故的預(yù)測(cè)誤差小于15 min的比例分別只有33.33%和8.33%。說(shuō)明SVR模型對(duì)于這類事件沒(méi)有解釋力。Ji等[13]構(gòu)建貝葉斯決策樹(shù)模型,3種事件類型的平均預(yù)測(cè)精度為73.57%,但決策樹(shù)方法以節(jié)點(diǎn)間相互獨(dú)立為前提條件,但實(shí)際情況下各種因素是相互影響的,故模型不能完全描述事件真實(shí)情況。
相比而言,貝葉斯網(wǎng)絡(luò)模型能夠直觀的展現(xiàn)出變量之間的結(jié)構(gòu)化關(guān)系,將事件屬性對(duì)持續(xù)時(shí)間影響的內(nèi)部機(jī)理揭示的更為透徹;能夠準(zhǔn)確的描述小概率事件,甚至通過(guò)參數(shù)學(xué)對(duì)部分未觀測(cè)到的事件類型做出預(yù)測(cè)。本文構(gòu)建的貝葉斯網(wǎng)絡(luò)模型,總體預(yù)測(cè)精度達(dá)到87.82%。在數(shù)據(jù)完備情況下,需要描述的特征較多,模型預(yù)測(cè)精度相對(duì)較低為76.97%;在數(shù)據(jù)缺失的情況下,模型需要描述的特征較少,能夠達(dá)到93.23%,認(rèn)為模型能夠描述現(xiàn)實(shí)情況。
圖7 概率分布圖Fig.7 Probability distributions
4結(jié)束語(yǔ)
筆者構(gòu)建了以S-ACOB為核心的貝葉斯網(wǎng)絡(luò)模型,并基于烏德勒支1 853條事件數(shù)據(jù)對(duì)該模型進(jìn)行測(cè)試,篩選出“事件類型、車(chē)輛類型、是否需要警察處理”3項(xiàng)顯著因素,對(duì)持續(xù)時(shí)間概率分布特征進(jìn)行描述,模型平均預(yù)測(cè)精度達(dá)87.82%,證明該模型的可靠性及適用性,由此可見(jiàn):
1) 貝葉斯網(wǎng)絡(luò)在處理不完備數(shù)據(jù)集時(shí)的有效性,在減少觀測(cè)樣本的屬性節(jié)點(diǎn)后,模型的預(yù)測(cè)精度沒(méi)有受到影響,依然能夠準(zhǔn)確的描述持續(xù)時(shí)間分布特征。因此,本文所建模型能夠通過(guò)較少的屬性信息對(duì)事件進(jìn)行快速反應(yīng),降低次生損失。
2) 貝葉斯網(wǎng)絡(luò)基于實(shí)際觀測(cè)數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)庫(kù)越豐富,對(duì)持續(xù)時(shí)間概率分布的描述越準(zhǔn)確。同時(shí),對(duì)于現(xiàn)實(shí)情況下未觀測(cè)到的交通事件,通過(guò)貝葉斯網(wǎng)絡(luò)模型也能對(duì)其持續(xù)時(shí)間分布概率進(jìn)行預(yù)測(cè)。
3) 通過(guò)S-ACOB算法搜索最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu),其分布式并行計(jì)算大大提高了計(jì)算效率,證明了蟻群算法在解決貝葉斯網(wǎng)絡(luò)最優(yōu)結(jié)構(gòu)搜索問(wèn)題上是有效的。
4) 貝葉斯網(wǎng)絡(luò)在描述總體分布時(shí)具有明顯優(yōu)勢(shì),而在預(yù)測(cè)總體分布下確定個(gè)體的延誤時(shí)間將是本研究的發(fā)展方向。
參考文獻(xiàn)
[1]GOLOB F T, RECKER W, LEONARD D J. An analysis of the severity and incident duration of truck-Involved freeway accidents [J]. Accident Analysis and Prevention, 1987, 19(4):375-395.
[2]SULLIVAN C E. New model for prediction incidents and incident delay [J]. Transportation Engineering, 1997, 123(4):267-275.
[3]OZBAY, KAAN, KACHROO P. Incident management in intelligent transportation systems [M]. Boston, MA: Artech House, 1999.
[4]CAMPOS de LUIS M. A scoring function for learning bayesian networks based on mutual information and conditional independence Tests [J]. Journal of Machine Learning Research, 2006(7):2149-2187.
[5]潘吉斯,呂 強(qiáng),王紅玲. 一種并行蟻群Bayesian網(wǎng)絡(luò)學(xué)習(xí)的算法[J].小型微型計(jì)算機(jī)系統(tǒng),2007:28(4):651-655.
PAN Jisi, LYU Qiang, WANG Hongling. One kind of parallel algorithm of ant colony optimization to learn bayesian network[J]. Journal of Chinese Computer Systems, 2007:28(4):651-655.(in Chinese)
[6]ZHONG Jijun, ZHANG Hongxun, HU Renbing, et al. A Bayesian network learning algorithm based on independence test and ant colony optimization[J]. Acta Automatica Sinica, 2009,35(3):281-288.
[7]DEMIROLUK S, OZBAY KAAN. Adaptive learning in bayesian networks for incident duration prediction [J]. Transportation Research Record: Journal of the Transportation Research Board, 2014, 2460:77-85.
[8]李大韋,程 琳. 交通事件持續(xù)時(shí)間預(yù)測(cè)貝葉斯網(wǎng)絡(luò)方法研究[J]. 武漢理工大學(xué)學(xué)報(bào):交通科學(xué)與工程版,2011,35(5):884-887.
LI Dawei, CHENG Lin. Traffic incident duration prediction: A Bayesian network method [J].Journal of Wuhan University of Technology:Transportation Science & Engineering Edition, 2011, 35(5):884-887. (in Chinese)
[9]張良力,祝 賀,馬天宇.基于貝葉斯網(wǎng)絡(luò)的機(jī)動(dòng)車(chē)駕駛行為狀態(tài)分析建模[J].交通信息與安全,2014,32(5):77-82.
ZHANG Liangli, ZHU He, MA Tianyu. Model for vehicle drivers behavior analysis based on bayesian network [J]. Journal of Transpor Information and Safety, 2014, 32(5): 77-82 (in Chinese)
[10]楊 超,汪 超. 快速路交通事件持續(xù)時(shí)間預(yù)測(cè)模型[J].同濟(jì)大學(xué)學(xué)報(bào):自然科學(xué)版,2013,41(7):1015-1019.
YANG Chao, WANG Chao. Traffic incident duration forecast model of expressway [J]. Journal of Tongji University:Natural Science Edition, 2013, 41(7):1015-1019.(in Chinese)
[11]WEN Yuan, CHEN Shuyuan. Traffic incident duration prediction based on K-nearest neighbor[J]. Applied Mechanics and Materials Journal Impact Factor & Information, 2013(253/255):1675-1681.
[12]WU Weiwei, CHEN Shuyan. Traffic incident duration prediction based on support vector regression[J]. American Society of Civil Engineers, 2011,421:2412-2421.
[13]JI Yangbeibei, ZHANG Xiaoning, SUN Lijun. Traffic incident duration prediction based on the bayesian decision tree method[C]. 56thTransportation and Development Innovative Best Practices, New York, USA: TDIBP, 2008.
[14]鄭長(zhǎng)江,葛升陽(yáng),鄭樹(shù)康. 基于貝葉斯網(wǎng)絡(luò)的交通事件持續(xù)時(shí)間預(yù)測(cè)[J]. 華東交通大學(xué)學(xué)報(bào),2014,31(5):50-55.
ZHENG Changjiang, GE Shengyang, ZHENG Shukang. Traffic incident duration prediction based on bayesian network[J]. Journal of East China Jiaotong University, 2014, 31(5):50-55.(in Chinese)
[15]段海濱.蟻群算法原理及其應(yīng)用[M]. 北京:科學(xué)出版社,2005.
DUAN Haibin. Ant colony algorithms: Theory and applications [M]. Beijing: Science Press, 2005 (in Chinese)
[16]高曉光,趙歡歡. 基于蟻群優(yōu)化的貝葉斯網(wǎng)絡(luò)學(xué)習(xí)[J]. 系統(tǒng)工程與電子技術(shù), 2010,32(7):1509-1512].
GAO Xiaoguang, ZHAO Huanhuan. Bayesian network learning on algorithm based on ant colony optimization [J]. Systems Engineering and Electronics, 2010, 32(7):1509-1512.(in Chinese)
Bayesian Network Model for the Prediction of
Traffic Incident Duration
MA Xuejing1SHAO Chunfu1▲QIAN Jianpei1WANG Tianyi2
(1.SchoolofTransportationComplexSystemsTheoryandTechnology,
BeijingJiaotongUniversity,Beijing100044,China;
2.NantongHenglongInformationEngineeringConsultants,Ltd.,Nantong22600,Jiangsu,China)
Abstract:Traffic incident is one of the main factors that lead to traffic congestions. Through controlling methods such as real-time traffic guidance, its impacts on traffic operation can be reduced. Accurately prediction of traffic congestion duration is a prerequisite for effective traffic control. Based on MIT scoring functions, an S-ACOB algorithm as the core of the Bayesian network model is developed. The networks are generated from top to bottom with an ant colony algorithm searching for the optimal network structure. To increase the robustness of the proposed Bayesian network, a random selection mechanism for the nodes and a partial probabilistic selection model for the local structure are introduced. Through an empirical study and comparative analyses, the average precision is up to 87.82%, which is superior to the alternatives reported in the previous research. regarding those nods with the complete and incomplete node properties, the accuracy of the network prediction model is up to 76.97% and 93.23%. The results show that this model can effectively predict the duration of traffic congestions.
Key words:traffic engineering; traffic incident; duration prediction; Bayesian network; structure learning; MIT algorithm; S-ACOB algorithm
通信作者:▲邵春福(1957-),博士,教授. 研究方向:道路交通安全. E-mail:cfshao@bjtu.edu.cn
作者簡(jiǎn)介:第一馬雪婧(1990-),碩士研究生. 研究方向:交通安全. E-mail:13120880@bjtu.edu.cn
基金項(xiàng)目*國(guó)家自然科學(xué)(批準(zhǔn)號(hào):71210001)資助
收稿日期:2015-10-12修回日期:2015-11-19
中圖分類號(hào):U491.31
文獻(xiàn)標(biāo)志碼:A
doi:10.3963/j.issn 1674-4861.2015.06.010