龔大鵬,侯 佳,程曉明
(南京市城市與交通規(guī)劃設(shè)計(jì)研究院股份有限公司,江蘇 南京 210000)
隨著城市交通的發(fā)展及交通管理現(xiàn)代化水平的不斷提升,交通管理行業(yè)產(chǎn)生了包括監(jiān)控視頻數(shù)據(jù)在內(nèi)的海量大數(shù)據(jù),而這些交通管理大數(shù)據(jù)的應(yīng)用還不夠充分,使用還不夠全面[1-2]。交叉口監(jiān)控視頻能夠獲取道路運(yùn)行車輛的多種參數(shù)信息,目前主要應(yīng)用于交叉口沖突分析、車流量分析、行人特征及事故判別等方面[3-5],在路網(wǎng)區(qū)域?qū)用娴膽?yīng)用較少。城市居民在出行的過(guò)程中都要面臨出行路徑選擇,因此,在城市擁堵不斷加劇的現(xiàn)狀下,對(duì)路徑選擇模型的研究有著重要的現(xiàn)實(shí)意義。在最短路徑算法方面,國(guó)內(nèi)外經(jīng)典的最短路徑模型如Dijkstra算法、Floyd算法、Bellman-Ford算法、拓?fù)渑判蚍ǖ热栽谑褂肹6-7],之后學(xué)者通過(guò)A*算法、遺傳算法、蟻群算法等啟發(fā)式算法改進(jìn)最短路徑算法[8-11]。路徑選擇模型方面,研究主要?jiǎng)澐譃閮深悾旱谝活愂浅鲂姓邆€(gè)人屬性對(duì)路徑選擇的影響,通過(guò)現(xiàn)場(chǎng)調(diào)查、網(wǎng)絡(luò)問(wèn)卷、隨身攜帶GPS設(shè)備等方式開(kāi)展個(gè)人屬性的調(diào)查[12-14];第二類是路徑方案屬性對(duì)路徑選擇的影響,主要是通過(guò)交通設(shè)施數(shù)據(jù)、交通信息采集設(shè)備數(shù)據(jù)等方式獲取路徑方案屬性[15-17]。本研究將充分利用道路交叉口監(jiān)控視頻獲取車輛出行信息,基于出行路徑方案屬性及駕駛員偏好等信息建立路徑選擇概率模型。
本研究基于公安部文明暢通專家組2020年專題研究項(xiàng)目《基于城市交通多源大數(shù)據(jù)挖掘的出行行為特征分析與仿真建?!?,以泰州萬(wàn)達(dá)片區(qū)為研究實(shí)例,獲取泰州萬(wàn)達(dá)片區(qū)內(nèi)9個(gè)關(guān)鍵交叉口圍合區(qū)域內(nèi)的交叉口監(jiān)控視頻數(shù)據(jù)。獲取的視頻數(shù)據(jù)包括9個(gè)交叉口4個(gè)方向進(jìn)口道和出口道數(shù)據(jù),每天24 h數(shù)據(jù)共7 d。監(jiān)控視頻示例及交叉口點(diǎn)位信息如圖1、圖2所示。
1.2.1 深度學(xué)習(xí)圖像識(shí)別算法
本研究數(shù)據(jù)處理均基于python編程語(yǔ)言實(shí)現(xiàn)?;诮徊婵诒O(jiān)控視頻中的車牌顏色特征、邊緣特征、形態(tài)學(xué)特征使用openCV中的模塊算法在已經(jīng)識(shí)別的車輛圖像里完成車牌的定位,并截取含有車牌的圖像,通過(guò)神經(jīng)網(wǎng)絡(luò)算法及支持向量機(jī)分類器對(duì)所截取的圖像進(jìn)行訓(xùn)練學(xué)習(xí),確定所截取圖像是否為完整車牌,并對(duì)車牌中所有字符進(jìn)行分割,識(shí)別分割后的字符,以此確定車牌號(hào)碼。具體步驟如下:
圖1 交叉口監(jiān)控視頻數(shù)據(jù)示例
圖2 交叉口監(jiān)控視頻采集點(diǎn)位
Step1:基于車牌的顏色、邊緣特征、形態(tài)學(xué)特征使用python-openCV中的模塊算法在已經(jīng)識(shí)別的車輛圖像里完成車牌的定位,并截取含有車牌的圖像。
Step2:制作車牌訓(xùn)練樣本庫(kù)。從網(wǎng)上搜索已有車牌訓(xùn)練樣本庫(kù),并根據(jù)已有視頻截圖加入人工制作樣本庫(kù),包括正樣本、負(fù)樣本。
Step3:通過(guò)深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)算法對(duì)所截取的樣本庫(kù)進(jìn)行訓(xùn)練學(xué)習(xí),確定所截取圖像是否為完整車牌。
Step4:結(jié)合國(guó)內(nèi)車牌漢字、英文、數(shù)字字符特征及透視特征對(duì)識(shí)別到的所有字符進(jìn)行分割。
Step5:制作字符訓(xùn)練樣本庫(kù)。從網(wǎng)上搜索車牌所有字符的訓(xùn)練樣本庫(kù),并根據(jù)已有視頻截圖加入人工制作樣本庫(kù),包括正樣本、負(fù)樣本。
圖3 視頻識(shí)別算法處理過(guò)程
Step6:通過(guò)神經(jīng)網(wǎng)絡(luò)算法及支持向量機(jī)分類器對(duì)所截取的車牌字符進(jìn)行訓(xùn)練學(xué)習(xí),確定所截取字符。
Step7:根據(jù)車牌字符確定車牌號(hào)。
視頻識(shí)別過(guò)程如圖3所示,共識(shí)別到235萬(wàn)余條車牌數(shù)據(jù),識(shí)別后的數(shù)據(jù)示例如表1所示。經(jīng)人工驗(yàn)證,車牌識(shí)別算法對(duì)于本次研究的監(jiān)控視頻數(shù)據(jù)識(shí)別的平均準(zhǔn)確率為90%。
表1 視頻識(shí)別后的車牌數(shù)據(jù)示例
1.2.2 基于車牌的OD提取算法
基于以上視頻識(shí)別后的車牌數(shù)據(jù),以車牌為ID、以路網(wǎng)拓?fù)浣Y(jié)構(gòu)為基礎(chǔ)獲取車輛出行鏈集合;再以時(shí)間為參照,提取出行鏈集合中相鄰數(shù)據(jù)點(diǎn)的行程時(shí)間差t;考慮相鄰數(shù)據(jù)點(diǎn)的車道行駛方向,計(jì)算相鄰點(diǎn)的最短行程距離s;根據(jù)行程時(shí)間差t和最短行程距離s,計(jì)算相鄰數(shù)據(jù)點(diǎn)車輛的行程速度v;之后設(shè)置速度閾值及行程時(shí)間閾值,分離出行鏈;最后基于出行特點(diǎn)對(duì)多個(gè)出行鏈進(jìn)一步篩選,確定最終OD。在車輛出行OD提取算法的過(guò)程中,會(huì)產(chǎn)生車輛路段數(shù)據(jù)、路段行程時(shí)間數(shù)據(jù)、車輛出行鏈數(shù)據(jù)、車輛出行OD數(shù)據(jù),具體數(shù)據(jù)如表2所示。
最后以10 min作為統(tǒng)計(jì)時(shí)間窗,聚合不同OD、不同出行路徑的出行量,如表3所示。其中,9個(gè)交叉口分別用數(shù)字1~9表示9個(gè)交通小區(qū),OD“1_4”表示從起點(diǎn)小區(qū)1至終點(diǎn)小區(qū)4的出行OD,Route字段表示出行路徑。
多元Logit模型作為離散選擇模型之一,選擇行為通常包含以下幾種要素:1)決策者,即做出選擇行為的主體;2)備選方案集,通常會(huì)有多個(gè)備選方案供決策者選擇(如從出發(fā)地1到目的地5的多種路徑;3)方案屬性,包括出行者個(gè)人屬性和備選方案屬性。本研究不考慮出行者的個(gè)人屬性,只考慮方案屬性,如每個(gè)路徑的行程時(shí)間、交叉口數(shù)量、路徑長(zhǎng)度等。這里,每1種因素稱之為1個(gè)屬性。本研究采用效用最大化準(zhǔn)則,即對(duì)于某條出行路徑而言,出行距離、出行時(shí)間越短、出行可靠性越高,該方式的效用就越高。
表2 基于車牌的OD提取算法中間過(guò)程結(jié)果數(shù)據(jù)說(shuō)明
表3 聚合后的車輛出行OD數(shù)據(jù)示例
基于本研究視頻識(shí)別得到的車輛出行軌跡數(shù)據(jù)及已知研究片區(qū)內(nèi)的路網(wǎng)拓?fù)鋽?shù)據(jù),選擇Logit模型的方案屬性為路徑距離、路徑行程時(shí)間、轉(zhuǎn)向次數(shù)、道路等級(jí)。因城市交通流具有明顯的高峰現(xiàn)象,因此,在行程時(shí)間中考慮劃分為高峰(7:00—9:00,17:00—19:00)、平峰(9:00—17:00,19:00—22:00,6:00—7:00)、夜間(22:00—次日6:00)3個(gè)時(shí)段影響因素。如表4所示,對(duì)于OD“1_9”的所有采集樣本數(shù)據(jù),包含134條路徑樣本數(shù)據(jù),分別計(jì)算該路徑在相應(yīng)時(shí)段下的路徑距離、路徑行程時(shí)間、轉(zhuǎn)向次數(shù)、道路等級(jí)指標(biāo),其中,路徑距離為該OD出行經(jīng)過(guò)所有路段長(zhǎng)度的總和,路徑行程時(shí)間為所有路段行程時(shí)間的總和,轉(zhuǎn)向次數(shù)為所有交叉口轉(zhuǎn)向權(quán)重的總和(1次左轉(zhuǎn)權(quán)重為1.5、直行為1.0、右轉(zhuǎn)為0.5),道路等級(jí)為所有路段道路等級(jí)權(quán)重的總和(主干路權(quán)重為12、次干路為5、支路為3)。多元Logit回歸的樣本數(shù)據(jù),對(duì)于其中某個(gè)出行樣本而言,除輸入當(dāng)前樣本路徑的方案屬性以外,還需要把所有其他備選路徑的方案屬性輸入模型作為參考變量。
表4 多元Logit模型的變量準(zhǔn)備數(shù)據(jù)示例
基于研究片區(qū)內(nèi)7 d樣本數(shù)據(jù),使用前6 d的數(shù)據(jù)作為L(zhǎng)ogit模型回歸樣本數(shù)據(jù)集,最后1 d的數(shù)據(jù)作為測(cè)試對(duì)比數(shù)據(jù)集。本研究使用python中pyLogit函數(shù)對(duì)回歸樣本集進(jìn)行Logit回歸,回歸參數(shù)結(jié)果示例如表5所示。每個(gè)OD對(duì)應(yīng)1組回歸函數(shù),具體回歸函數(shù)簡(jiǎn)化形式為
(1)
式中:ODPij為第i個(gè)OD選擇第j條路徑的概率;mi為第i個(gè)OD所有備選路徑集的數(shù)量;θij=[αij,βij,γij,δij]為第i個(gè)OD中第j條路徑的各決策變量的回歸參數(shù)矩陣;Zij=[tij,dij,lij,uij]為第i個(gè)OD中第j條路徑的各決策變量屬性矩陣;t為路徑行程時(shí)間;d為道路等級(jí);l為路徑長(zhǎng)度;u為轉(zhuǎn)向次數(shù)。
表5 多元Logit模型回歸參數(shù)結(jié)果示例
基于上述得到的多元Logit回歸模型,對(duì)測(cè)試數(shù)據(jù)集進(jìn)行結(jié)果驗(yàn)證。預(yù)測(cè)后的路徑選擇概率結(jié)果與實(shí)際路徑選擇的概率進(jìn)行比較,圖4展示預(yù)測(cè)結(jié)果中10對(duì)出行OD下對(duì)應(yīng)的30條路徑選擇概率,圖中縱坐標(biāo)為路徑選擇概率、橫坐標(biāo)為路徑序號(hào)、不同顏色的柱形圖代表真實(shí)值和預(yù)測(cè)值。為了定量描述Logit模型的預(yù)測(cè)精度,提出如式(2)、式(3)所示的均方誤差、平均絕對(duì)誤差表示方法?;诙嘣狶ogit回歸的路徑選擇模型預(yù)測(cè)結(jié)果的均方誤差為1.56%,平均絕對(duì)誤差為6.59%。
(2)
(3)
式中:pp為L(zhǎng)ogit模型預(yù)測(cè)的路徑選擇概率;pa為測(cè)試集中實(shí)際路徑選擇概率;n為測(cè)試集中路徑集合數(shù)量;MSE為均方誤差;MAE為平均絕對(duì)誤差。
圖4 多元Logit回歸路徑選擇概率預(yù)測(cè)結(jié)果與真實(shí)結(jié)果對(duì)比展示示例
由于多元Logit回歸模型需要大量和全樣本的路徑數(shù)據(jù)才能得到完整的路徑選擇概率模型,因此,對(duì)于較小樣本的數(shù)據(jù)可能無(wú)法得到全路徑或某些路徑的選擇概率。灰色關(guān)聯(lián)法仍然劃分為高峰、平峰、夜間3個(gè)時(shí)段,通過(guò)對(duì)出行路徑選擇與路徑屬性的關(guān)聯(lián)度進(jìn)行分析,并加入駕駛員對(duì)路徑方案的偏好影響因素,反映出方案屬性與備選方案集的關(guān)聯(lián)程度,拓展路徑選擇模型的適用性。
基于本研究視頻識(shí)別得到的車輛出行軌跡數(shù)據(jù)及已知研究片區(qū)內(nèi)的路網(wǎng)拓?fù)鋽?shù)據(jù),選擇灰色關(guān)聯(lián)法的決策指標(biāo)為路徑距離、交叉口數(shù)量、道路等級(jí)、車輛轉(zhuǎn)彎次數(shù)、行程時(shí)間、軌跡偏愛(ài)程度。基于歷史軌跡數(shù)據(jù)計(jì)算各軌跡的6項(xiàng)指標(biāo)結(jié)果,把數(shù)據(jù)歸一化之后轉(zhuǎn)換為無(wú)量綱的決策矩陣X,使用熵權(quán)法[18]求得各指標(biāo)權(quán)重。數(shù)據(jù)歸一化后示例如表6所示,熵權(quán)法計(jì)算求得6項(xiàng)指標(biāo)的權(quán)重w分別為[0.160 1, 0.202 4, 0.139 1, 0.213 3, 0.160 8, 0.124 2]。備選路徑集合使用KSP算法基于最短路徑原則計(jì)算得到,本研究的備選路徑集數(shù)量可設(shè)為10。
根據(jù)上述求得的各項(xiàng)決策指標(biāo)的權(quán)重w,結(jié)合各OD對(duì)應(yīng)每條備選路徑的決策指標(biāo)矩陣X,構(gòu)建灰色關(guān)聯(lián)模型所需的加權(quán)標(biāo)準(zhǔn)化決策矩陣Xd,并基于此構(gòu)建差異度矩陣Xwd,使用式(4)求解OD與對(duì)應(yīng)各路徑的關(guān)聯(lián)系數(shù)cr,關(guān)聯(lián)系數(shù)越大則選擇該路徑的概率越大?;谑?5)所述Daniel關(guān)聯(lián)系數(shù)轉(zhuǎn)換決策概率方法[19],把備選路徑集合的關(guān)聯(lián)系數(shù)轉(zhuǎn)換為決策概率,轉(zhuǎn)換后的決策概率數(shù)據(jù)示例如表7所示。
表6 灰色關(guān)聯(lián)法決策指標(biāo)歸一化后數(shù)據(jù)示例
(4)
式中:ρ為決定灰色關(guān)聯(lián)系數(shù)差異度的分辨系數(shù),取值為[0,1],本研究取0.5;i為每組OD下路徑方案?jìng)€(gè)數(shù),本研究備選路徑集個(gè)數(shù)取10;Xwd為差異度矩陣;cr為灰色關(guān)聯(lián)系數(shù)。
(5)
式中:Pj為第j條備選路徑的決策概率;crj,crk為第j,k條備選路徑的相關(guān)系數(shù)。
基于上述得到的灰色關(guān)聯(lián)法路徑選擇概率,對(duì)測(cè)試數(shù)據(jù)集進(jìn)行結(jié)果驗(yàn)證。預(yù)測(cè)后的路徑選擇概率結(jié)果與實(shí)際路徑選擇的概率進(jìn)行比較,如圖5所示,預(yù)測(cè)結(jié)果中展示10對(duì)出行OD下對(duì)應(yīng)的30條路徑選擇概率,圖中縱坐標(biāo)為路徑選擇概率、橫坐標(biāo)為路徑序號(hào)、不同顏色的柱形圖代表真實(shí)值和預(yù)測(cè)值。為了定量描述灰色關(guān)聯(lián)法路徑選擇模型的精度,使用式(2)、式(3)所示均方誤差、平均絕對(duì)誤差表示方法?;诨疑P(guān)聯(lián)法的路徑選擇模型預(yù)測(cè)結(jié)果的均方誤差為5.61%,平均絕對(duì)誤差為11.57%。
表7 灰色關(guān)聯(lián)法備選路徑集決策概率數(shù)據(jù)示例
圖5 灰色關(guān)聯(lián)法路徑選擇概率預(yù)測(cè)結(jié)果與真實(shí)結(jié)果對(duì)比展示示例
本文基于道路交叉口監(jiān)控視頻,通過(guò)深度學(xué)習(xí)圖像識(shí)別相關(guān)算法獲取車輛出行鏈并提取車輛出行軌跡及出行OD。基于出行軌跡數(shù)據(jù)分別使用多元Logit回歸及灰色關(guān)聯(lián)法建立不同時(shí)段下的路徑選擇概率模型,經(jīng)驗(yàn)證,多元Logit模型預(yù)測(cè)結(jié)果的均方誤差和平均絕對(duì)誤差為1.56%、6.59%,灰色關(guān)聯(lián)法模型預(yù)測(cè)結(jié)果的均方誤差和平均絕對(duì)誤差為5.61%、11.57%。其中,多元Logit回歸模型的預(yù)測(cè)誤差低于灰色關(guān)聯(lián)法模型,但灰色關(guān)聯(lián)法模型適用于樣本量較少且預(yù)測(cè)的備選路徑較為全面。未來(lái)研究中可拓展獲取更多出行者個(gè)人屬性信息等決策變量,完善路徑選擇模型。