亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于公交數(shù)據(jù)挖掘的乘客上下站點(diǎn)識別

        2023-12-14 10:09:51張杰唐耀紅袁秋鳳王偉
        貴州大學(xué)學(xué)報(自然科學(xué)版) 2023年6期
        關(guān)鍵詞:城市交通數(shù)據(jù)挖掘

        張杰 唐耀紅 袁秋鳳 王偉

        摘 要:為制定符合客流的線路公交調(diào)度方案,增大公交出行吸引力,減少私家車出行碳排放,有必要提出精確的線路乘客上、下車站點(diǎn)識別方法,獲取精確客流數(shù)據(jù),為公交調(diào)度提供精細(xì)數(shù)據(jù)支撐。本文以福州市常規(guī)公交多源數(shù)據(jù)為基礎(chǔ),針對數(shù)據(jù)缺陷提出系統(tǒng)時間誤差修正及站間缺失數(shù)據(jù)修復(fù)的數(shù)據(jù)預(yù)處理方法。在此基礎(chǔ)上,提出乘客刷卡時間與公交到離站時間匹配的上車站點(diǎn)識別方法。將乘客出行行為按照是否具有出行規(guī)律,提出基于乘客出行規(guī)律的乘客下車站點(diǎn)識別方法及綜合出行距離、換乘能力、出行吸引強(qiáng)度、周圍土地利用性質(zhì)等因素影響下的乘客站點(diǎn)下車概率識別方法。最后,以福州市125路公交數(shù)據(jù)為例,將識別數(shù)據(jù)與實際調(diào)查數(shù)據(jù)對比,驗證識別方法的準(zhǔn)確性。研究結(jié)果可為城市公交客流OD調(diào)查提供數(shù)據(jù)挖掘方法,減少傳統(tǒng)調(diào)查產(chǎn)生的人力物力,以及為公交企業(yè)運(yùn)營調(diào)度提供數(shù)據(jù)支撐。

        關(guān)鍵詞:城市交通;站點(diǎn)識別;出行規(guī)律;數(shù)據(jù)挖掘

        中圖分類號:U121

        文獻(xiàn)標(biāo)志碼:A

        公交乘客上下站點(diǎn)的客流是優(yōu)化公交調(diào)度,提高公交吸引力,進(jìn)而減少私家車碳排放的基礎(chǔ)。近年來,隨著移動端支付的發(fā)展,通過數(shù)據(jù)挖掘獲取的乘客上下站點(diǎn)數(shù)據(jù)比以往人工調(diào)查更為精確省時,但國內(nèi)現(xiàn)有公交系統(tǒng),大多采用“一票制”的收費(fèi)方式,無法直接獲得乘客的下車站點(diǎn),并且公交數(shù)據(jù)多存儲在不同的系統(tǒng)當(dāng)中,直接獲取乘客的上車站點(diǎn)存在精度不夠高的問題。因此,有必要研究更為精確的乘客上下車站點(diǎn)的匹配方法,為公交調(diào)度提供精細(xì)化的數(shù)據(jù)基礎(chǔ)。

        LEE等[1]通過首爾市公交IC卡數(shù)據(jù)及地圖API服務(wù),識別各個站點(diǎn)的上車人數(shù)。EGU等[2]采用相似度度量結(jié)合聚類算法,對具有出行行為相似的客流進(jìn)行識別。TANG等[3]結(jié)合天氣因素,采用梯度提升決策樹法對乘客下車站點(diǎn)進(jìn)行預(yù)測。CHEN等[4]建立了在站點(diǎn)數(shù)據(jù)缺失情況下的聚類模型,用于乘客上車站點(diǎn)的識別。HUANG等[5]通過密度聚類算法和時間校正策略生成公交到站時間,用于匹配乘客刷卡數(shù)據(jù),進(jìn)行上車站點(diǎn)識別。謝振東等[6]以線路平均站間距離與平均行程時間為變量求得刷卡時間閾值,通過最短時間聚類法對乘客的上車站點(diǎn)進(jìn)行識別。鄔群勇等[7]按照工作日和不同出行目的對上車乘客進(jìn)行聚類,并提出不同時空狀態(tài)下的客流熱點(diǎn)站點(diǎn)。秦政[8]通過歷史調(diào)查統(tǒng)計,提出了基于威布爾分布的乘客下車概率模型。左快樂[9]基于OD反推矩陣對乘客下車站點(diǎn)進(jìn)行推算。張文勝等[10]引入時間彈性準(zhǔn)則,結(jié)果表明在時間彈性準(zhǔn)則下識別出的上車人數(shù)要大于聚類分析得到的上車人數(shù)。孫凱等[11]通過結(jié)合乘客出行站點(diǎn)數(shù)量規(guī)律,改進(jìn)站點(diǎn)吸引強(qiáng)度方法對乘客下車站點(diǎn)進(jìn)行識別。

        國內(nèi)外對于乘客上下車站點(diǎn)匹配的研究成果豐富,多從數(shù)據(jù)挖掘入手,利用各類聚類方法展開研究,而在數(shù)據(jù)誤差及從乘客出行規(guī)律方面對乘客上下車站點(diǎn)的研究較少。因此,本文以福州市多源公交數(shù)據(jù)挖掘為基礎(chǔ),根據(jù)多源數(shù)據(jù)上傳特點(diǎn)修復(fù)數(shù)據(jù)誤差,提高數(shù)據(jù)匹配精度;在此基礎(chǔ)上,分析乘客刷卡數(shù)據(jù)的出行規(guī)律,以期提出匹配率更高的乘客上下車站點(diǎn)匹配方法。

        1 公交多源數(shù)據(jù)預(yù)處理

        本文所涉及公交多源數(shù)據(jù)包含3個方面:乘客通過各種支付途徑產(chǎn)生的的公交刷卡數(shù)據(jù),公交GPS數(shù)據(jù),線路信息、站點(diǎn)信息、調(diào)度信息、車輛信息等其他公交數(shù)據(jù)。

        1.1 修正系統(tǒng)時間誤差

        部分城市公交刷卡系統(tǒng)沒有記錄乘客刷卡數(shù)據(jù)上傳站點(diǎn)經(jīng)緯度數(shù)據(jù),無法直接識別上車站點(diǎn),需要結(jié)合公交GPS運(yùn)營數(shù)據(jù)、通過時間匹配補(bǔ)充站點(diǎn)信息。由于數(shù)據(jù)存儲在不同的系統(tǒng)中,導(dǎo)致公交刷卡數(shù)據(jù)采集系統(tǒng)與公交GPS運(yùn)營系統(tǒng)的上傳時間存在誤差。如圖1所示,當(dāng)公交刷卡數(shù)據(jù)上傳時間早于公交GPS時間或晚于公交GPS時間時,二者時間匹配會導(dǎo)致部分刷卡乘客被判定為無效數(shù)據(jù),導(dǎo)致匹配結(jié)果與實際情況誤差增大。因此,要對兩個系統(tǒng)間的時間誤差進(jìn)行修正。

        以公交車輛GPS系統(tǒng)時間作為參照,假設(shè)二者間的誤差為Δt,則

        Δt=TS-TGPS(1)

        式中:TS為乘客刷卡數(shù)據(jù)上傳時間;TGPS為公交GPS到離站數(shù)據(jù)上傳時間。

        因此,經(jīng)過誤差時間修正后的乘客刷卡數(shù)據(jù)上傳時間T′S可以表示成

        T′S=TGPS=TS-Δt(2)

        1.2 修復(fù)站間缺失數(shù)據(jù)

        當(dāng)班次存在站間數(shù)據(jù)缺失時,會導(dǎo)致缺失站點(diǎn)上車乘客其刷卡數(shù)據(jù)無法匹配,需要對缺失站間數(shù)據(jù)進(jìn)行修復(fù),本文僅需對公交站點(diǎn)缺失的到站時間進(jìn)行修復(fù),即可完成多源數(shù)據(jù)的時間匹配。因此,本文采用最大概率模型對缺失站點(diǎn)數(shù)據(jù)修復(fù)。

        1)站間數(shù)據(jù)修復(fù)模型及參數(shù)

        一方面,當(dāng)缺失站點(diǎn)存在乘客乘車刷卡時,通過乘客刷卡數(shù)據(jù)時間與公交GPS到站時間的關(guān)系,對公交車輛到站時間進(jìn)行數(shù)據(jù)修復(fù);另一方面,當(dāng)缺失站點(diǎn)不存在乘客乘車,通過該缺失站點(diǎn)歷史到站數(shù)據(jù),以及該站點(diǎn)歷史到離站數(shù)據(jù)中完整的到離站數(shù)據(jù)建立上一站點(diǎn)到該站點(diǎn)的行程時間合集,構(gòu)建數(shù)學(xué)概率分布模型,對缺失數(shù)據(jù)進(jìn)行修復(fù)。

        假設(shè)集合Ux={Xf1,Xd1,Xd2,Xd3,…,Xdn,Xf2}為某線路某一運(yùn)營班次行駛過程中連續(xù)經(jīng)過的站點(diǎn),其中,Xf1、Xf2為到離站數(shù)據(jù)完整的站點(diǎn),Xd1、Xd2、Xd3等為到離站數(shù)據(jù)缺失的站點(diǎn)。

        假設(shè)在數(shù)據(jù)缺失站點(diǎn)Xd1至Xdn途中,有乘客上車刷卡產(chǎn)生時間序列為TS=ts1,ts2,…,tsn,因僅在公交車到站后才存在刷卡行為,此時把各個數(shù)據(jù)缺失站點(diǎn)首條刷卡記錄時間作為對應(yīng)數(shù)據(jù)缺失站點(diǎn)乘客開始刷卡上車的時間。

        設(shè)乘客所匹配的上車站點(diǎn)是Xdn,公交車到達(dá)該站點(diǎn)時乘客上車產(chǎn)生的刷卡上傳時間依次表示為tks=tks1,tks2,…,tksn,其中sn為站點(diǎn)Xdn的上車人數(shù)。當(dāng)數(shù)據(jù)缺失站點(diǎn)存在乘客刷卡數(shù)據(jù)可以匹配時,Xdn到站時間的推斷即公交車從參照站點(diǎn)Xf1離站行駛至tks1的行程時間內(nèi),抵達(dá)Xdn概率最大的時間節(jié)點(diǎn)。

        設(shè)任意兩站點(diǎn)Xa、Xb間行程時間分布用概率分布Pa,b(t|θ)來表示。已知Xf1、tks1,借助歷史公交GPS到離站數(shù)據(jù),推斷最佳Xdn到站時間的過程即以下極大值的推斷過程:

        X^dn=arg maxXdnPXf1,Xdn(t|θ,t=tks1)(3)

        式中:X^dn為車輛從Xf1離站至tks1行程時間內(nèi),PXf1,Xdn(t|θ)取極大值時對應(yīng)的到站時間;θ為后驗條件參數(shù)集合。

        當(dāng)數(shù)據(jù)缺失站點(diǎn)不存在乘客刷卡數(shù)據(jù)時,根據(jù)歷史車輛到離站數(shù)據(jù),采用車輛從參照站點(diǎn)Xf1出站到Xdn的行程時間TXf1,Xdn進(jìn)行推斷,可表示為

        T^Xf1,Xdn=arg maxTXf1,XdnPXf1,Xdn(t|θ)(4)

        對于公式(3)、(4),應(yīng)用以下后驗條件:

        (1)θ1=。此時PXf1,Xdn(t)為從Xf1至Xdn的歷史行程時間概率分布;

        (2)θ2=tf1±Δt。其中,tf1為站點(diǎn)Xf1的離站時間點(diǎn),ΔT為行程時間閾值,PXf1,Xdn(t|tf1±ΔT)表示時刻tf1±ΔT時,從參照站點(diǎn)Xf1至數(shù)據(jù)缺失站點(diǎn)Xdn行程時間的條件概率分布,根據(jù)福州市站點(diǎn)布設(shè)距離,本文設(shè)定ΔT=600 s;

        (3)θ3=ttra±30 s,其中ttra為車輛從參照站點(diǎn)Xf1出站到tks1的行程時間,PXf1,Xdn(t|ttra±30)表示行程時間為ttra±30 s時,從參照站點(diǎn)Xf1至數(shù)據(jù)缺失站點(diǎn)Xdn行程時間的條件概率分布。

        從Xf1到Xdn符合條件(1)到條件(3)的行程時間合集通過該線路運(yùn)營車輛歷史公交GPS到離站數(shù)據(jù)獲得。對于行程時間集合,為減小模型計算量,采用高斯分布函數(shù)擬合。

        P(t)=12πδexp(-(t-μ)22δ2)(5)

        2)模型總體流程

        Step1 選取某一線路,將該線路運(yùn)營班次按照時間順序排序,對所有車次的車輛到離站數(shù)據(jù)按站點(diǎn)順序進(jìn)行整理;

        Step2 將每一班次的到離站站點(diǎn)數(shù)與該線路的站點(diǎn)列表進(jìn)行比較,若不存在站間到離站數(shù)據(jù)缺失,無需修復(fù);

        Step3 若存在站間到離站數(shù)據(jù)缺失,確定存在數(shù)據(jù)缺失的區(qū)間,以其前一個數(shù)據(jù)完整的站點(diǎn)作為參照點(diǎn),從歷史數(shù)據(jù)中獲取參照點(diǎn)到缺失站點(diǎn)的行程時間,建立行程時間分布模型;

        Step4 若該區(qū)間有乘客刷卡記錄,將刷卡記錄以時間排序,以第1個刷卡乘客的刷卡時間為準(zhǔn),根據(jù)步驟3的方法判斷車輛從參照點(diǎn)離站時間至缺失站點(diǎn)第1位乘客刷卡時間為行程時間內(nèi)概率最大的到達(dá)時間作為修復(fù)時間并記錄;

        Step5 若該區(qū)間內(nèi)沒有乘客刷卡記錄,對數(shù)據(jù)缺失站點(diǎn)構(gòu)建以參照站點(diǎn)到該缺失站點(diǎn)行程時間為條件的行程時間概率分布模型,求解模型概率極大值的時間值,作為車輛從參考點(diǎn)至該缺失站點(diǎn)的行程時間。

        2 基于公交多源數(shù)據(jù)的乘客上下車站點(diǎn)識別方法

        2.1 上車站點(diǎn)識別方法

        乘客上車站點(diǎn)的識別原理如圖2所示,在完成數(shù)據(jù)預(yù)處理后,結(jié)合車輛編號與發(fā)車時刻表等數(shù)據(jù)進(jìn)行識別,其步驟如下:

        Step1 根據(jù)線路號篩選出所需研究線路的多源數(shù)據(jù),按時間進(jìn)行排列。

        Step2 提取排序在最前的運(yùn)營班次信息,并篩選出對應(yīng)時間節(jié)點(diǎn)的公交刷卡數(shù)據(jù)及該班次的各站點(diǎn)到離站時間。

        Step3 設(shè)TS為乘客刷卡數(shù)據(jù)上傳時間,TA為公交車輛到達(dá)站點(diǎn)時間,TV為車輛到達(dá)相鄰下一站點(diǎn)時間,當(dāng)前班次總的刷卡數(shù)據(jù)條數(shù)為N,N={1,2,…,N},所選取線路的站點(diǎn)總數(shù)量為I,I={1,2,…,I},則刷卡數(shù)據(jù)對應(yīng)的刷卡站點(diǎn)為Sun,在站點(diǎn)i上車的乘客表示為Sui,當(dāng)TAi<Tn<TVi時,認(rèn)為該乘客Sui位于該站點(diǎn)Sun。

        Step4 當(dāng)一個班次的所有站點(diǎn)均遍歷完成時,結(jié)束計算,統(tǒng)計各刷卡數(shù)據(jù)的匹配結(jié)果并記錄,跳轉(zhuǎn)至Step2繼續(xù)下一班次的計算,直至所有班次的數(shù)據(jù)計算完畢。

        2.2 基于出行規(guī)律的乘客下車站點(diǎn)識別方法

        2.2.1 乘客公交出行規(guī)律分析

        在工作日,選擇公交出行的乘客往往具有一定的出行規(guī)律。例如,選擇公交出行前往校園、工作地、市場的學(xué)生、工作人員、老人,在返程時多數(shù)時候也會選擇乘坐公交車輛返回,將這類人群全天公交出行軌跡相連接,會形成一個閉合的出行鏈?zhǔn)叫螒B(tài),如圖3。部分乘客在乘坐公交后,選擇其他方式出行,將這類人群全天公交出行軌跡相連,則無法形成閉合的鏈?zhǔn)叫螒B(tài),如圖4所示。

        當(dāng)一位乘客具備乘車出行規(guī)律時,可通過該乘客多次出行數(shù)據(jù),判斷其在所研究線路班次的下車站點(diǎn)。如圖5所示,乘客乘坐某線路從起點(diǎn)出發(fā),A、B、C、D為該線路的后續(xù)站點(diǎn),C′為與C相對應(yīng)的該線路返程站點(diǎn),N、M為其他線路的站前往下一目的地點(diǎn)。

        1)當(dāng)乘客的第2次公交出行刷卡上車站點(diǎn)為A站點(diǎn),推測這名乘客是在同一個站點(diǎn)進(jìn)行換乘的。

        2)當(dāng)乘客的第2次公交出行刷卡上車站點(diǎn)為N站點(diǎn)時,該乘客的出行行為屬于異站換乘,許多學(xué)者[12-13]研究將換乘距離的閾值設(shè)置為500 m。綜合福州市公交站點(diǎn)覆蓋率,本文將換乘距離的閾值設(shè)置為500 m,當(dāng)站點(diǎn)間距為500米范圍內(nèi)時,將乘客的出行行為定義為異站換乘,當(dāng)站點(diǎn)間距大于500 m時,認(rèn)為乘客的出行屬于圖3~4的斷開出行鏈現(xiàn)象。

        3)當(dāng)乘客的第2次公交出行在C′站上車時,由于C′為與C相對應(yīng)的返程站點(diǎn),且乘客在公交線路選擇時有較強(qiáng)的往返規(guī)律,故將乘客這種出行行為定義為往返式公交出行,選擇C′站點(diǎn)所對應(yīng)的C站點(diǎn)為乘客前一次乘車的下車站點(diǎn)。

        根據(jù)上述分析,定義連續(xù)公交出行為乘客當(dāng)日前后兩次乘車的空間間隔滿足500 m換乘距離內(nèi)時的公交出行,如圖6。定義往返出行為乘客前后兩次出行的乘車點(diǎn)為該次出行目的的起終點(diǎn),如圖7。

        2.2.2 基于出行規(guī)律的乘客下車站點(diǎn)識別方法假設(shè)

        假設(shè)條件1:根據(jù)連續(xù)公交出行規(guī)律,乘客相鄰兩次乘車記錄中,前一回乘車的下車站點(diǎn)是后一回乘車上車站點(diǎn)或位于其換乘距離閾值內(nèi)最近的站點(diǎn);

        假設(shè)條件2:根據(jù)往返出行規(guī)律,乘客一日內(nèi)第1回出行的上車站點(diǎn)為乘客末回出行的下車站點(diǎn)或位于其下車站點(diǎn)在換乘距離閾值內(nèi)最近的站點(diǎn);

        假設(shè)條件3:根據(jù)往返出行規(guī)律,乘客前后兩回出行選擇同一條線路,并且上下行相反,則兩次乘車站點(diǎn)互為上下站點(diǎn);

        假設(shè)條件4:考慮到有出行規(guī)律的乘客存在偶然出行行為,因此,當(dāng)乘客不具備出行規(guī)律時,提取乘客本周其他工作日刷卡數(shù)據(jù)進(jìn)行識別,當(dāng)有不少于2個工作日乘車記錄中存在與研究日乘坐相同線路、運(yùn)行方向、站點(diǎn)的乘車記錄,其下車站點(diǎn)均能采用出行規(guī)律假設(shè)進(jìn)行識別并且識別得出的下車站點(diǎn)一致時,判定其本次乘車的下車站點(diǎn)與符合條件的往日下車站點(diǎn)一致。

        2.2.3 基于出行規(guī)律的乘客下車站點(diǎn)識別方法

        以乘客在公交站點(diǎn)X選擇q線路下行方向的車輛乘坐的出行進(jìn)行說明,定義以下集合:

        集合U1={x+1,x+2,…,n}表示乘客在公交X站點(diǎn)選擇乘坐q線路下行方向的車輛,q線路所有站點(diǎn)中位于X站點(diǎn)之后的其他站點(diǎn)集合;

        將集合U2定義為集合U1內(nèi)站點(diǎn)500 m范圍內(nèi)的周邊公交站點(diǎn)集合。

        設(shè)乘客在本次公交出行后,下一回公交出行的上車站點(diǎn)為O,求解乘客在q線路后續(xù)站點(diǎn)y的下車概率,可得:

        1)若站點(diǎn)O∈U1,說明乘客后一回乘車的站點(diǎn)處在X站點(diǎn)的后續(xù)站點(diǎn)集合內(nèi),這符合乘客公交出行的連續(xù)公交出行規(guī)律,在站點(diǎn)y的下車概率為

        Py=1,O=y0,O≠y (6)

        2)若站點(diǎn)O∈U2,說明乘客后一回乘車的站點(diǎn)處在X站點(diǎn)的后續(xù)各個站點(diǎn)的500 m范圍內(nèi)其他可乘坐站點(diǎn)集合內(nèi),設(shè)距離y站點(diǎn)附近的站點(diǎn)為y′。由前文分析可知,乘客在該集合內(nèi)的站點(diǎn)上車符合乘客公交出行的連續(xù)公交出行規(guī)律。在站點(diǎn)y的下車概率為

        Py=1,O=y′0,O≠y′ (7)

        3)若站點(diǎn)O不在集合U1和U2中時,根據(jù)假設(shè)條件4,提取乘客該周工作日除研究日外其余天數(shù)內(nèi)存在乘客選擇q路公交在站點(diǎn)X乘坐同一方向車輛的乘車記錄,當(dāng)日乘客在本次乘坐公交后相鄰下一次乘坐公交的上車站點(diǎn)O′屬于集合U1或集合U2并且下車站點(diǎn)一致,當(dāng)符合這種情況的其余工作日天數(shù)不少于2 d時,判定本次乘車的下車站點(diǎn)與符合條件的往日下車站點(diǎn)一致,在站點(diǎn)y的下車概率為

        Py=1,O′=y或y′0,O′≠y或y′ (8)

        2.3 基于站點(diǎn)下車概率的乘客下車站點(diǎn)識別方法

        對于偶然出行、單程出行等情況的乘客,出行目的決定了這次出行的下車站點(diǎn),當(dāng)站點(diǎn)包含更多吸引乘客下車因素時,乘客在這個站點(diǎn)下車概率越大。因此,從各個站點(diǎn)下車概率角度,對乘客下車站點(diǎn)識別進(jìn)行補(bǔ)充。

        用一趟公交運(yùn)行班次對計算方法進(jìn)行說明。設(shè)研究線路一趟公交途經(jīng)I個站點(diǎn),各個站點(diǎn)i上車人數(shù)為Ai(i=1,2,…,I)。設(shè)Pab是出行人員位于a站上車到b站下車的概率(a=1,2,…,I-1;b=2,3,…,I;且a<b)。設(shè)Di是出行人員位于第i站的下車人數(shù)。

        在首站,無人下車:

        D1=0(9)

        當(dāng)車輛行駛至第2站停車,在首站上車人員有一定概率會在本站下車:

        D2=A1×P12(10)

        以此類推,當(dāng)車輛行駛到末站停車,表達(dá)式為

        DI=A1×P1I+A2×P2I+…+AI-1×PI-1I(11)

        綜上,針對隨機(jī)站點(diǎn)i,Di可以表示成

        Di=∑i-1a=1(Aa×Pai)(12)

        假設(shè)選擇乘坐公交的乘客位于任意a站點(diǎn)乘車前往b站點(diǎn)的概率是Pab,其受到出行距離影響的下車概率是Qab、受到b站點(diǎn)換乘能力吸引的下車概率是Fb、受到b站點(diǎn)出行強(qiáng)度吸引的下車概率是Wb、受到b站點(diǎn)土地利用性質(zhì)吸引的下車概率是Rb,這些因素綜合影響乘客在b站點(diǎn)的下車概率,Pab可表示為

        Pab=Qab×Fb×Wb×Rb∑nk=1+aQak×Fk×Wk×Rk(13)

        將Pab歸一化,代入未匹配上車乘客數(shù),可計算每站下車人數(shù)。

        1)出行距離影響

        有學(xué)者[14]研究得出乘坐公交出行的人群在出行距離上近似泊松分布。為便于計算,將居民出行距離以乘坐站點(diǎn)數(shù)量的方式轉(zhuǎn)換,設(shè)Qab為在出行距離影響下選擇乘坐公交的乘客從a站點(diǎn)上車前往b站點(diǎn)下車的概率,λ為研究線路乘坐公交車的乘客人均乘坐站點(diǎn)數(shù),當(dāng)人均乘坐站點(diǎn)數(shù)大于在a站點(diǎn)之后的站點(diǎn)數(shù)量的情況下,采用λ=I-a來計算每站的下車概率:

        Qab=e-λλ(b-a)(b-a)?。?4)

        2)站點(diǎn)換乘能力影響

        對于需要換乘的乘客,站點(diǎn)可換乘線路數(shù)量越多,滿足其換乘需求可能性就越高。同時,在換乘閾值內(nèi)的異站換乘也需要考慮。設(shè)Li表示第i站及其500 m范圍內(nèi)其他站點(diǎn)可供出行人員換乘線路總數(shù),F(xiàn)i表示第i站換乘系數(shù):

        Fi=Li∑Ii=1Li(15)

        3)站點(diǎn)出行吸引強(qiáng)度影響

        全天候出行人員的公交出行規(guī)律呈現(xiàn)明顯往返性,站點(diǎn)發(fā)生量越大,其吸引量也越大。設(shè)每站上車人數(shù)所對應(yīng)吸引強(qiáng)度為Wi,有

        Wi=Ai∑Ii=1Ai(16)

        式中:Ai表示第i站上車人數(shù)。

        4)站點(diǎn)周圍土地利用性質(zhì)影響

        當(dāng)一個站點(diǎn)附近為住宅用地時,一天出行結(jié)束后返程時間段在該站點(diǎn)下車的幾率會增加。同理,工廠、政府辦公區(qū)域、學(xué)校等土地利用性質(zhì)會影響不同出行目的人群下車站點(diǎn)選擇。設(shè)i站點(diǎn)以500 m為半徑區(qū)域里有H種土地利用性質(zhì),用Gih作為i站點(diǎn)第h種土地利用性質(zhì)面積比,gh表示相對應(yīng)吸引系數(shù),Ri表示第i站土地利用性質(zhì)影響強(qiáng)度值,得

        Ri=∑Hh=1Gih×gh,h=1,2,3,…,H (17)

        本文結(jié)合其他學(xué)者[15-16]的研究,將線路土地利用現(xiàn)狀分為6類,設(shè)住宅用地吸引強(qiáng)度為1,對比確定其他分類的吸引強(qiáng)度如表1所示。

        3 實例分析

        選取福州市125公交線路晚高峰(17:00—19:00)上行方向各站點(diǎn)上、下車客流進(jìn)行跟車調(diào)查,統(tǒng)計各站點(diǎn)的上下客人數(shù),與識別人數(shù)進(jìn)行對比。根據(jù)跟車調(diào)查,125路公交的乘客投幣人數(shù)與免費(fèi)人數(shù)約占20%,考慮推算過程中的部分客流損失,將識別得到的客流量以1.3倍進(jìn)行擴(kuò)樣對比。

        3.1 上車站點(diǎn)匹配結(jié)果

        為驗證站間缺失數(shù)據(jù)修正的準(zhǔn)確性,選取福州市41公交線路3月13日至17日的100個到離站數(shù)據(jù)完整、工作日班次已經(jīng)過誤差時間修正的公交GPS數(shù)據(jù)及對應(yīng)的公交刷卡數(shù)據(jù),其中一半班次為7點(diǎn)至9點(diǎn)、17點(diǎn)至19點(diǎn)的高峰時期,另一半為隨機(jī)平峰時段。每個班次任取一站有乘客上車的到離站數(shù)據(jù)清空,一站無乘客上車的數(shù)據(jù)清空,共計200條待修復(fù)到離站數(shù)據(jù)。以一周內(nèi)工作日其余班次數(shù)據(jù)作為歷史數(shù)據(jù)集合,根據(jù)模型對到離站數(shù)據(jù)進(jìn)行修復(fù),并與刪除的原到站時間進(jìn)行對比,結(jié)果如表2所示。

        從表2可以看出,當(dāng)缺失站點(diǎn)有乘客刷卡上車時,在任何情況下模型計算結(jié)果誤差均在3 s左右;當(dāng)缺失站點(diǎn)沒有乘客時,模型計算結(jié)果誤差增大,高峰時段的誤差值最大,造成這種計算結(jié)果的原因是高峰時段路況不佳,交通延誤較大,行程時間波動較大。由于站間數(shù)據(jù)缺失修復(fù)是為了客流特征挖掘服務(wù),針對的是有乘客刷卡上車時乘客上車站點(diǎn)的識別,因此在有乘客刷卡條件下的模型修復(fù)計算結(jié)果誤差均較小,計算結(jié)果用于公交刷卡數(shù)據(jù)與公交GPS數(shù)據(jù)的數(shù)據(jù)融合是可行的。

        如圖8所示,將未經(jīng)處理的數(shù)據(jù)直接采用上車站點(diǎn)識別方法進(jìn)行時間匹配,匹配成功3 953次,在通過刷卡數(shù)據(jù)與公交GPS到離站數(shù)據(jù)相差+7 s的系統(tǒng)誤差修正及站間數(shù)據(jù)修復(fù)后,匹配成功4 436次,匹配成功率較未經(jīng)處理的匹配人數(shù)提高了12.22%。

        3.2 下車站點(diǎn)匹配結(jié)果

        3.2.1 基于出行規(guī)律的乘客下車站點(diǎn)識別結(jié)果

        計算結(jié)果中符合集合U1條件的數(shù)據(jù)1 532條,符合集合U2的數(shù)據(jù)1 398條,查看往日出行記錄后符合出行規(guī)律條件的353條,模型匹配量占總量的74.1%。造成乘客數(shù)據(jù)沒有識別成功的原因一是當(dāng)日乘客出行屬于偶然出行,往日記錄中不存在能匹配的出行規(guī)律,二是存在部分乘客的刷卡數(shù)據(jù)與站點(diǎn)不匹配,屬于無效數(shù)據(jù)。

        3.2.2 基于站點(diǎn)下車概率的乘客下車站點(diǎn)識別結(jié)果

        將剩余的1 150條無法通過出行規(guī)律判斷的出行數(shù)據(jù)按照站點(diǎn)下車概率模型進(jìn)行匹配。

        1)乘客公交出行距離影響

        福州市125路公交車一共32個站點(diǎn),結(jié)合該線路的實際情況,取λ值為16,則有

        λ=16,a≤1632-a,16<a<32 (18)

        將數(shù)據(jù)代入計算,部分站點(diǎn)上車乘客在不同站點(diǎn)下車概率Qab見表3所示。

        2)公交站點(diǎn)換乘能力影響

        統(tǒng)計以125路每個站點(diǎn)換乘閾值內(nèi)可供換乘公交線路條數(shù),獲得可供換乘線路總條數(shù)Li,進(jìn)而求出換乘系數(shù)Fi,部分計算結(jié)果見表4。

        3)站點(diǎn)吸引強(qiáng)度影響

        借助各站點(diǎn)上車人數(shù)計算出對應(yīng)的吸引強(qiáng)度系數(shù)Wi,計算結(jié)果見表5。

        4)站點(diǎn)周圍土地利用性質(zhì)影響

        由于占地比較小的土地利用性質(zhì)對乘客下車影響較小,本文取占比前3的土地利用性質(zhì)計算,結(jié)果如表6所示。

        將未匹配的1 150條數(shù)據(jù)代入計算,擴(kuò)樣后的上、下車站點(diǎn)識別結(jié)果及跟車調(diào)查結(jié)果對比如表7。

        3.3 站點(diǎn)識別準(zhǔn)確性驗證

        平均絕對誤差(mean absolute error,MAE)及均方根誤差(root mean square error,RMSE)作為驗證預(yù)測值與實際值偏差情況的評價指標(biāo)被廣泛應(yīng)用,在本文中計算公式分別表示為:

        EMA=1I∑Ii=1Psi-Pfi×100%(19)

        ERMS=1I∑Ii=1(Psi-Pfi)2×100%(20)

        式中:EMA為平均絕對誤差,ERMS為均方根誤差,Psi為i站點(diǎn)實際上、下車人數(shù);Pfi為i站點(diǎn)識別方法求得的上、下車人數(shù)。

        將擴(kuò)樣后數(shù)據(jù)與跟車調(diào)查數(shù)據(jù)進(jìn)行對比,并帶入式(19)、(20),結(jié)果見圖9及表8。

        從圖9及表8中可以看出,實際調(diào)查的客流情況與模型識別結(jié)果基本吻合,擴(kuò)樣后的上車站點(diǎn)識別值與實際值相比,MAE值為3.59%,RMSE值為4.19%,二者誤差小,均為可接受的誤差范圍,擴(kuò)樣后仍然存在一定誤差的原因一方面是在數(shù)據(jù)匹配過程中存在小部分的無效數(shù)據(jù)及無法匹配數(shù)據(jù),另一方面是因為小部分乘客的公交出行具有偶然性,因此存在一定的誤差;擴(kuò)樣后的下車站點(diǎn)識別值與實際值相比,MAE值為5.03%,RMSE值為5.79%,二者誤差小,均為可接受的誤差范圍,擴(kuò)樣后的誤差大于上車站點(diǎn)識別結(jié)果的原因一方面是小部分乘客的公交出行具有偶然性,即使采用了下車概率進(jìn)行補(bǔ)充,計算仍會存在一定誤差,另一方面原因是上車站點(diǎn)識別本身具有誤差,在下車站點(diǎn)識別時這一部分誤差有一定的影響。綜合看來,將基于此上下車站點(diǎn)識別準(zhǔn)確率下得到的識別結(jié)果用于后續(xù)公交客流特征分析及公交調(diào)度優(yōu)化研究是可行的。

        4 結(jié)論

        本文在對公交多源數(shù)據(jù)修正系統(tǒng)時間誤差及修正站間缺失數(shù)據(jù)的基礎(chǔ)上,提出了基于乘客刷卡時間與公交到離站時間的時間匹配方法解決站點(diǎn)信息不匹配情況下的乘客上車站點(diǎn)識別。將乘客按照是否具有出行規(guī)律,分別提出了基于乘客出行規(guī)律的乘客下車站點(diǎn)識別方法及乘客站點(diǎn)下車概率模型對下車站點(diǎn)識別方法進(jìn)行補(bǔ)充。通過實例驗證,結(jié)果表明:上車站點(diǎn)識別值與實際值相比,MAE值為3.59%,RMSE值為4.19%,下車站點(diǎn)識別值與實際值相比,MAE值為5.03%,RMSE值為5.79%,上下車識別誤差小,均在可接受誤差范圍內(nèi),驗證了上、下站點(diǎn)識別模型的有效性。此外,將在未來對無出行規(guī)律的乘客下車站點(diǎn)影響因素進(jìn)行更多角度的研究,繼續(xù)提高模型的識別精度。

        參考文獻(xiàn):

        LEE H, PARK H C, KHO S Y, et al. Assessing transit competitiveness in Seoul considering actual transit travel times based on smart card data[J]. Journal of Transport Geography, 2019, 80: 102546.

        [2] EGU O, BONNEL P. Investigating day-to-day variability of transit usage on a multimonth scale with smart card data: a case study in Lyon[J]. Travel Behaviour and Society, 2020, 19: 112-123.

        [3] TANG T L, LIU R H, CHOUDHURY C. Incorporating weather conditions and travel history in estimating the alighting bus stops from smart card data[J]. Sustainable Cities and Society, 2020, 53: 101927.

        [4] CHEN Z, FAN W. Extracting bus transit boarding and alighting information using smart card transaction data[J]. Journal of Public Transportation, 2020, 22(1): 40-56.

        [5] HUANG D, YU J, SHEN S Y, et al. A method for bus OD matrix estimation using multisource data[J]. Journal of Advanced Transportation, 2020. DOI: 10.1155/2020/5740521.

        [6] 謝振東, 冷夢甜, 吳金成. 基于一卡通數(shù)據(jù)的公交站點(diǎn)識別方法分析與研究[J]. 廣東工業(yè)大學(xué)學(xué)報, 2019, 36(1): 23-28.

        [7] 鄔群勇,蘇克云,鄒智杰.基于海量IC卡數(shù)據(jù)的公交客流時空分析[J].貴州大學(xué)學(xué)報(自然科學(xué)版),2018,35(6):93-98.

        [8] 秦政. 基于數(shù)據(jù)挖掘的客流特征提取及公交調(diào)度優(yōu)化研究[D]. 成都: 西南交通大學(xué), 2017.

        [9] 左快樂. 基于IC卡數(shù)據(jù)的不同時間層次公交客流預(yù)測方法與應(yīng)用研究[D]. 南京: 東南大學(xué), 2016.

        [10]張文勝,盧夢,朱冀軍.基于公交IC卡和AVL數(shù)據(jù)的公交客流OD推算[J].計算機(jī)應(yīng)用與軟件,2021,38(7):100-105.

        [11]孫凱,鄭長江.基于公交IC卡刷卡數(shù)據(jù)的站點(diǎn)客流推算[J].貴州大學(xué)學(xué)報(自然科學(xué)版),2021,38(2):104-110,124.

        [12]常煥. 基于公交IC卡和AVL數(shù)據(jù)的公交換乘識別方法研究[D]. 成都: 西南交通大學(xué), 2019.

        [13]傅準(zhǔn). 城市公共交通換乘客流時空分布可視化及站點(diǎn)聚類分析[D]. 廣州: 廣東工業(yè)大學(xué), 2019.

        [14]柳伍生, 周向棟, 譚倩. 多元數(shù)據(jù)下的公交站點(diǎn)客流不確定性分析[J]. 交通運(yùn)輸系統(tǒng)工程與信息, 2018, 18(2): 149-156.

        [15]趙鵬. 基于成都公交IC卡數(shù)據(jù)的乘客上下車站點(diǎn)推算方法研究[D]. 成都: 西南交通大學(xué), 2015.

        [16]趙志恒. 基于公交IC卡數(shù)據(jù)的城市公交站點(diǎn)客流測算方法研究[D]. 哈爾濱: 東北林業(yè)大學(xué), 2019.

        (責(zé)任編輯:曾 晶)

        Passenger Boarding and Alighting Station Identification

        Based on Transit Data Mining

        ZHANG Jie, TANG Yaohong*, YUAN Qiufeng, WANG Wei

        (College of Information and Electrical Engineering, Ningde Normal University, Ningde 352100, China)

        Abstract:

        In order to develop a bus scheduling plan that meets the passenger flow, increase the attractiveness of bus travel and reduce the carbon emission of private car travel, it is necessary to propose an accurate passenger boarding and alighting station identification method to obtain accurate passenger flow data and provide fine data support for bus scheduling. This paper proposes a data pre-processing method for system time error correction and station-to-station missing data repair based on multiple sources of regular bus data in Fuzhou City. On this basis, the method of identifying the boarding point by matching the passenger swipe time with the bus arrival and departure time is proposed. According to the travel behavior of passengers, we propose the identification method of passenger alighting stations based on the travel pattern and the identification method of passenger alighting probability under the influence of travel distance, interchange ability, travel attraction intensity and the nature of surrounding land use. Finally, the identification data is compared with the actual survey data to verify the accuracy of the identification method, taking the Fuzhou 125 bus data as an example. The research results can provide a data mining method for urban bus passenger flow OD survey, reducing the manpower and material resources generated by traditional survey, and offering data support for the operation and scheduling of bus enterprises.

        Key words:

        urban traffic; station identification; travel law; data mining

        猜你喜歡
        城市交通數(shù)據(jù)挖掘
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        新形勢下我國城市交通發(fā)展戰(zhàn)略思考
        老齡化背景下關(guān)于城市交通適老化對策的思考
        共享單車對城市交通的影響
        智富時代(2019年2期)2019-04-18 07:44:42
        上海城市交通大數(shù)據(jù)研究與實踐
        上海公路(2018年1期)2018-06-26 08:37:40
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        契合城市交通需求 推進(jìn)單軌交通發(fā)展
        數(shù)據(jù)挖掘的分析與探索
        河南科技(2014年23期)2014-02-27 14:18:43
        国内嫩模自拍偷拍视频| 免费亚洲老熟熟女熟女熟女| 中文字幕一区二区综合| 男女裸体做爰视频高清| 欧美国产激情二区三区| 久久青青草原亚洲av无码麻豆| 麻豆精品久久久久久久99蜜桃| 少妇被躁爽到高潮无码文| 精品人妻无码视频中文字幕一区二区三区 | 国产第一草草影院| 亚洲日本精品一区久久精品| 91桃色在线播放国产| 国产高潮迭起久久av| 国产精品女老熟女一区二区久久夜 | 在线精品亚洲一区二区三区| 麻豆视频黄片在线免费观看| 中文字日产幕码三区国产| 国产成人精品免费视频大全软件| 国产精品国三级国产av| 亚洲国产长腿丝袜av天堂 | 精品蜜臀国产av一区二区| 偷拍韩国美女洗澡一区二区三区 | 国内精品久久久久久久97牛牛| 国产成人精品一区二区不卡| 国产精品免费久久久免费| 人人妻人人澡av| 久久久噜噜噜久久熟女| 亚洲av高清天堂网站在线观看| 激情内射亚洲一区二区三区| 国产又a又黄又潮娇喘视频| 成人免费视频在线观看| 亚洲欧美在线观看一区二区| 亚洲精品中文字幕乱码二区 | 欧美在线 | 亚洲| 91福利国产在线观一区二区| 自拍视频国产在线观看| 日韩男女av中文字幕| 国产成人av无码精品| 日日碰狠狠添天天爽| 无码一级视频在线| 中文字幕一区二区人妻在线不卡 |