亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于特征工程的常規(guī)公交車輛聚簇預(yù)測

        2022-05-10 06:34:14王小可陳泱霖
        城市公共交通 2022年4期
        關(guān)鍵詞:時距班次車頭

        王小可 陳泱霖 王 婭 張 棟

        (大連理工大學(xué)建設(shè)工程學(xué)部,大連 116024)

        引言

        有序、高效的運(yùn)營是現(xiàn)代化常規(guī)公共交通系統(tǒng)應(yīng)具備的主要特征之一。然而大量的實(shí)測數(shù)據(jù)顯示,公交線路上普遍存在著車輛偏離調(diào)度聚集行駛以及在站點(diǎn)處密集到達(dá)的聚簇現(xiàn)象。公交車輛聚簇是指在同一條線路上運(yùn)行的公交車輛在行駛一定距離和時間后,至少有兩輛及以上的公交車輛在視線范圍內(nèi)共同運(yùn)行或者同時進(jìn)站,是城市常規(guī)公共交通服務(wù)中常見的異常運(yùn)行狀態(tài)。公交車輛聚簇影響了乘客的出行體驗(yàn),造成了運(yùn)力的浪費(fèi),也容易給人帶來城市管理無序混亂的印象,因此引起了交通工程領(lǐng)域?qū)W者的長期廣泛關(guān)注。

        Arnold Barnett在1973年的研究表明,公交車輛聚簇是由于某種原因?qū)е碌能囕v滯后于時刻表的運(yùn)營而使得車輛承載了更多的乘客,因而帶來了更長的駐站時間并最終形成負(fù)反饋,進(jìn)而提出可以通過增加松弛時間的方法來改善這一現(xiàn)象[1]。然而Daganzo教授的研究表明,單純引入松弛時間并不一定能完全控制車輛聚簇現(xiàn)象,故提出了基于公交車輛車頭時距判斷的公交車輛自我調(diào)節(jié)運(yùn)行策略[2]。Turnquist[3],Levinson[4]和Ceder[5]等學(xué)者的研究表明,公交車輛運(yùn)行過程中的駕駛員不當(dāng)駕駛行為、社會交通擁堵、突發(fā)交通事件以及交叉口信號控制措施等諸多不確定因素都會導(dǎo)致車輛聚簇的發(fā)生?;贕PS技術(shù)的車輛定位數(shù)據(jù)極大地方便了公交車輛聚簇現(xiàn)象的研究。Wei Feng等人[6]分析了美國波特蘭市半年時間的公交運(yùn)行數(shù)據(jù),揭示了某一具體時間和狀況下可能引發(fā)公交車輛聚簇的因素。Luis Moreira-Matias等人[7]提出了基于公交車輛歷史和實(shí)時運(yùn)行數(shù)據(jù)的車頭時距分布的概率預(yù)測方法。石琴等人[8]采用基于元胞自動機(jī)的方法模擬了站臺泊位數(shù)和乘客到達(dá)規(guī)律對于公交車輛到達(dá)分布的影響。Chen Guojun等人[9]通過建立兩種不同的線性回歸模型,發(fā)現(xiàn)當(dāng)聚簇發(fā)生時,后車進(jìn)入車站的時間平均要增加4.2-6.2s。杜若基于速度-道路擁擠度模型建立了公交車輛聚簇的預(yù)測方法,并通過對磁力模型的改進(jìn)闡述了車輛聚簇產(chǎn)生的數(shù)學(xué)原理[10]。

        綜合上述研究不難發(fā)現(xiàn),目前關(guān)于公交車輛聚簇的研究認(rèn)為,公交車輛聚簇的成因是外部運(yùn)行環(huán)境的不確定性,而解決方案則聚焦于對于車頭時距的控制上。實(shí)際情況中,由于無法有效控制天氣等外部影響因素,也無法給予常規(guī)公交車輛絕對優(yōu)先的路權(quán),更無法強(qiáng)制調(diào)節(jié)乘客的乘降行為,因此公交車輛聚簇現(xiàn)象的最終解決還是有賴于實(shí)際運(yùn)行過程中靈活調(diào)度措施的實(shí)施,因此,有充分的必要對公交車輛是否將要出現(xiàn)聚簇現(xiàn)象做出預(yù)判,以支持下游系統(tǒng)人工或者自動做出車輛調(diào)度決策。

        1 研究數(shù)據(jù)及清洗

        1.1 數(shù)據(jù)

        本研究采用了由青島市公交集團(tuán)提供的322路公交車于2015年8月3日至2015年8月9日的車載GPS、發(fā)車班次以及乘客刷卡記錄數(shù)據(jù),其中GPS數(shù)據(jù)包含車輛編號、站點(diǎn)名稱以及車輛在各站的到達(dá)駛離時間,見表1;發(fā)車班次數(shù)據(jù)包含各班次的發(fā)車時間,見表2;乘客刷卡記錄包括刷卡時間和扣費(fèi)金額等信息,見表3。

        表1 青島322路公交車GPS數(shù)據(jù)(部分)

        表2 青島322路公交車班次數(shù)據(jù)(部分)

        表3 青島322路公交車乘客刷卡記錄數(shù)據(jù)(部分)

        1.2 數(shù)據(jù)清洗過程

        為了提高預(yù)測的準(zhǔn)確度,需要對數(shù)據(jù)進(jìn)行清洗。其主要工作為刪除GPS數(shù)據(jù)中公交到離站時間的錯誤數(shù)據(jù)、補(bǔ)充缺失數(shù)據(jù),并對最終數(shù)據(jù)質(zhì)量進(jìn)行確認(rèn)。

        首先,根據(jù)公交車輛到離站數(shù)據(jù),我們可以計(jì)算出每班公交車在每兩個站點(diǎn)之間的行程時間。

        數(shù)據(jù)刪除操作主要基于對最小行程時間的估計(jì)確定行程時間的下界,再根據(jù)數(shù)據(jù)分布形態(tài)分時段、分站點(diǎn)確定行程時間的上界。當(dāng)數(shù)據(jù)中兩站間行程時間不在設(shè)定的上下界之間時,認(rèn)為兩站中后一站的到達(dá)駛離時間為異常值,將其刪除,見表4。

        表4 異常值識別(部分)

        將錯誤數(shù)據(jù)刪除后,對各個站點(diǎn)之間所有班次的行程時間進(jìn)行檢索,當(dāng)某兩站點(diǎn)之間某班次行程時間缺失時,利用相鄰班次在同一區(qū)間行程時間的均值進(jìn)行補(bǔ)充,見表5。并在現(xiàn)有班次到站時間的基礎(chǔ)上,逐項(xiàng)相加推出缺失站點(diǎn)的到站時間。

        表5 行程時間缺失值補(bǔ)充(部分)

        補(bǔ)全數(shù)據(jù)缺失值后,進(jìn)一步識別出補(bǔ)全后數(shù)據(jù)不合邏輯的部分,如同一班次公交到達(dá)下游站點(diǎn)的時間早于上游站點(diǎn)等錯誤,然后再次利用上下站點(diǎn)取平均值等方法,對錯誤數(shù)據(jù)進(jìn)行覆蓋處理,最終確認(rèn)得到符合邏輯的數(shù)據(jù)集,見表6。

        表6 數(shù)據(jù)清洗結(jié)果(部分)

        2 車輛聚簇特征構(gòu)造及描述性統(tǒng)計(jì)

        本研究的思路為:利用上游若干站點(diǎn)的運(yùn)行特征數(shù)據(jù)預(yù)測所關(guān)心的下游站點(diǎn)是否會發(fā)生聚簇現(xiàn)象。因此,研究主要致力于解決以下三個問題:

        (1)聚簇現(xiàn)象如何通過數(shù)據(jù)表征。換言之,當(dāng)數(shù)據(jù)呈現(xiàn)何種狀態(tài)時,可以等價于實(shí)際生活中的聚簇現(xiàn)象。

        (2)利用哪個上游站點(diǎn)進(jìn)行預(yù)測時,預(yù)測效果最好。

        (3)采用上游站點(diǎn)的哪些運(yùn)行特征可以有效預(yù)測下游站點(diǎn)的聚簇現(xiàn)象。

        2.1 車輛聚簇判定

        通過查閱相關(guān)文獻(xiàn),結(jié)合實(shí)地調(diào)查情況,對于任意兩個班次,若下游站點(diǎn)的車頭時距小于等于首站車頭時距的1/2,則可認(rèn)為發(fā)生聚簇;反之則不發(fā)生聚簇:

        2.2 特征工程實(shí)踐

        2.2.1 準(zhǔn)備工作

        研究團(tuán)隊(duì)認(rèn)為,車輛聚簇特征的構(gòu)建需要考慮兩個因素:一是上游站點(diǎn)與下游站點(diǎn)的車頭時距關(guān)聯(lián)性要足夠強(qiáng),也就是相關(guān)系數(shù)要足夠大;二是用于預(yù)測的上游站點(diǎn)不能與其相距過遠(yuǎn)。綜合以上兩個因素,建立綜合指標(biāo),將兩個因素結(jié)合起來考慮。

        首先,通過區(qū)間歸一化公式,對于第i站,選定[i-4,i-2]為區(qū)間,利用式(2)計(jì)算歸一化指標(biāo):

        式中,rij為歸一化指標(biāo);i為被預(yù)測站序號;j為預(yù)測站序號。

        然后,求出每兩個站點(diǎn)車頭時距的相關(guān)系數(shù),設(shè)預(yù)測站為j站,被預(yù)測站為i站,對于第i站和第j站之間的相關(guān)系數(shù),記為corij。

        最后,綜合以上兩個指標(biāo),得出綜合指標(biāo)p:

        2.2.2 特征構(gòu)建

        計(jì)算對于被預(yù)測站i而言,綜合指標(biāo)p最大的預(yù)測站為j,本次建立車頭時距預(yù)測模型所提取的特征有:

        (1)第j站的車頭時距數(shù)據(jù):是用于預(yù)測的最基礎(chǔ)數(shù)據(jù)。

        (2)第j站的前三站行程時間方差數(shù)據(jù):可以用于表征第j站的道路交通擁堵水平和車頭時距波動情況。

        (3)發(fā)車間隔:部分已有研究表明聚簇與發(fā)車間隔相關(guān),因此也作為特征向量進(jìn)行測試。

        2.2.3 特征篩選

        以聚簇發(fā)生與否對上述三個特征進(jìn)行假設(shè)檢驗(yàn),以完成特征篩選。

        t檢驗(yàn)的結(jié)果表明,在0.05的顯著性水平上,可以認(rèn)為兩類場景下在當(dāng)前站點(diǎn)前一班次的車頭時距有顯著差異,且兩種類型數(shù)據(jù)的均值差異達(dá)到了400s以上,得出結(jié)論:聚簇時的車頭時距遠(yuǎn)小于非聚簇時的車頭時距。

        對于第j站的前三站行程時間方差數(shù)據(jù)同樣進(jìn)行假設(shè)檢驗(yàn),根據(jù)t檢驗(yàn)結(jié)果發(fā)現(xiàn),在0.05的顯著性水平上,可以認(rèn)為在聚簇和非聚簇車輛的前三站行程時間方差有顯著差異。根據(jù)計(jì)算得到的均值差異,可以發(fā)現(xiàn)聚簇車輛的前三站行程時間方差更大,這也說明了聚簇車輛在前幾站的行駛過程中不穩(wěn)定性更強(qiáng)。

        而對發(fā)車間隔的t檢驗(yàn)結(jié)果表明, 聚簇和非聚簇時段的車頭時距沒有顯著差異。因此,選擇“本站前序班次車頭時距”和“上游三站車頭時距方差”作為選中的特征。

        以班次作為橫坐標(biāo),站點(diǎn)作為縱坐標(biāo)畫圖,將每一站點(diǎn)的聚簇班次在圖中標(biāo)出,從而得到直觀的聚簇表現(xiàn),如附圖所示。其中,深藍(lán)色點(diǎn)代表每班次所有聚簇站點(diǎn),淺藍(lán)色點(diǎn)代表每班次首個聚簇站點(diǎn)。

        附圖 2015年8月4日-7日青島市322路公交車輛軌跡及聚簇時空分布圖

        3 車輛聚簇預(yù)測模型標(biāo)定結(jié)果

        3.1 重構(gòu)數(shù)據(jù)集

        聚簇點(diǎn)的數(shù)量遠(yuǎn)遠(yuǎn)小于非聚簇點(diǎn),造成的樣本不均衡會影響預(yù)測精度。研究中采用過采樣法、欠采樣法以及綜合采樣法重構(gòu)數(shù)據(jù)集。過采樣法是通過對占比少的數(shù)據(jù)隨機(jī)重復(fù)以擴(kuò)大其比例,從而實(shí)現(xiàn)數(shù)據(jù)平衡;欠采樣法則通過刪除占比多的數(shù)據(jù)來實(shí)現(xiàn)數(shù)據(jù)平衡;綜合采樣法結(jié)合前兩種方式,可以自行定義數(shù)據(jù)集大小和兩類數(shù)據(jù)的比例。

        3.2 模型建立

        采用Logistic回歸模型,將三個重構(gòu)數(shù)據(jù)集分為訓(xùn)練集和測試集,使用R語言對訓(xùn)練集數(shù)據(jù)建立Logistic回歸模型后,利用測試集數(shù)據(jù)評價預(yù)測準(zhǔn)確度。評價指標(biāo)有三個:TPR(True Positive Rate)即聚簇站中預(yù)測正確概率;FPR(False Positive Rate)即非聚簇站中預(yù)測錯誤概率;Accuracy即總體預(yù)測準(zhǔn)確率。三種重構(gòu)方法參數(shù)標(biāo)定與預(yù)測效果見表7。

        表7 參數(shù)標(biāo)定結(jié)果

        綜合比對三種采樣方法,可以發(fā)現(xiàn)欠采樣法和綜合采樣法的總體預(yù)測精度較高,但聚簇站中預(yù)測正確概率很低,這會導(dǎo)致一半左右的車輛聚簇現(xiàn)象無法預(yù)測。因此,我們綜合考慮,選擇過采樣法作為最終數(shù)據(jù)采樣方法。

        4 結(jié)語

        本研究針對當(dāng)前公交車輛聚簇預(yù)測研究中的不足,從數(shù)據(jù)驅(qū)動的角度出發(fā),提出了基于特征工程的常規(guī)公交車輛聚簇行為預(yù)測思路,并結(jié)合青島市322路公交車實(shí)際運(yùn)行數(shù)據(jù)完成了理論模型驗(yàn)證,結(jié)果表明,基于“本站的車頭時距”以及“上游三個站點(diǎn)的車頭時距方差”兩個特征的Logistic回歸模型可以較好地預(yù)測公交車輛聚簇行為的發(fā)生。

        對于公交公司而言,短期內(nèi),可以通過對車輛聚簇的預(yù)測提前預(yù)知車輛行駛變動情況,對運(yùn)行和待運(yùn)行的車輛進(jìn)行實(shí)時調(diào)度,以緩解聚簇現(xiàn)象;長期來看,可以支持公交公司對聚簇點(diǎn)較多的線路進(jìn)行分析調(diào)整,充分利用公交運(yùn)力,提高服務(wù)質(zhì)量。

        (張棟為本文通訊作者)

        猜你喜歡
        時距班次車頭
        趣味性進(jìn)度提示設(shè)計(jì)對時距知覺的影響
        考慮編制受限的均衡任務(wù)覆蓋人員排班模型①
        公交車輛班次計(jì)劃自動編制探索
        高鐵車頭為什么是子彈頭的?
        軍事文摘(2020年24期)2020-02-06 05:56:58
        學(xué)習(xí)障礙學(xué)生與普通學(xué)生短時距估計(jì)的比較
        回溯式時距估計(jì)的計(jì)時機(jī)制*
        在市場中成熟起來的大車頭村
        帶柔性休息時間的多技能呼叫中心班次設(shè)計(jì)
        標(biāo)量計(jì)時模型的影響因素及發(fā)展*
        城市快速路單車道車頭間距的研究
        日韩精品人妻少妇一区二区| 精品国产午夜理论片不卡| 亚洲精品久久久久中文字幕二区| 妞干网中文字幕| 日本高清一区在线你懂得| 亚洲av网一区二区三区| 国产精品毛片完整版视频| 91免费永久国产在线观看| 青青草一级视频在线观看| 成熟妇女毛茸茸性视频| 轻点好疼好大好爽视频| 亚洲综合色丁香婷婷六月图片| 无码AV无码免费一区二区| 丰满老熟女性生活视频| 国产精品99无码一区二区| 亚洲人成人77777网站| 久久国产精品老人性| 国产在线精品观看一区二区三区| 国产av国片精品有毛| 成人国产精品免费视频| 亚洲五月七月丁香缴情| av在线免费观看麻豆| 亚洲精品白浆高清久久久久久| 亚洲av无码成人黄网站在线观看| 91极品尤物国产在线播放| 日本一区二区高清精品| 亚洲人成无码区在线观看| 人人狠狠综合久久亚洲婷婷| 久久av一区二区三区下| 国产亚洲av成人噜噜噜他| 亚洲va中文字幕| 亚洲毛片αv无线播放一区| 亚洲国产综合久久精品| 美女国产毛片a区内射| 久久老子午夜精品无码怎么打| 亚洲国产成人精品激情资源9| 亚洲国产成人va在线观看天堂| 国产av夜夜欢一区二区三区| 麻豆精品久久久久久久99蜜桃| 亚洲老女人区一区二视频| 久久精品中文字幕女同免费|