李世野
【摘 要】大數(shù)據(jù)是一個(gè)國家的重要的戰(zhàn)略資源。城市軌道交通憑借其大容量運(yùn)輸和高效率運(yùn)輸水平,在緩解交通擁堵方面有重要作用。如何在軌道交通中挖掘和發(fā)揮大數(shù)據(jù)的創(chuàng)新價(jià)值,如何利用大數(shù)據(jù)挖掘、預(yù)測、可視化等技術(shù)服務(wù)軌道交通行業(yè)有著重要的意義。本文系統(tǒng)地闡述了大數(shù)據(jù)技術(shù)在軌道交通領(lǐng)域的研究現(xiàn)狀,總結(jié)了大數(shù)據(jù)在軌道交通應(yīng)用中的研究難點(diǎn)和挑戰(zhàn),為軌道交通信息化和大數(shù)據(jù)應(yīng)用拓展提供支持。
【關(guān)鍵詞】軌道交通;大數(shù)據(jù);數(shù)據(jù)挖掘;機(jī)器學(xué)習(xí)
隨著互聯(lián)網(wǎng)的高速發(fā)展,大數(shù)據(jù)已成為一個(gè)國家的重要的戰(zhàn)略資源。由于國家戰(zhàn)略層面的重視,近年來大數(shù)據(jù)技術(shù)越發(fā)成熟,大數(shù)據(jù)應(yīng)用得到了快速增長。大數(shù)據(jù)是指無法用現(xiàn)有的軟件工具提取、存儲(chǔ)、搜索、共享、分析和處理的海量的、復(fù)雜的數(shù)據(jù)集合。大數(shù)據(jù)具有4個(gè)特征:數(shù)據(jù)體量巨大、數(shù)據(jù)類型繁多、價(jià)值密度低、處理速度快。大數(shù)據(jù)是需求驅(qū)動(dòng)的,目前國家是大數(shù)據(jù)應(yīng)用的主要推動(dòng)者。
快速發(fā)展的城市軌道交通在城市交通中發(fā)揮著巨大的作用,積累了海量的數(shù)據(jù)規(guī)模。這些原始數(shù)據(jù)有多源異構(gòu)、周期變化大,傳播速度快,動(dòng)態(tài)的數(shù)據(jù)體系等特點(diǎn),具有明顯的大數(shù)據(jù)特征。如何在軌道交通管理中挖掘和發(fā)揮大數(shù)據(jù)的創(chuàng)新價(jià)值,如何利用大數(shù)據(jù)挖掘、大數(shù)據(jù)預(yù)測、大數(shù)據(jù)可視化等技術(shù)分析軌道交通大數(shù)據(jù),有助于發(fā)現(xiàn)軌道交通中潛在的數(shù)據(jù)規(guī)律,分析決策需求,優(yōu)化數(shù)據(jù)采集和處理。軌道交通大數(shù)據(jù)技術(shù)能更好的服務(wù)于軌道交通行業(yè)的管理,提升效率,促進(jìn)發(fā)展,已成為軌道交通業(yè)內(nèi)研究和拓展的新領(lǐng)域。
一、軌道交通大數(shù)據(jù)研究現(xiàn)狀
目前,大數(shù)據(jù)技術(shù)在軌道交通領(lǐng)域中的研究主要可分為5方面:基于大數(shù)據(jù)的軌道交通客流預(yù)測,基于大數(shù)據(jù)的軌道交通規(guī)劃優(yōu)化,軌道交通大數(shù)據(jù)分析,軌道交通調(diào)度和節(jié)能優(yōu)化和軌道交通狀態(tài)監(jiān)測與可視化研究。
(一)基于大數(shù)據(jù)的軌道交通規(guī)劃優(yōu)化研究
在城市軌道交通中,大規(guī)模事件往往會(huì)引發(fā)大量的客流,給附近的交通運(yùn)輸和管理帶來極大的壓力。因此,針對(duì)城市軌道交通網(wǎng)絡(luò)中客流,進(jìn)行有效的評(píng)估和傳播研究變得很有意義。通過捕捉復(fù)雜地鐵線網(wǎng)中客流的時(shí)空特征,文獻(xiàn)中提出了一種有效動(dòng)態(tài)交通規(guī)劃方法。通過設(shè)計(jì)隨便效應(yīng)函數(shù)和多項(xiàng)分對(duì)數(shù)模型,該方法能較好的進(jìn)行客流規(guī)劃,優(yōu)化交通運(yùn)輸成本。
(二)軌道交通大數(shù)據(jù)分析研究
大數(shù)據(jù)分析(BDA)廣泛應(yīng)用于鐵路運(yùn)輸和工程領(lǐng)域。通過一個(gè)新的分類框架,全面綜述大數(shù)據(jù)在鐵路工程和運(yùn)輸領(lǐng)域的最新應(yīng)用。從鐵路運(yùn)輸?shù)娜齻€(gè)領(lǐng)域(運(yùn)營、維護(hù)和安全)的大數(shù)據(jù)分析應(yīng)用進(jìn)行了系統(tǒng)研究。對(duì)大數(shù)據(jù)分析的層次、大數(shù)據(jù)模型的類型以及各種大數(shù)據(jù)技術(shù)進(jìn)行了分析。
(三)軌道交通調(diào)度和節(jié)能優(yōu)化研究
由于環(huán)境和社會(huì)問題的不斷增加,在軌道交通系統(tǒng)中,如何節(jié)能是一項(xiàng)具有挑戰(zhàn)性的問題?,F(xiàn)有文獻(xiàn)在設(shè)計(jì)時(shí)間表和能耗過程中,往往忽略了每個(gè)車站乘客需求的時(shí)變特征?;跁r(shí)間相關(guān)的智能卡自動(dòng)收費(fèi)數(shù)據(jù),提出一種基于時(shí)間依賴客流量的城市軌道交通雙目標(biāo)時(shí)間表優(yōu)化模型,最大限度地減少了旅客等待時(shí)間和純能源消耗。在模型公式中,旅客等待時(shí)間受限于滿載情形下的列車容量,純能量消耗由牽引能量消耗與給定時(shí)期內(nèi)再生能量的差值表示。數(shù)值實(shí)例表明: 相對(duì)于現(xiàn)行的時(shí)間表方案,該模型能顯著改進(jìn)客運(yùn)服務(wù),有效地減少能量消耗。
(四)軌道交通狀態(tài)監(jiān)測與可視化研究
自然災(zāi)難、惡意攻擊和誤操作事故是軌道交通網(wǎng)絡(luò)的重要威脅。軌道交通網(wǎng)絡(luò)的脆弱性受到了越來越多的行業(yè)專家和管理者的重視。針對(duì)該問題,在軌道交通網(wǎng)絡(luò)脆弱性分析過程當(dāng)中綜合考慮了乘客流量和使用特征,提出了一種基于站點(diǎn)的網(wǎng)絡(luò)脆弱性測量方法。從軌道交通網(wǎng)絡(luò)數(shù)據(jù)、客流數(shù)據(jù)和車站周圍的土地利用數(shù)據(jù)入手進(jìn)行系統(tǒng)數(shù)據(jù)分析。結(jié)果表明,軌道交通網(wǎng)絡(luò)的脆弱性受其網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)、客流、土地利用變量等因素的共同影響。有助于軌道交通管理者及時(shí)了解網(wǎng)絡(luò)脆弱性,關(guān)鍵站和鏈路的實(shí)際狀態(tài)。
二、軌道交通大數(shù)據(jù)研究所面臨的挑戰(zhàn)
目前,軌道交通大數(shù)據(jù)分析和處理有著豐富的應(yīng)用,但仍有一些潛在的問題需要解決,下面從數(shù)據(jù)收集、數(shù)據(jù)隱私、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理和數(shù)據(jù)共享這5個(gè)方面進(jìn)行分析。
(一)數(shù)據(jù)收集
由于車輛和行人的頻繁移動(dòng),在特定地點(diǎn)或在某些時(shí)間,在軌道交通中收集的數(shù)據(jù)可能不準(zhǔn)確,不完整或不可靠,如車輛沒有嵌入提供實(shí)時(shí)定位數(shù)據(jù)的設(shè)備、道路傳感器收集的道路交通數(shù)據(jù)可能丟失。解決這一難題的一個(gè)可能途徑是投入新的數(shù)據(jù)采集技術(shù),提高數(shù)據(jù)采集能力。隨著物聯(lián)網(wǎng)技術(shù)的發(fā)展,新的傳感器技術(shù)應(yīng)運(yùn)而生,有助于提高數(shù)據(jù)采集和數(shù)據(jù)質(zhì)量。此外,采用數(shù)據(jù)捕獲自動(dòng)化來最小化手動(dòng)數(shù)據(jù)輸入也是提高數(shù)據(jù)質(zhì)量所必需的。
(二)數(shù)據(jù)隱私
在大數(shù)據(jù)時(shí)代,最具挑戰(zhàn)性和最關(guān)心的問題是隱私問題。個(gè)人隱私可能在數(shù)據(jù)傳輸、存儲(chǔ)和使用過程中泄露。以往的軌道交通系統(tǒng)收集的數(shù)據(jù)是非個(gè)人數(shù)據(jù),如車輛數(shù)據(jù)、交通流數(shù)據(jù)。而現(xiàn)有的數(shù)據(jù)收集涉及到個(gè)人隱私數(shù)據(jù),如個(gè)人和車輛的位置信息。如果不嚴(yán)格保護(hù)這些數(shù)據(jù),竊取這些數(shù)據(jù)的人將損害數(shù)據(jù)所有者。因此,隱私問題一直備受關(guān)注,隱私保護(hù)是其大數(shù)據(jù)應(yīng)用的重要內(nèi)容。為防止未經(jīng)授權(quán)的個(gè)人隱私信息泄露,各國政府和交通部門應(yīng)采取相應(yīng)的措施提高數(shù)據(jù)的安全級(jí)別。
(三)數(shù)據(jù)存儲(chǔ)
目前,大數(shù)據(jù)的數(shù)據(jù)量已經(jīng)從TB級(jí)躍升到PB級(jí),數(shù)據(jù)存儲(chǔ)容量的增長速度遠(yuǎn)遠(yuǎn)落后于數(shù)據(jù)增長速度。特別是在軌道交通運(yùn)維中,將每天從各種傳感器產(chǎn)生各種數(shù)據(jù)。傳統(tǒng)數(shù)據(jù)存儲(chǔ)基礎(chǔ)設(shè)施和數(shù)據(jù)庫工具已經(jīng)無法應(yīng)對(duì)日益龐大和復(fù)雜的海量數(shù)據(jù)。因此,設(shè)計(jì)最合理的數(shù)據(jù)存儲(chǔ)體系結(jié)構(gòu)已經(jīng)成為一個(gè)關(guān)鍵的挑戰(zhàn)。主要的公共云存儲(chǔ)提供商,如谷歌和微軟,通過提升大數(shù)據(jù)集成能力來改進(jìn)其服務(wù),多云存儲(chǔ)和混合存儲(chǔ)正在成為大數(shù)據(jù)存儲(chǔ)的關(guān)鍵領(lǐng)域。它們的計(jì)算能力在處理計(jì)算密集型分析工作負(fù)載中極具優(yōu)勢。
(四)數(shù)據(jù)處理
軌道交通中的大數(shù)據(jù)應(yīng)用有很強(qiáng)的時(shí)效性,需要及時(shí)、快速地處理數(shù)據(jù)。這些大數(shù)據(jù)應(yīng)用包括交通數(shù)據(jù)預(yù)處理、交通狀態(tài)識(shí)別、實(shí)時(shí)交通控制、動(dòng)態(tài)路徑引導(dǎo)和實(shí)時(shí)交通調(diào)度。軌道交通數(shù)據(jù)包含大量的來自不同數(shù)據(jù)源的異構(gòu)數(shù)據(jù),同時(shí)必須與歷史數(shù)據(jù)進(jìn)行比較,并在短時(shí)間內(nèi)進(jìn)行處理。數(shù)據(jù)處理系統(tǒng)必須能夠處理更復(fù)雜和日益擴(kuò)大的數(shù)據(jù)。
三、結(jié)束語
城市軌道交通的快速發(fā)展,能有效的緩解交通擁堵,是現(xiàn)代交通運(yùn)輸發(fā)展的重要方式。具有運(yùn)輸容量大、運(yùn)輸水平高效等特點(diǎn)。應(yīng)用大數(shù)據(jù)技術(shù),通過數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理和存儲(chǔ)、數(shù)據(jù)計(jì)算和分析等關(guān)鍵環(huán)節(jié),深入探索軌道交通系統(tǒng)的運(yùn)維和數(shù)據(jù)規(guī)律,指導(dǎo)運(yùn)營實(shí)踐和規(guī)劃,是一個(gè)重要的研究領(lǐng)域。針對(duì)該研究熱點(diǎn),本文系統(tǒng)闡述了大數(shù)據(jù)技術(shù)在軌道交通領(lǐng)域中的研究現(xiàn)狀,分別從基于大數(shù)據(jù)的軌道交通規(guī)劃優(yōu)化,軌道交通大數(shù)據(jù)分析,軌道交通調(diào)度和節(jié)能優(yōu)化和軌道交通狀態(tài)監(jiān)測與可視化研究4個(gè)方面進(jìn)行展開研究。分析了軌道交通大數(shù)據(jù)應(yīng)用中數(shù)據(jù)收集、數(shù)據(jù)隱私、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理這4方面的研究難點(diǎn)和挑戰(zhàn)。研究成果對(duì)提升軌道交通的運(yùn)營管理水平和乘客服務(wù)水平具有重要的理論和現(xiàn)實(shí)意義。
【參考文獻(xiàn)】
[1]宋杰,孫宗哲,毛克明,等.MapReduce 大數(shù)據(jù)處理平臺(tái)與算法研究進(jìn)展[J].軟件學(xué)報(bào),2017,28(3):514-543.
[2]毛國君胡殿軍,謝松燕.基于分布式數(shù)據(jù)流的大數(shù)據(jù)分類模型和算法[J].計(jì)算機(jī)學(xué)報(bào),2017,40(1): 161-175.
[3]李得偉,張?zhí)煊?,周瑋騰,等. 軌道交通大數(shù)據(jù)運(yùn)用現(xiàn)狀及發(fā)展趨勢研究[J].都市快軌交通,2016,29(6):1-7.