孫紅影
摘 要:隨著我國城市化率的逐年提高和經(jīng)濟(jì)的飛速發(fā)展,交通擁堵問題已經(jīng)成為城市和經(jīng)濟(jì)發(fā)展的桎梏。研究者們致力于對(duì)交通擁堵狀態(tài)的預(yù)測,文章就預(yù)測過程中需要的交通流數(shù)據(jù)的采集與處理分析方法進(jìn)行討論,為交通流數(shù)據(jù)從采集到處理過程提供思路。
關(guān)鍵詞:交通流;數(shù)據(jù)處理;數(shù)據(jù)分析
中圖分類號(hào):U491 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):2095-2945(2018)12-0123-02
Abstract: With the increasing of urbanization rate and the rapid development of economy, traffic congestion has become the shackles of urban and economic development. Researchers are committed to the prediction of traffic congestion. This paper discusses the methods of collecting and processing traffic flow data needed in the process of forecasting, and provides ideas for traffic flow data from collecting to processing.
Keywords: traffic flow; data processing; data analysis
引言
隨著城市化率的逐年提高和經(jīng)濟(jì)的快速發(fā)展,城市交通容量已經(jīng)達(dá)到現(xiàn)有設(shè)計(jì)容量的閾值,汽車的保有量已經(jīng)趨于飽和,其表現(xiàn)形式為城市交通的流量越來越大,平均車速越來越低,道路運(yùn)送能力越來越低,因而城市交通的擁堵已經(jīng)稱為城市和經(jīng)濟(jì)法則的桎梏。在現(xiàn)有城市道路設(shè)計(jì)容量狀況下,對(duì)城市道路交通進(jìn)行精確控制,是提高城市道路利用率的重要手段之一。而對(duì)城市道路交通進(jìn)行精確控制的核心問題之一是對(duì)各交通樞紐進(jìn)行交通流預(yù)測。這里提出的交通流是一般指交通工具流量,交通流的數(shù)據(jù)特性是千變?nèi)f化的,交通流狀態(tài)很難用確切的數(shù)字來說明,例如交通工具、目的地、駕駛員的駕駛特點(diǎn)、規(guī)劃的路線等都是不盡相同的,它具有較強(qiáng)的不確定性,而整個(gè)交通流又會(huì)隨著時(shí)間段、交通環(huán)境、道路運(yùn)行狀態(tài)的變化而改變。但道路系統(tǒng)的運(yùn)行從大量的觀測數(shù)據(jù)來看,它還是遵循一定規(guī)律的,例如較為明顯的早高峰、晚高峰,早進(jìn)城、晚出城等。本文分析了交通數(shù)據(jù)流的特性,并對(duì)其預(yù)處理方法進(jìn)行了研究。
1 交通流基本特征
獲得交通流的方法和手段很多,最常用的是全自動(dòng)交通流量觀測儀,按照監(jiān)測類型可以分為接觸式和非接觸式,接觸式一般有地感線圈和壓電流量儀,非接觸式有超聲波式、微波式、視頻式以及超聲波-微波復(fù)合式流量儀。通過安裝在不同交通位置的裝置,采集各交通斷面的交通數(shù)據(jù)流,再進(jìn)行數(shù)據(jù)分析和處理,可以預(yù)測未來一定時(shí)間段的交通流量變化情況,從而對(duì)道路交通進(jìn)行精確的疏導(dǎo)和控制。目前,多數(shù)文章都是針對(duì)單個(gè)交通斷面進(jìn)行預(yù)測研究,缺少對(duì)多斷面的交通流數(shù)據(jù)研究。但是整個(gè)城市的交通網(wǎng)絕不是孤立的,它在時(shí)間和空間上都有相關(guān)性,因此需要進(jìn)一步的探討和研究道路網(wǎng)的多斷面交通數(shù)據(jù)流處理及預(yù)測。多斷面交通數(shù)據(jù)流預(yù)測以單個(gè)斷面的交通流預(yù)測為基礎(chǔ),利用交通流的實(shí)時(shí)數(shù)據(jù),結(jié)合道路交通網(wǎng)的一系列特性,例如是否主干道、周邊社會(huì)資源分布、公共交通資源分布、紅綠燈分布等多項(xiàng)因子,著眼于道路交通網(wǎng)多斷面交通流狀態(tài),以及道路網(wǎng)中多斷面交通流狀態(tài)的時(shí)空相關(guān)性,來實(shí)現(xiàn)道路網(wǎng)中多個(gè)斷面的同時(shí)預(yù)測。這種對(duì)交通流的多斷面預(yù)測更加符合實(shí)際,是今后研究的重要方向。要實(shí)現(xiàn)交通流的多斷面預(yù)測,首先應(yīng)解決以下問題。
1.1 交通流數(shù)據(jù)的準(zhǔn)確性
前文已經(jīng)提到,目前有多種方法可以實(shí)時(shí)采集交通流數(shù)據(jù),無論是接觸式還是非接觸式、是視頻流量數(shù)據(jù)還是超聲探測數(shù)據(jù),這些都為今后的智能交通以及交通流量精確控制提供了有力的保障。但是電子儀器的誤差總是存在的,可能會(huì)發(fā)生軟件故障、硬件故障、通信干擾、環(huán)境噪聲、數(shù)據(jù)模糊等情況,得到的實(shí)時(shí)數(shù)據(jù)并不能保證都是真實(shí)、可靠、有效的。甚至道路突發(fā)的車輛故障、交通肇事都會(huì)對(duì)數(shù)據(jù)造成巨大影響。這些包含丟失數(shù)據(jù)、錯(cuò)誤數(shù)據(jù)、突變數(shù)據(jù)的交通數(shù)據(jù)流,必須加以識(shí)別和預(yù)處理,否則就會(huì)直接影響下一步研究的準(zhǔn)確性。因此,在進(jìn)行交通流數(shù)據(jù)分析之前,應(yīng)采取平滑過濾、奇點(diǎn)剔除、插值補(bǔ)漏等數(shù)據(jù)預(yù)處理方法對(duì)實(shí)時(shí)采集的交通數(shù)據(jù)進(jìn)行預(yù)處理,確保數(shù)據(jù)的真實(shí)可靠有效。
1.2 多個(gè)斷面交通流數(shù)據(jù)之間的相關(guān)性
城市交通網(wǎng)是一個(gè)龐大的系統(tǒng),在同一個(gè)交通網(wǎng)中又存在著多個(gè)斷面,這些斷面之間的交通流數(shù)據(jù)看似毫無關(guān)系,其后卻存在密不可分的聯(lián)系,例如無分叉路口的主干線相鄰兩個(gè)紅綠燈斷面之間是有絕對(duì)聯(lián)系的,而相鄰兩個(gè)十字路口的八個(gè)斷面之間也存在或強(qiáng)或弱的關(guān)聯(lián)性,它們之間的關(guān)聯(lián)性受時(shí)間、各交通斷面的資源分布等影響。當(dāng)對(duì)某一個(gè)交通斷面進(jìn)行預(yù)測時(shí),不可能對(duì)所有關(guān)聯(lián)斷面都進(jìn)行預(yù)測,這種計(jì)算量和工作量會(huì)十分龐大,因此有必要對(duì)各個(gè)斷面的相關(guān)性進(jìn)行分析,找出對(duì)要預(yù)測的交通斷面影響最大的一個(gè)或者幾個(gè)交通斷面進(jìn)行計(jì)算預(yù)測。采取這種強(qiáng)相關(guān)性預(yù)測方法,能在滿足預(yù)測精度的前提下減小預(yù)測工作量,對(duì)于實(shí)際應(yīng)用具有重要意義。因此,在對(duì)交通流進(jìn)行預(yù)測之前應(yīng)當(dāng)采取關(guān)聯(lián)分析的方法,對(duì)輸入端的數(shù)據(jù)進(jìn)行分析處理,以提高預(yù)測的精度。
2 交通流故障數(shù)據(jù)的識(shí)別
交通流預(yù)測的過程中,交通流數(shù)據(jù)的準(zhǔn)確性對(duì)預(yù)測的結(jié)果的精準(zhǔn)性起著不可忽視的作用。交通流數(shù)據(jù)因?yàn)槭莿?dòng)態(tài)的,在采集過程中往往會(huì)由于采集設(shè)備的軟硬件故障、環(huán)境噪聲、數(shù)據(jù)模糊以及數(shù)據(jù)傳輸過程中系統(tǒng)故障而引起數(shù)據(jù)異常。為了所建立的模型的精度更為精確,就需要更有效地分析交通數(shù)據(jù)的規(guī)律。因此在數(shù)據(jù)分析和使用之前應(yīng)該對(duì)其進(jìn)行異常點(diǎn)剔除、平滑濾波、線性插值等方法進(jìn)行相關(guān)的預(yù)處理。通過對(duì)大量的交通流數(shù)據(jù)進(jìn)行分析,可知數(shù)據(jù)的異常通常是由兩個(gè)方面引起,一是傳感器前端故障,二是通信過程干擾。引起的后果也是兩種,一是數(shù)據(jù)錯(cuò)誤即非真實(shí)值,二是數(shù)據(jù)丟包。
2.1 錯(cuò)誤數(shù)據(jù)預(yù)處理
因自動(dòng)交通流量觀測儀的軟件故障、硬件故障、環(huán)境噪聲、數(shù)據(jù)模糊等引起的錯(cuò)誤數(shù)據(jù)是不可以直接用來使用的。需要將采集到的錯(cuò)誤數(shù)據(jù)進(jìn)行預(yù)處理。處理方法大概分為以下兩種:一種是將錯(cuò)誤的數(shù)據(jù)剔除。這種情況僅在錯(cuò)誤數(shù)據(jù)相對(duì)很少的情況下可以采用,剔除個(gè)別錯(cuò)誤數(shù)據(jù)不會(huì)影響數(shù)據(jù)的完整性和趨勢性,但如果錯(cuò)誤數(shù)據(jù)所占比例較大,就不能采取剔除法,因?yàn)檫^多剔除錯(cuò)誤數(shù)據(jù)會(huì)破壞數(shù)據(jù)的完整性和其趨勢性。第二種就是對(duì)數(shù)據(jù)進(jìn)行修復(fù)。方法是首先剔除明顯異常的錯(cuò)誤數(shù)據(jù),然后采用平滑濾波、插值法將剔除掉的數(shù)據(jù)補(bǔ)上,使整個(gè)數(shù)據(jù)的完整性和趨勢線不受影響。
2.2 丟失數(shù)據(jù)預(yù)處理
引起數(shù)據(jù)丟失的原因也是兩個(gè),一是因?yàn)檐浻布蛩卦跈z測端就沒有檢測到數(shù)據(jù),二是在數(shù)據(jù)通信時(shí)產(chǎn)生了丟包現(xiàn)象。在實(shí)際使用中,會(huì)因?yàn)檐囕v過度的密集而引起交通流檢測儀器數(shù)據(jù)采集不準(zhǔn)確,數(shù)據(jù)在傳輸中出現(xiàn)故障等等諸多原因而導(dǎo)致采集到的數(shù)據(jù)會(huì)出現(xiàn)空白,如出現(xiàn)某個(gè)時(shí)間點(diǎn)、一段時(shí)間或者幾段時(shí)間內(nèi)的數(shù)據(jù)丟失。這種情況就需要對(duì)丟失的數(shù)據(jù)進(jìn)行相關(guān)與處理。針對(duì)影響因素特征序列的單位及數(shù)量級(jí)不統(tǒng)一的實(shí)際情況,用初值化算子對(duì)其進(jìn)行無量綱化處理,然后利用插值、平滑等算法對(duì)數(shù)據(jù)進(jìn)行修復(fù)。
3 交通流數(shù)據(jù)的處理步驟
STEP1:提取一個(gè)特定路口的多個(gè)斷面每天的數(shù)據(jù)。
STEP2:對(duì)于錯(cuò)誤的數(shù)據(jù)進(jìn)行剔除跟修復(fù)。當(dāng)數(shù)據(jù)采集到的數(shù)據(jù)為0或者遠(yuǎn)遠(yuǎn)超過平均值的時(shí)候。假設(shè)當(dāng)數(shù)據(jù)采集的時(shí)間間隔為5min,根據(jù)先驗(yàn)值,流量限制的最大的合理流量在200臺(tái)/5min。按照高峰期與非高峰期之分,可以設(shè)定為一個(gè)是數(shù)據(jù)采集點(diǎn)一天采集到的數(shù)據(jù)若在[700-720]之間,則保留數(shù)據(jù)。否則就作為錯(cuò)誤數(shù)據(jù),將全天的數(shù)據(jù)全部剔除。然后利用平滑法、插值法,對(duì)于保留下來的數(shù)據(jù)樣本進(jìn)行處理,將缺失的數(shù)據(jù)進(jìn)行補(bǔ)齊。
STEP3:數(shù)據(jù)關(guān)聯(lián)性分析及整合。首先進(jìn)行數(shù)據(jù)關(guān)聯(lián)性分析,對(duì)于不重要的可有可無的數(shù)據(jù)可以忽略不計(jì),對(duì)于有重大關(guān)聯(lián)的數(shù)據(jù)進(jìn)行保留。另外在數(shù)據(jù)處理過程中,可能會(huì)出現(xiàn)幾個(gè)車道的數(shù)據(jù)進(jìn)行合并的情況。
4 多斷面交通流數(shù)據(jù)的相關(guān)性分析
短時(shí)交通流數(shù)據(jù)進(jìn)行預(yù)測,就是指在具有不確定性與隨機(jī)性變化的交通流中,根據(jù)檢測到的數(shù)據(jù),對(duì)數(shù)據(jù)的剔除跟修復(fù)后,找出來規(guī)律來建立模型。用來預(yù)測未來的交通流變化。其要求實(shí)時(shí)性,又要求精準(zhǔn)度。然而,只是考慮一個(gè)斷面的交通流數(shù)據(jù),又不能充分的體現(xiàn)這一路口的實(shí)際交通流情況,結(jié)果是片面的,不符合實(shí)際的,所以就需要考慮多個(gè)斷面的數(shù)據(jù)。多個(gè)斷面的數(shù)據(jù)看似毫無關(guān)系,其實(shí)內(nèi)在是有個(gè)密不可分的聯(lián)系的,因此,我們可以運(yùn)用數(shù)據(jù)關(guān)聯(lián)度分析:主要是針對(duì)交通系統(tǒng)影響因素過多的現(xiàn)狀,利用灰色關(guān)聯(lián)分析,將影響因素按照灰色關(guān)聯(lián)度大小進(jìn)行排序;按照灰色關(guān)聯(lián)度從大到小的順序,分別取1,2……n個(gè)影響因素序列,根據(jù)預(yù)測的需要,選取適合的影響因素序列的個(gè)數(shù)。以達(dá)到預(yù)測的目的。
5 結(jié)束語
交通流數(shù)據(jù)是智能道路交通系統(tǒng)中進(jìn)行道路交通流量情況預(yù)測的核心因素。因?yàn)閿?shù)據(jù)本身具有的實(shí)時(shí)性,不確定性以及數(shù)據(jù)錯(cuò)誤及缺失。在預(yù)測之前就必須對(duì)數(shù)據(jù)進(jìn)行分析及預(yù)處理。本文從交通流數(shù)據(jù)的特性出發(fā),分析了錯(cuò)誤數(shù)據(jù)識(shí)別與處理的方法。最后給出了多組數(shù)據(jù)相關(guān)性的分析。為交通流數(shù)據(jù)處理提供了思路。
參考文獻(xiàn):
[1]賀國光,李宇,馬壽峰.基于數(shù)學(xué)模型的短時(shí)交通流預(yù)測方法探討[J].系統(tǒng)工程理論與實(shí)踐,2000,20(12):51-56.
[2]宗春光,宋靖雁,任江濤,等.基于相空間重構(gòu)的短時(shí)交通流預(yù)測研究[J].公路交通科技,2003,20(14):71-75.
[3]徐啟華,丁兆奎.交通流量的遞歸神經(jīng)網(wǎng)絡(luò)實(shí)時(shí)預(yù)測模型研究[J].公路交通科技,2004,21(10):99-101.
[4]田晶,楊玉珍,陳陽舟.短時(shí)交通流量兩種預(yù)測方法的研究[J].公路交通科技,2006,23(14):103-106.
[5]邵春福,熊志華,姚智勝.道路網(wǎng)短時(shí)交通需求預(yù)測理論、方法及應(yīng)用[M].北京:清華大學(xué)出版社,2011.
[6]馬國旗.城市道路交通流特征參數(shù)研究[D].北京:北京工業(yè)大學(xué),2004.
[7]楊兆升.城市交通流誘導(dǎo)系統(tǒng)理論與模型[M].北京:人民交通出版社,2000.